Zur Kurzanzeige

6D-Posenbestimmung und 3D-Objektrekonstruktion mittels der 2D-Form von Bildsegmenten

dc.contributor.advisorWörgötter, Florentin Prof. Dr.
dc.contributor.authorWolnitza, Marcell Michael
dc.date.accessioned2022-04-14T11:09:28Z
dc.date.available2022-04-21T00:50:28Z
dc.date.issued2022-04-14
dc.identifier.urihttp://resolver.sub.uni-goettingen.de/purl?ediss-11858/13989
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-9169
dc.language.isodeude
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subject.ddc510de
dc.title6D-Posenbestimmung und 3D-Objektrekonstruktion mittels der 2D-Form von Bildsegmentende
dc.typedoctoralThesisde
dc.title.translated6D pose estimation and 3D object reconstruction using the 2D shape of image segmentsde
dc.contributor.refereeWörgötter, Florentin Prof. Dr.
dc.date.examination2022-03-11de
dc.description.abstractgerIn dieser Arbeit wird ein templatebasiertes Verfahren zur Berechnung der 6D-Pose von Objekten in einer Szene und anschließender 3D-Rekonstruktion präsentiert. Diese Informationen sind wichtig für Anwendungen, bei denen Objekte computergesteuert manipuliert werden, z.B. im Bereich der Robotik. Sie tragen zur Tiefenwahrnehmung des Robotersystems bei, auf deren Basis gewünschte Aktionen, wie das Greifen von Gegenständen, geplant werden können. Dabei wird das vorhandene Wissen über die Gestalt der Objekte in Form eines 3D-Modells explizit ausgenutzt, um Silhouetten von Bildern aus verschiedenen Kameraperspektiven zu erzeugen und alle benötigten Parameter direkt aus diesen zu extrahieren. Ein Deep-Learning-Verfahren wird trainiert und verwendet, um die Objekte aus den Bildern der Szene zu segmentieren. Das Ziel dieser Arbeit ist die Kombination klassischer Methoden zur Berechnung der Parameter für die 6D-Pose mit punktueller Verwendung von Deep Learning zur Unterstützung des Verfahrens bei der Segmentierung als wichtiger Ausgangspunkt. Die Verwendung expliziten Objektwissens reduziert die Anzahl freier Parameter der 6D-Pose während des Matchings, sodass deren Berechnung vereinfacht wird. Die Vorteile sind dabei eine Verringerung der Rechenzeit und eine Verbesserung der Anpassung des Verfahrens an individuelle Experimente unter Verwendung gewöhnlicher Kameras. Moderne End-to-End-Verfahren im Bereich von Deep Learning zeigen zwar regelmäßig bessere Ergebnisse hinsichtlich der Genauigkeit bei Rechenzeiten in Echtzeit im Vergleich zu den meisten klassischen Verfahren. Diese gelten allerdings meist nur für spezifische Datensätze und erfordern eine aufwendige Erzeugung eigener Daten zur Anpassung an eigene Experimente. Die Performance des entwickelten Verfahrens wird in Simulationen mit synthetischen Daten aufgezeigt und der Einsatz in einem Proof-of-Concept für reale Roboterexperimente beschrieben.de
dc.description.abstractengThis thesis presents a template-based method for the calculation of the 6D pose with a following 3D reconstruction of objects in a scene. In applications for computer-aided manipulations, e.g., in the field of robotics, these information contribute to the perception of depth. This makes further planning of desired actions such as robot-grasping possible. Knowledge about the object shape is used as a primary key. Templates are saved as images of the object, which are rendered from different perspectives around the specific 3D model. This enables direct calculation of the pose parameters. A deep-learning method is trained and used for object segmentation to obtain 2D shapes from images taken of the scene. The aim of this work is to combine classic approaches for the calculation of pose parameters with deep learning to obtain 2D shapes. The number of free parameters during the registration process for the 6D object pose is reduced by calculating some of them directly from the 2D images. Thus the computations can be faster and the method can be adapted to new experiments more easily using only standard RGB cameras. Modern end-to-end approaches utilizing deep learning often show superior performance regarding precision and computing time in comparison to classic approaches. However, this is usually only true for specific datasets, which they were trained on. Adapting these methods to individual experiments is usually difficult. The performance of the method is evaluated using synthetic data. In robotic experiments, the method was used to obtain 6D pose in a real-world scenario and to perform robotic grasping as proof-of-concept.de
dc.contributor.coRefereeDellen, Babette Prof. Dr.
dc.contributor.thirdRefereeKurth, Winfried Prof. Dr.
dc.contributor.thirdRefereeBaum, Marcus Prof. Dr.
dc.contributor.thirdRefereeEcker, Alexander Prof. Dr.
dc.contributor.thirdRefereeDamm, Carsten Prof. Dr.
dc.subject.ger6D-Posenbestimmungde
dc.subject.ger3D-Objektrekonstruktionde
dc.subject.gerComputer Visionde
dc.subject.gerMaschinelles Lernende
dc.subject.eng6D posede
dc.subject.eng3D object reconstructionde
dc.subject.engComputer Visionde
dc.subject.engMachine Learningde
dc.identifier.urnurn:nbn:de:gbv:7-ediss-13989-4
dc.affiliation.instituteFakultät für Mathematik und Informatikde
dc.subject.gokfullInformatik (PPN619939052)de
dc.description.embargoed2022-04-21de
dc.identifier.ppn1799695727


Dateien

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige