Early Cognitive Vision: Feedback Mechanisms for the Disambiguation of Early Visual Representation
Frühe kognitive Wahrnehmung: Feedback Mechanismen für die Disambiguation von früher visueller Repräsentation
by Nicolas Pugeault
Date of Examination:2008-01-15
Date of issue:2008-04-25
Advisor:Prof. Dr. Florentin Wörgötter
Referee:Prof. Dr. Norbert Krüger
Files in this item
Name:pugeault.pdf
Size:21.9Mb
Format:PDF
Description:Dissertation
Abstract
English
Recent years have seen considerable progress in low level image processing as well as model based, vision applications. Joining the two fields proves to be a difficult problem due to the local ambiguity and noisiness of visual processes, and to requirements of robustness and accuracy of high level processes. In this thesis we present an Early Cognitive Vision framework that aims at providing a rich and reli- able scene representation from visual information. This framework preserves conflicting hypothesis in its early stages, and makes use of feedback mechanisms between different visual processes and layers of representation to achieve disambiguation. In a first part we present how a symbolic local image de- scriptors are extracted from the responses of early vision filters, and how perceptual grouping constraints can be applied on the resulting image representation. A second part discuss the use of stereopsis to reconstruct an equivalent 3D representation of the visual information. Interactions between perceptual grouping, stereopsis and 3D reconstruction processes are discussed. The third part of this thesis integrates visual information across time to further disambiguate the representation. This framework has been used successfully in several contexts, that are discussed in the conclusion of this thesis.
Keywords: computer vision; visual representation; cognitive vision
Other Languages
Die letzten Jahre haben enorme
Fortschritte in low-level Wahrnehmungsprozessen, und
modell-basierenden Wahrnehumgsaplikationen gezeigt. Eine
Verknüpfung beider Bereiche ist jedoch schwierig, aufgrund von
lokalen Ambiguitäten und Verzerrungen visueller Prozesse, sowie der
Voraussetzung von Robustheit und Genauigkeit von high-level
Prozessen. In dieser Dissertation wird ein „Frühes Kognitives
Wahrnehmungssystem“ präsentiert, das eine reichhaltige und genaue
Szenenrepräsentation von visueller Information liefert.In diesem
System werden in der Anfangsphase widersprüchliche Hypothesen
bewahrt und Feedback Mechanismen zwischen verschiedenen visuellen
Prozessen und Repräsentationsschichten verwendet, um eine visuelle
Disambiguation zu erreichen. Im ersten Teil wird beschrieben, wie
symbolische lokale Bild-Deskriptoren aufgrund von frühen
Wahrnehmungsfiltern extrahiert werden können, und wie
Einschränkungen durch perzeptuelle Gruppierungen an die
hervorgehende Wahrnehmungsrepräsentation angewandt werden können.
Im zweiten Teil wird die Anwendung von Stereopsis um eine
äquivalente 3-D Repräsentation von visueller Information zu
rekonstruieren, diskutiert. Interaktionen zwischen perzeptuellem
Gruppieren, Stereopsis und 3-D Repräsentation werden diskutiert. Im
dritten Teil dieser Arbeit wird die Integration visueller
Information über Zeit zur weiteren Disambiguation behandelt. In der
Schlussfolgerung dieser Dissertation wird die erfolgreiche
Anwendung dieses Systems in einigen Bereichen diskutiert.
Schlagwörter: Computer Wahrnehmung; visuelle Repräsentation; kognitive Wahrnehmung