Zur Kurzanzeige

Modelling closed-loop receptive fields: On the formation and utility of receptive fields in closed-loop behavioural systems

dc.contributor.advisorWörgötter, Florentin Prof. Dr.de
dc.contributor.authorKulvicius, Tomasde
dc.date.accessioned2010-05-28T12:11:14Zde
dc.date.accessioned2013-01-18T13:36:30Zde
dc.date.available2013-01-30T23:51:09Zde
dc.date.issued2010-05-28de
dc.identifier.urihttp://hdl.handle.net/11858/00-1735-0000-0006-B68A-Fde
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-2791
dc.description.abstractBei höher entwickelten Tieren nimmt die Komplexität der visuellen rezeptiven Felder mit dem hierarchischen Aufbau von den visuellen Eingangsarealen zu den höheren Hirnarealen in dem Maße zu, dass visuelle Reize in den höheren Hirnarealen einen indirekteren Einfluss als in den Eingangsarealen ausüben. Von diesen Arealen aus gibt das System diese Aktivität dann wieder über weitere Stufen an die Endeffektoren (Muskeln) weiter. Neuere Erkenntnisse zeigen jedoch, dass bei einfacheren Tieren, beispielsweise Fliegen, ein Motorneuron über ein visuelles rezeptives Feld verfügen kann (Krapp und Huston, 2005) und das Motorneuron dadurch entsprechende sensorische Merkmale aufweisen kann. Solche rezeptiven Felder beeinflussen das Verhalten in direkter Weise, indem diese Neuronen ohne Zwischenschritte direkt die Wahrnehmungs-Handlungs-Schleife schließen und Feedback über die Umwelt wieder an die Sensoren geben. Im ersten Teil dieser Doktorarbeit werden wir aufzeigen, dass es möglich ist, solche direkt gekoppelten Sensor-Motor-Felder in einfachen Verhaltenssystemen mit Hilfe eines auf Korrelationen basiertem Temporal-Sequence-Learning-Algorithmus zu entwickeln. Das Hauptziel besteht darin aufzuzeigen, dass Lernen stabiles Verhalten generiert und dass die erzeugten rezeptiven Felder sich ebenfalls stabilisieren, wenn das neuerlernte Verhalten erfolgreich ist. Die Entwicklung von stabilen neuronalen Eigenschaften als auch von stabilem Verhalten ist schwierig, da die Konvergenz von funktionalen Neuronen­eigenschaften und vom Verhalten gleichzeitig sichergestellt werden muss. Diese Arbeit stellt einen ersten Versuch dar, dieses Problem mit Hilfe eines einfachen Robotorsystems zu lösen. Dieser Teil der Arbeit wird mit der Frage geschlossen, wie eine indirekte Sensor-Motor-Kopplung, wie sie bei höher entwickelten Tieren vorkommt, aufgebaut werden kann. Durch die Nutzung von einfachen hintereinander­geschalteten Lernstrukturen werden wir aufzeigen, dass damit ähnliche Ergebnisse erzielt werden können; selbst für die sekundären rezeptiven Felder, die indirekte visuelle Reize erhalten. Im zweiten Teil dieser Doktorarbeit werden wir verschiedene Agenten quantitativ analysieren, die sich mit dem im ersten Teil vorgestelltem Temporal-Sequence-Learning-Algorithmus an die Umwelt anpassen. Hierbei werden wir versuchen folgende Frage zu beantworten: Wie können wir vorhersagen, welcher der gegebenen Agenten sich am besten für ein bestimmtes Szenario (Umwelt) eignet? Direkt gekoppelte Umwelt-Agent-Systeme in ihrem Verhalten zu verstehen, stellt kein triviales Problem dar, vor allem wenn sich diese Systeme im Lernprozess verändern. Geschlossene Regelschleifen, wie das Umwelt-Agent-System, wurden in der Informationstheorie bereits in den 50er Jahren beschrieben, dennoch gab es nur wenige Versuche Lernen mitzuberücksichtigen, wobei meist der Informationsgehalt der Eingangsgrößen gemessen wurde. Zur Beantwortung der oben genannten Frage werden wir mit Hilfe von Energie- und Entropiemessungen simulierte Agenten untersuchen und deren Entwicklung im Lernprozess beobachten. So kann nachgewiesen werden, dass es in genau definierten Szenarien lernende Agenten gibt, die in Bezug auf ihren Aufbau und ihr Anpassungsvermögen optimale Eigenschaften aufweisen. Darüber hinaus werden wir aufzeigen, dass es im Rahmen von vergleichsweise einfachen Fällen analytische Lösungsmöglichkeiten für die zeitliche Entwicklung solcher Agenten gibt. In den ersten beiden Teilen der Arbeit werden Agenten mit unimodalem sensorischen Eingang analysiert (visuell oder somatosensorisch). Im dritten und letzten Teil dieser Arbeit wird untersucht, inwieweit der Einsatz von multimodalen Sensoren die Entwicklung der rezeptiven Felder und des Verhaltens beeinflusst. Dieser Ansatz geht auf Experimente mit Nagetieren zurück, in denen nachgewiesen werden konnte, dass, obwohl visuelle Reize für die Entstehung von hippocampischen Ortszellen ( place cells ) und der räumlichen Orientierung eine wichtige Rolle spielen, Ratten sich auch auf olfaktorische, auditive und somatosensorische Reize sowie solche aus ihrer Eigenbewegung stützen können. In dieser Doktorarbeit wird erstmalig ein Modell einer Ortszelle vorgestellt, in dem visuelle und olfaktorische Reize zur Herausbildung eines Ortsfeldes kombiniert werden. Dies wird durch ein einfaches Feed-Forward-Netzwerk und einem Winner-Takes-All-Lernmechanismus realisiert. Eine Orientierungsaufgabe wird mit Hilfe der vorgestellten Orientierungsmechanismen, basierend auf geruchliche Eigenmarkierungen, die mit einem Q-Lernalgorithmus kombiniert werden, gelöst. Wir zeigen, dass olfaktorische Reize eine wichtige Rolle bei der Bildung von Ortsfeldern darstellen und weisen nach, dass eine Kombination von visuellen und olfaktorischen Reizen, die mit einer gemischten Orientierungsstrategie einhergeht, zu einer Verbesserung der zielgerichteten Orientierung führt.de
dc.format.mimetypeapplication/pdfde
dc.language.isoengde
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/de
dc.titleModelling closed-loop receptive fields: On the formation and utility of receptive fields in closed-loop behavioural systemsde
dc.typedoctoralThesisde
dc.title.translatedEntwicklung rezeptiver Felder in autonom handelnden, rückgekoppelten Systemende
dc.contributor.refereeWörgötter, Florentin Prof. Dr.de
dc.date.examination2010-04-20de
dc.subject.dnb500 Naturwissenschaften allgemeinde
dc.description.abstractengIn higher animals an increasingly complex hierarchy of visual receptive fields exists from early to higher visual areas, where visual input becomes more and more indirect. From there on the system propagates its activity again via many stages to the end-effectors (muscles). On the other hand, recently it has been pointed out that in simple animals like flies a motor neuron can have a visual receptive field (Krapp und Huston, 2005), hence a motor neuron can have a sensor property. Such receptive fields directly generate behaviour. Thus, these neurons close - without intermediate stages - directly the perception-action loop and create feedback to the sensors again. In the first part of this thesis we will show that it is possible to develop such directly coupled sensor-motor receptive fields in simple behavioural systems by ways of a correlation based temporal sequence learning algorithm. The main goal is to demonstrate that learning generates stable behaviour and that the resulting receptive fields are also stable as soon as the newly learned behaviour is successful. The development of both, stable neuronal properties and stable behaviour, represents a difficult problem because convergence of functional neuronal properties and of behaviour has to be guaranteed at the same time. This work is a first attempt towards a solution of this problem shown by a simple robot system. This part of the thesis is concluded by starting to address the question how indirect sensor-motor coupling, like in higher animals, can be established. By implementing simple chained learning architectures, we will demonstrate that similar results can also be obtained, even for secondary receptive fields, which receive indirect visual input. In the second part of this thesis we will quantitatively analyse closed-loop learning systems which perform temporal sequence learning as presented in the first part. Here we try to answer the following question: How can we predict which system from a given class would be the best for a particular scenario? Understanding closed-loop behavioural systems is a non-trivial problem, especially when they change during learning. Descriptions of closed loop systems in terms of information theory date back to the 50s, however, there have been only a few attempts which take into account learning, mostly measuring information of inputs. To address the question stated above, we will investigate simulated agents by using energy and entropy measures and looking at their development during learning. This way we can show that within well specified scenarios there are indeed learning agents which are optimal with respect to their structure and adaptive properties. We will also show that analytical solutions can be found for the temporal development of such agents for relatively simple cases. In first two parts we analyse systems which use uni-modal sensory input (visual or somatosensory). In the third and the last part of this thesis we will investigate how multi-modal sensor integration influences development of the receptive fields and behavioural performance. This is motivated by experiments with rodents which demonstrate that although visual cues play an important role in the formation of hippocampal place cells and spatial navigation, rats also can rely on olfactory, auditory, somatosensory and self-motion cues. Here, for the first time we present a place cell model where we combine visual with olfactory cues in order to form place fields. This is realised by using a simple feed-forward network and a winner-takes-all learning mechanism. We solve a goal navigation task by using proposed navigation mechanism based on self-marking by odour patches combined with a Q-learning algorithm. We show that olfactory cues play an important role in the formation of the place fields and demonstrate that a combination of visual and olfactory cues together with a mixed navigation strategy improves goal directed navigation.de
dc.contributor.coRefereePorr, Bernd Dr.de
dc.subject.topicMathematics and Computer Sciencede
dc.subject.gerComputational Neurosciencede
dc.subject.gerRückgekoppelte Systemede
dc.subject.gerWahrnehmungs-Handlungs-Schleifede
dc.subject.gerVisuelle Rezeptive Felderde
dc.subject.gerTemporal-Sequence-Learning-Algorithmusde
dc.subject.gerAutonom Fahrender Roboterde
dc.subject.gerEntropiede
dc.subject.gerEnergiede
dc.subject.gerEingang/Ausgangs-Verhältnisde
dc.subject.gerOptimale Agentende
dc.subject.gerOrtsfelderde
dc.subject.gerQ-Lernalgorithmusde
dc.subject.gerEigenmarkierungde
dc.subject.gerZielgerichtete Orientierungde
dc.subject.engComputational Neurosciencede
dc.subject.engClosed-Loop Learning Systemsde
dc.subject.engSensorimotor Loopde
dc.subject.engVisual Receptive Fieldsde
dc.subject.engTemporal Sequence Learningde
dc.subject.engDriving Robotde
dc.subject.engEntropyde
dc.subject.engInput/Output Ratiode
dc.subject.engEnergyde
dc.subject.engOptimal Agentsde
dc.subject.engPlace Fieldsde
dc.subject.engPlace Field Remappingde
dc.subject.engQ-learningde
dc.subject.engSelf-markingde
dc.subject.engGoal Directed Navigationde
dc.subject.bk30.03de
dc.identifier.urnurn:nbn:de:gbv:7-webdoc-2478-0de
dc.identifier.purlwebdoc-2478de
dc.affiliation.instituteFakultät für Physikde
dc.subject.gokfullRA 000: Allgemeine Naturwissenschaftende
dc.subject.gokfullRBS 400: Mathematische Methoden in den Naturwissenschaftende
dc.identifier.ppn632108568de


Dateien

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige