Zur Kurzanzeige

Analyse von Translationsstarts in prokaryotischen Genomen mit Methoden des Maschinellen Lernens

dc.contributor.advisorMeinicke, Peter Dr.de
dc.contributor.authorTech, Maikede
dc.date.accessioned2012-04-16T14:51:01Zde
dc.date.available2013-01-30T23:50:28Zde
dc.date.issued2007-12-11de
dc.identifier.urihttp://hdl.handle.net/11858/00-1735-0000-0006-ACEA-8de
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-249
dc.description.abstractDie exakte Annotation von Translationsstarts in prokaryotischen Genomen mit automatischen Systemen ist noch immer problematisch. Im Folgenden werden zwei Verfahren aus dem Bereich des Maschinellen Lernens zur Verbesserung der Annotation prokaryotischer Genome, vorgestellt: Der Oligo-Kern-Algorithmus, ein überwachtes Verfahren zur Analyse von Signalen in biologischen Sequenzen und TICO (Translation Initiation site COrrection), ein Programm zur (Re-)Annotation von Translationsstarts mit einem unüberwachten Lernverfahren.Es wird gezeigt, dass der Oligo-Kern-Algorithmus für die Analyse und Identifikation biologischer Signale gut geeignet ist. In einer Fallstudie zu Translationsstarts des Eubakteriums Escherichia coli K-12 wird belegt, dass der Oligo-Klassifikator eine hohe Performanz bei der Vorhersage auf experimentell verifizierten Daten aufweist. Eine Visualisierung der diskriminativen Merkmale ermöglicht eine biologisch sinnvolle Interpretation. Für E. coli K-12 werden bekannte Signale zur Initiation der Translation eindeutig und korrekt mit der ihnen innewohnenden Variabilität detektiert. Der Algorithmus ist flexibel hinsichtlich der Länge der betrachteten Oligomere und des Grades an Positionsinformation, so dass er auf die Analyse anderer biologischer Sequenzen angepasst werden kann.Das Programm TICO erzielt eine signifikante Verbesserung der Vorhersage von prokaryotischen Translationsstarts im Vergleich zu früheren Ansätzen. Dabei wird eine initiale Annotation, wie sie beispielsweise mit einem klassischen Genvorhersageprogramm erstellt werden kann, nachbearbeitet. Die Verbesserung bei der Nachbearbeitung solcher Annotationen beträgt bis zu 30%. Der Algorithmus ist robust und bietet eine Visualisierungsfunktion, welche eine intuitive Darstellung der diskriminativen Merkmale ermöglicht. Das Programm ist über ein Web-Interface (Webschnittstelle) und als Kommandozeilenprogramm für Linux und Windows implementiert und frei verfügbar.de
dc.format.mimetypeapplication/pdfde
dc.language.isogerde
dc.rights.urihttp://webdoc.sub.gwdg.de/diss/copyr_diss.htmlde
dc.titleAnalyse von Translationsstarts in prokaryotischen Genomen mit Methoden des Maschinellen Lernensde
dc.typedoctoralThesisde
dc.title.translatedAnalysis of translation initiation sites in prokaryotic genomes with machnine learning methodsde
dc.contributor.refereeMorgenstern, Burkhard Prof. Dr.de
dc.date.examination2007-11-02de
dc.subject.dnb570 Biowissenschaften, Biologiede
dc.description.abstractengExact localization of prokaryotic translation initiation sites with automated prediction systems is still not completely solved. In this context, two approaches from the field of machine learning have been developed: The Oligo Kernel algorithm, a supervised learning method for analysis of signaling in biological sequences and TICO (Translation Initiation site COrrection), a tool for (re-)annotation of translation initiation sites with an unsupervised classification scheme.It is shown that the Oligo Kernel algorithm is well suitable for analysis of biological signals. In a case study on translation initiation sites of eubacterium Escherichia coli K-12 the high performance of the Oligo classificator is demonstrated on experimentally verified data. A visualization of the discriminative signals facilitates a biologically meaningful interpretation. For E. coli K-12 commonly known signals for translation initiation and their inherent variability can be clearly identified. Since the algorithm is flexible regarding the degree of positional smoothing it can be adapted to analysis of other biological signals.The program TICO significantly improves prediction of prokaryotic translation initiation sites as compared to previous approaches, by post-processing an initial gene annotation as obtained by a classical gene finder. The improvement of such a reannotation amounts up to 30%. The algorithm provides a visualization method allowing an intuitive presentation of the discriminative features. The program can be accessed through a web interface and is freely available as command line tool for Linux and Windows.de
dc.contributor.coRefereeWaack, Stephan Prof. Dr.de
dc.subject.topicMathematics and Computer Sciencede
dc.subject.gerBioinformatikde
dc.subject.gerMaschinelles Lernende
dc.subject.gerProkaryotende
dc.subject.gerTranslationsstartsde
dc.subject.engbioinformaticsde
dc.subject.engmachine learningde
dc.subject.engprokaryotsde
dc.subject.engtranslation inititiation sitesde
dc.subject.bk42.11 Biomathematikde
dc.subject.bk54.80 Angewandte Informatikde
dc.identifier.urnurn:nbn:de:gbv:7-webdoc-1655-7de
dc.identifier.purlwebdoc-1655de
dc.affiliation.instituteBiologische Fakultät inkl. Psychologiede
dc.subject.gokfullWD 500: Bioinformatik {Biologie}de
dc.subject.gokfullAHI 260: Learning {Computing Methodologies. Artificial Intelligence}de
dc.identifier.ppn587185325de


Dateien

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige