Show simple item record

Alignmentfreie Analyse von Proteinsequenzen mit Verfahren des maschinellen Lernens

dc.contributor.advisorMeinicke, Peter Dr.de
dc.contributor.authorLingner, Thomasde
dc.date.accessioned2008-10-08T15:27:11Zde
dc.date.accessioned2013-01-18T13:21:52Zde
dc.date.available2013-01-30T23:50:54Zde
dc.date.issued2008-10-08de
dc.identifier.urihttp://hdl.handle.net/11858/00-1735-0000-0006-B3AA-1de
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-2503
dc.description.abstractAlignmentbasierte Methoden werden routinemäßig für die funktionale Charakterisierung neuer Proteinsequenzen verwendet. Rechentechnisch sind diese Methoden für große Sequenzmengen jedoch sehr aufwändig. In dieser Arbeit werden zwei neue Methoden zur alignmentfreien Repräsentation und Analyse von Proteinsequenzen vorgestellt. Die Methoden sind in Kombination mit geeigneten Verfahren des maschinellen Lernens zur Detektion entfernter Homologien und zur Proteinklassifikation auf großen Sequenzmengen verwendbar. Die Evaluation der Methoden auf einem weit verbreiteten Testdatensatz zur Detektion entfernter Homologien demonstriert ihre Leistungsfähigkeit sowie die rechentechnische Effizienz und zeigt, wie die Methoden zur biologischen Interpretation gelernter Merkmale genutzt werden können. Weiterhin werden die Methoden auf einem im Rahmen dieser Arbeit erstellten umfassenden Testdatensatz zur Proteinfunktionsvorhersage mit einem angepassten Verfahren des maschinellen Lernens evaluiert. Die Ergebnisse dieses Ansatzes unterstreichen die generelle Eignung der Methoden zur Untersuchung verschiedener Probleme auf dem Gebiet der Proteinsequenzanalyse.de
dc.format.mimetypeapplication/pdfde
dc.language.isogerde
dc.rights.urihttp://creativecommons.org/licenses/by-nd/2.0/de/de
dc.titleAlignmentfreie Analyse von Proteinsequenzen mit Verfahren des maschinellen Lernensde
dc.typedoctoralThesisde
dc.title.translatedAlignment-free Analysis of Protein Sequences with Machine Learning Techniquesde
dc.contributor.refereeMorgenstern, Burkhard Prof. Dr.de
dc.date.examination2008-10-06de
dc.subject.dnb004 Informatikde
dc.description.abstractengCurrently, alignment-based methods are routinely used for functional characterization of novel protein sequences. However, these methods are computationally demanding for large sequence sets. In this work, two novel approaches for alignment-free representation and analysis of protein sequences are presented. In combination with state-of-the-art machine learning techniques, the methods are applicable to remote homology detection and large-scale protein classification. The evaluation on a widely-used benchmark data set for remote homology detection demonstrates the performance and computational efficiency of the representation methods. The thesis also shows, how both approaches can be used for biological interpretation of learned features. Furthermore, the methods are evaluated on a purpose-built comprehensive test data set for protein function prediction. For efficient learning and prediction, a particular machine learning technique has been extended to meet the requirements of the setup. The results of this approach show the general applicability of the representation methods to the analysis of different problems in protein sequence analysis.de
dc.contributor.coRefereeWaack, Stephan Prof. Dr.de
dc.subject.topicMathematics and Computer Sciencede
dc.subject.gerProteinklassifikationde
dc.subject.gerProteinsequenzanalysede
dc.subject.geralignmentfreide
dc.subject.gerProteinsequenzrepräsentationde
dc.subject.gerZielmengenreduktionde
dc.subject.gerProteinfunktionsvorhersagede
dc.subject.bk42.11de
dc.subject.bk54.80de
dc.subject.bk54.72de
dc.identifier.urnurn:nbn:de:gbv:7-webdoc-1909-6de
dc.identifier.purlwebdoc-1909de
dc.affiliation.instituteFakultät für Mathematik und Informatikde
dc.subject.gokfullAHJ 300: Life and Medical Sciences {Computer Applications}de
dc.subject.gokfullEGCP 100: Applications to biology and medical sciences {Statistics: Applications}de
dc.subject.gokfullWD 500: Bioinformatik {Biologie}de
dc.identifier.ppn606104305de


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record