Navigation ▼

Zur Kurzanzeige

dc.contributor.advisor Meinicke, Peter Dr. de
dc.contributor.author Lingner, Thomas de
dc.date.accessioned 2008-10-08T15:27:11Z de
dc.date.accessioned 2013-01-18T13:21:52Z de
dc.date.available 2013-01-30T23:50:54Z de
dc.date.issued 2008-10-08 de
dc.identifier.uri http://hdl.handle.net/11858/00-1735-0000-0006-B3AA-1 de
dc.description.abstract Alignmentbasierte Methoden werden routinemäßig für die funktionale Charakterisierung neuer Proteinsequenzen verwendet. Rechentechnisch sind diese Methoden für große Sequenzmengen jedoch sehr aufwändig. In dieser Arbeit werden zwei neue Methoden zur alignmentfreien Repräsentation und Analyse von Proteinsequenzen vorgestellt. Die Methoden sind in Kombination mit geeigneten Verfahren des maschinellen Lernens zur Detektion entfernter Homologien und zur Proteinklassifikation auf großen Sequenzmengen verwendbar. Die Evaluation der Methoden auf einem weit verbreiteten Testdatensatz zur Detektion entfernter Homologien demonstriert ihre Leistungsfähigkeit sowie die rechentechnische Effizienz und zeigt, wie die Methoden zur biologischen Interpretation gelernter Merkmale genutzt werden können. Weiterhin werden die Methoden auf einem im Rahmen dieser Arbeit erstellten umfassenden Testdatensatz zur Proteinfunktionsvorhersage mit einem angepassten Verfahren des maschinellen Lernens evaluiert. Die Ergebnisse dieses Ansatzes unterstreichen die generelle Eignung der Methoden zur Untersuchung verschiedener Probleme auf dem Gebiet der Proteinsequenzanalyse. de
dc.format.mimetype application/pdf de
dc.language.iso ger de
dc.rights.uri http://creativecommons.org/licenses/by-nd/2.0/de/ de
dc.title Alignmentfreie Analyse von Proteinsequenzen mit Verfahren des maschinellen Lernens de
dc.type doctoralThesis de
dc.title.translated Alignment-free Analysis of Protein Sequences with Machine Learning Techniques de
dc.contributor.referee Morgenstern, Burkhard Prof. Dr. de
dc.date.examination 2008-10-06 de
dc.subject.dnb 004 Informatik de
dc.description.abstracteng Currently, alignment-based methods are routinely used for functional characterization of novel protein sequences. However, these methods are computationally demanding for large sequence sets. In this work, two novel approaches for alignment-free representation and analysis of protein sequences are presented. In combination with state-of-the-art machine learning techniques, the methods are applicable to remote homology detection and large-scale protein classification. The evaluation on a widely-used benchmark data set for remote homology detection demonstrates the performance and computational efficiency of the representation methods. The thesis also shows, how both approaches can be used for biological interpretation of learned features. Furthermore, the methods are evaluated on a purpose-built comprehensive test data set for protein function prediction. For efficient learning and prediction, a particular machine learning technique has been extended to meet the requirements of the setup. The results of this approach show the general applicability of the representation methods to the analysis of different problems in protein sequence analysis. de
dc.contributor.coReferee Waack, Stephan Prof. Dr. de
dc.subject.topic Mathematics and Computer Science de
dc.subject.ger Proteinklassifikation de
dc.subject.ger Proteinsequenzanalyse de
dc.subject.ger alignmentfrei de
dc.subject.ger Proteinsequenzrepräsentation de
dc.subject.ger Zielmengenreduktion de
dc.subject.ger Proteinfunktionsvorhersage de
dc.subject.bk 42.11 de
dc.subject.bk 54.80 de
dc.subject.bk 54.72 de
dc.identifier.urn urn:nbn:de:gbv:7-webdoc-1909-6 de
dc.identifier.purl webdoc-1909 de
dc.affiliation.institute Fakultät für Mathematik und Informatik de
dc.subject.gokfull AHJ 300: Life and Medical Sciences {Computer Applications} de
dc.subject.gokfull EGCP 100: Applications to biology and medical sciences {Statistics: Applications} de
dc.subject.gokfull WD 500: Bioinformatik {Biologie} de
dc.identifier.ppn 606104305 de

Dateien

Das Dokument erscheint in:

Zur Kurzanzeige