• Deutsch
    • English
  • English 
    • Deutsch
    • English
  • Login
Item View 
  •   Home
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Mathematik und Informatik (inkl. GAUSS)
  • Item View
  •   Home
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Mathematik und Informatik (inkl. GAUSS)
  • Item View
JavaScript is disabled for your browser. Some features of this site may not work without it.

Alignmentfreie Analyse von Proteinsequenzen mit Verfahren des maschinellen Lernens

Alignment-free Analysis of Protein Sequences with Machine Learning Techniques

by Thomas Lingner
Doctoral thesis
Date of Examination:2008-10-06
Date of issue:2008-10-08
Advisor:Dr. Peter Meinicke
Referee:Prof. Dr. Burkhard Morgenstern
Referee:Prof. Dr. Stephan Waack
crossref-logoPersistent Address: http://dx.doi.org/10.53846/goediss-2503

 

 

Files in this item

Name:lingner.pdf
Size:2.48Mb
Format:PDF
Description:Dissertation
ViewOpen

The following license files are associated with this item:


Abstract

English

Currently, alignment-based methods are routinely used for functional characterization of novel protein sequences. However, these methods are computationally demanding for large sequence sets. In this work, two novel approaches for alignment-free representation and analysis of protein sequences are presented. In combination with state-of-the-art machine learning techniques, the methods are applicable to remote homology detection and large-scale protein classification. The evaluation on a widely-used benchmark data set for remote homology detection demonstrates the performance and computational efficiency of the representation methods. The thesis also shows, how both approaches can be used for biological interpretation of learned features. Furthermore, the methods are evaluated on a purpose-built comprehensive test data set for protein function prediction. For efficient learning and prediction, a particular machine learning technique has been extended to meet the requirements of the setup. The results of this approach show the general applicability of the representation methods to the analysis of different problems in protein sequence analysis.

Other Languages

Alignmentbasierte Methoden werden routinemäßig für die funktionale Charakterisierung neuer Proteinsequenzen verwendet. Rechentechnisch sind diese Methoden für große Sequenzmengen jedoch sehr aufwändig. In dieser Arbeit werden zwei neue Methoden zur alignmentfreien Repräsentation und Analyse von Proteinsequenzen vorgestellt. Die Methoden sind in Kombination mit geeigneten Verfahren des maschinellen Lernens zur Detektion entfernter Homologien und zur Proteinklassifikation auf großen Sequenzmengen verwendbar. Die Evaluation der Methoden auf einem weit verbreiteten Testdatensatz zur Detektion entfernter Homologien demonstriert ihre Leistungsfähigkeit sowie die rechentechnische Effizienz und zeigt, wie die Methoden zur biologischen Interpretation gelernter Merkmale genutzt werden können. Weiterhin werden die Methoden auf einem im Rahmen dieser Arbeit erstellten umfassenden Testdatensatz zur Proteinfunktionsvorhersage mit einem angepassten Verfahren des maschinellen Lernens evaluiert. Die Ergebnisse dieses Ansatzes unterstreichen die generelle Eignung der Methoden zur Untersuchung verschiedener Probleme auf dem Gebiet der Proteinsequenzanalyse.
Schlagwörter: Proteinklassifikation; Proteinsequenzanalyse; alignmentfrei; Proteinsequenzrepräsentation; Zielmengenreduktion; Proteinfunktionsvorhersage
 

Statistik

Publish here

Browse

All of eDissFaculties & ProgramsIssue DateAuthorAdvisor & RefereeAdvisorRefereeTitlesTypeThis FacultyIssue DateAuthorAdvisor & RefereeAdvisorRefereeTitlesType

Help & Info

Publishing on eDissPDF GuideTerms of ContractFAQ

Contact Us | Impressum | Cookie Consents | Data Protection Information
eDiss Office - SUB Göttingen (Central Library)
Platz der Göttinger Sieben 1
Mo - Fr 10:00 – 12:00 h


Tel.: +49 (0)551 39-27809 (general inquiries)
Tel.: +49 (0)551 39-28655 (open access/parallel publications)
ediss_AT_sub.uni-goettingen.de
[Please replace "_AT_" with the "@" sign when using our email adresses.]
Göttingen State and University Library | Göttingen University
Medicine Library (Doctoral candidates of medicine only)
Robert-Koch-Str. 40
Mon – Fri 8:00 – 24:00 h
Sat - Sun 8:00 – 22:00 h
Holidays 10:00 – 20:00 h
Tel.: +49 551 39-8395 (general inquiries)
Tel.: +49 (0)551 39-28655 (open access/parallel publications)
bbmed_AT_sub.uni-goettingen.de
[Please replace "_AT_" with the "@" sign when using our email adresses.]