• Deutsch
    • English
  • English 
    • Deutsch
    • English
  • Login
Item View 
  •   Home
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Mathematik und Informatik (inkl. GAUSS)
  • Item View
  •   Home
  • Naturwissenschaften, Mathematik und Informatik
  • Fakultät für Mathematik und Informatik (inkl. GAUSS)
  • Item View
JavaScript is disabled for your browser. Some features of this site may not work without it.

PAC-Lernen zur Insolvenzvorhersage und Hotspot-Identifikation

PAC-Learning for insolvency-prediction and hotspot-identification

by Thomas Brodag
Doctoral thesis
Date of Examination:2008-05-28
Date of issue:2008-07-22
Advisor:Prof. Dr. Stephan Waack
Referee:Prof. Dr. Carsten Damm
Referee:Prof. Dr. Edgar Wingender
Referee:Prof. Dr. Matthias Schumann
crossref-logoPersistent Address: http://dx.doi.org/10.53846/goediss-2504

 

 

Files in this item

Name:brodag.pdf
Size:2.55Mb
Format:PDF
Description:Dissertation
ViewOpen

The following license files are associated with this item:


Abstract

English

Methods of machine learning are a very powerful tool in bioinformatics. Due to their versatility they also proof useful in different fields of application. In case of supervised learning, all approaches have one thing in common: Trying to derive global, generalized features of an underlying distribution by evaluating data (training), in order to perform reliable predictions on unseen data samples. Another model of machine learning is the so called concept-learning (in this case PAC-Learning).In this dissertation a praxis-relevant concept-class as well as required learning algorithms are developed and analysed. PAC-Learning is validated against approved methods in two other fields, such as insolvency-prediction (business economics) and hotspot-identification in protein-protein-interactions (bioinformatics).Insolvency-prediction means, to predict a company s probability to go into administration. There are numerous approaches, but the predictions are not sufficiently reliable. The basis for insolvency-prediction is a set of annual accounts provided by the company Verband der Vereine Creditreform. The results of PAC-Learning in this field are then compared to approved methods (e.g. neural networks, multivariate discriminant analysis, Kendall-method).Hotspot-identification means to characterize hotspots in interfaces of protein-protein-interactions. It is assumed, that few amino acids in interfaces significantly contribute to the stability of protein-complexes. This analysis is based on homo- and heterodimers from PDB-database.Finally, the tool InSolve (http://www.tcs.informatik.uni-goettingen.de/insolve) with integrated GUI (Graphical User Interface) is developed, to allow application of the presented methods.Therefore, this procedure links two different fields together (bioinformatics and business economics) through the applied method (PAC-Learning).
Keywords: PAC-Learning; machine learning; insolvency; hotspot; protein-protein-interaction

Other Languages

Die Methoden des maschinellen Lernens erweisen sich nicht nur in der Bioinformatik als sehr effektiv, sondern auch in anderen Bereichen, vor allem wegen ihrer Universalität. Im Falle des überwachten Lernens haben alle Ansätze eines gemeinsam: Es wird versucht, anhand von Daten bestimmte, generalisierbare Verteilungseigenschaften zu lernen (Training), um somit auch auf ungesehenen Daten zuverlässige Vorhersagen treffen zu können. Ein weiteres Modell im Bereich des maschinellen Lernens ist das Konzept-Lernen (hier PAC-Lernen).In dieser Dissertation wird im Rahmen des PAC-Lernens eine für die Praxis relevante Konzeptklasse und die dafür notwendigen Lernalgorithmen entwickelt und analysiert. Das PAC-Lernen wird in zwei verschiedenen Anwendungsbereichen durch einen Vergleich gegenüber bewährten Verfahren validiert, zum einen in der Betriebswirtschaft, zur Insolvenzvorhersage und zum anderen in der Bioinformatik, zur Erkennung von Hotspots in Protein-Protein-Wechselwirkungen.Bei der Insolvenzvorhersage wird versucht, eine Aussage über eine bevorstehende Insolvenz eines deutschen Unternehmens zu treffen. Es existieren bereits zahlreiche Ansätze zu diesem Thema, jedoch sind die Vorhersagen noch nicht zuverlässig genug. Die Grundlage für die Insolvenzvorhersage bilden in dieser Arbeit Jahresabschlüsse des Verbandes der Vereine Creditreform. Die Ergebnisse des PAC-Lernens werden anschließend mit bewährten Verfahren zur Insolvenzvorhersage (z.B. neuronale Netze, multivariate Diskriminanzanalyse, Kendall-Verfahren) verglichen.Bei der Hotspot-Identifikation in Protein-Protein-Wechselwirkungen wird versucht, Aminosäuren, die in Interfaces (Bindestellen) lokalisiert sind, zu charakterisieren. Es wird davon ausgegangen, dass Hotpots die Bindung zwischen zwei Proteinen, die zu einem größeren Komplex aggregieren, maßgeblich stabilisieren. Als Datenbasis dient eine Auswahl von Homo- und Heterodimeren aus der PDB-Datenbank.Die entwickelten Methoden werden schließlich in das Tool InSolve (http://www.tcs.informatik.uni-goettingen.de/insolve) mit grafischer Oberfläche zur einfachen Anwendung integriert.Durch dieses Vorgehen werden zwei unterschiedliche Anwendungsbereiche (Bioinformatik und Betriebswirtschaft) über dieselbe Methode (PAC-Lernen) miteinander verknüpft.
Schlagwörter: PAC-Lernen; Maschinelles Lernen; Insolvenz; Hotspot; Protein-Protein-Wechselwirkung
 

Statistik

Publish here

Browse

All of eDissFaculties & ProgramsIssue DateAuthorAdvisor & RefereeAdvisorRefereeTitlesTypeThis FacultyIssue DateAuthorAdvisor & RefereeAdvisorRefereeTitlesType

Help & Info

Publishing on eDissPDF GuideTerms of ContractFAQ

Contact Us | Impressum | Cookie Consents | Data Protection Information
eDiss Office - SUB Göttingen (Central Library)
Platz der Göttinger Sieben 1
Mo - Fr 10:00 – 12:00 h


Tel.: +49 (0)551 39-27809 (general inquiries)
Tel.: +49 (0)551 39-28655 (open access/parallel publications)
ediss_AT_sub.uni-goettingen.de
[Please replace "_AT_" with the "@" sign when using our email adresses.]
Göttingen State and University Library | Göttingen University
Medicine Library (Doctoral candidates of medicine only)
Robert-Koch-Str. 40
Mon – Fri 8:00 – 24:00 h
Sat - Sun 8:00 – 22:00 h
Holidays 10:00 – 20:00 h
Tel.: +49 551 39-8395 (general inquiries)
Tel.: +49 (0)551 39-28655 (open access/parallel publications)
bbmed_AT_sub.uni-goettingen.de
[Please replace "_AT_" with the "@" sign when using our email adresses.]