Zur Kurzanzeige

A Biased Urn Model for Taxonomic Identification

dc.contributor.advisorWaack, Stephan Prof. Dr.de
dc.contributor.authorSurovcik, Katharinade
dc.date.accessioned2009-03-24T12:10:31Zde
dc.date.accessioned2013-01-18T13:21:17Zde
dc.date.available2013-01-30T23:51:07Zde
dc.date.issued2009-03-24de
dc.identifier.urihttp://hdl.handle.net/11858/00-1735-0000-0006-B665-1de
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-2492
dc.identifier.urihttp://dx.doi.org/10.53846/goediss-2492
dc.description.abstractWir betrachten ein stochastisches Modell für das Problem taxonomischer Identifikation in bakteriellen Genomen, welches durch die Erkennung horizontalen Gentransfer zwischen entfernt verwandten Species motiviert ist. Wir konzentrieren uns auf die Modellierung der Bevorzugung von Dinukleotiden in prokaryotischen Genomen. Dazu konstruieren wir ein gewichtetes Urnenmodell mit Hilfe der nichtzentrierten hypergeometrischen Verteilung. Es wird gezeigt, dass das Modell, welches sich in vier Schritten aufbaut, wohldefiniert ist. Des weiteren ist es hinreichend allgemein, um beliebige Dinukleotide im Hinblick auf die Position innerhalb des Codons sowie deren Kombinationen zu behandeln. Zur Ergänzung bestehender Codon Usage Ansätze heben wir das Intercodon-Übergangsdinukleotid hervor.Wir zeigen, dass sich die Bevorzugung von Dinukleotiden durch ein 9-Parameter-Tupel, für welches approximative Schätzer verfügbar sind, beschreiben lässt. Zusätzlich zeigen wir, dass eine weitere Parameterreduktion unmöglich ist. Die Leistungsfähigkeit der Detektionsprozedur für horizontalen Gentransfer, die auf diesem Modell basiert, wird an Hand eines Benchmark-Datensatzes evaluiert und kann mit bisherigen Ansätzen konkurrieren. Schließlich wird gezeigt, dass sich die biologischen Verwandtschaftsbeziehungen in der Geometrie des Parameterraumes widerspiegeln, was es uns ermöglicht, das Phylum zum Organismus, aus welchem eine Genomsequenz stammt, vorherzusagen. Das erlaubt Anwendungen im Bereich der Metagenomik, für die wir eine denkbare Vorgehensweise darlegen.de
dc.format.mimetypeapplication/pdfde
dc.language.isoengde
dc.rights.urihttp://creativecommons.org/licenses/by-nd/2.0/de/de
dc.titleA Biased Urn Model for Taxonomic Identificationde
dc.typedoctoralThesisde
dc.title.translatedEin gewichtetes Urnenmodell zur taxonomischen Identifikationde
dc.contributor.refereeWaack, Stephan Prof. Dr.de
dc.date.examination2008-06-26de
dc.subject.dnb500 Naturwissenschaften allgemeinde
dc.description.abstractengWe consider a stochastic model for the problem of taxonomic identification in bacterial genomes, motivated by the detection of horizontal gene transfer between non-closely related species. We focus on modelling the dinucleotide bias in prokaryotic genomes. To this end, we construct a biased urn model based on the noncentral hypergeometric distribution. The model, which is designed in four steps, is shown to be well-defined and sufficiently general to capture either dinucleotide with respect to the positions in the codon and combinations thereof. To complement existing codon usage approaches, we emphasise the intercodon transition dinucleotide.We show that the dinucleotide bias can be captured by a 9-tupel of parameters for which approximative estimators are available. Additionally, we show that no further reduction of this parameter set is possible. The performance of the horizontal gene transfer detection procedure based on this model is evaluated on benchmark datasets and found to be competitive with existing approaches. Finally, biological relations are found to reflect themselves in the geometry of the parameter space, enabling us to predict the phylum of the organism that a given genomic sequence belongs to. This allows applications in the context of metagenomics for which we sketch a possible procedure.de
dc.contributor.coRefereeDenker, Manfred Prof. Dr.de
dc.subject.topicMathematics and Computer Sciencede
dc.subject.gerHorizontaler Gentransferde
dc.subject.gerGewichtetes Urnenmodellde
dc.subject.gerDinukleotidmodellde
dc.subject.gerNichtzentrierte Hypergeometrische Verteilungde
dc.subject.enghorizontal gene transferde
dc.subject.engbiased urn modelde
dc.subject.engdinucleotide modelde
dc.subject.engnon-central hypergeometric distributionde
dc.subject.bk31.80de
dc.subject.bk54.80de
dc.subject.bk31.70de
dc.identifier.urnurn:nbn:de:gbv:7-webdoc-2071-8de
dc.identifier.purlwebdoc-2071de
dc.affiliation.instituteFakultät für Mathematik und Informatikde
dc.subject.gokfullEAAA 690: General applied mathematicsde
dc.subject.gokfullEGA 000: General reference works {Probability theory and stochastic processes}de
dc.subject.gokfullAHJ 300: Life and Medical Sciences {Computer Applications}de
dc.identifier.ppn614144248de


Dateien

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige