dc.contributor.advisor | Waack, Stephan Prof. Dr. | de |
dc.contributor.author | Surovcik, Katharina | de |
dc.date.accessioned | 2009-03-24T12:10:31Z | de |
dc.date.accessioned | 2013-01-18T13:21:17Z | de |
dc.date.available | 2013-01-30T23:51:07Z | de |
dc.date.issued | 2009-03-24 | de |
dc.identifier.uri | http://hdl.handle.net/11858/00-1735-0000-0006-B665-1 | de |
dc.identifier.uri | http://dx.doi.org/10.53846/goediss-2492 | |
dc.identifier.uri | http://dx.doi.org/10.53846/goediss-2492 | |
dc.description.abstract | Wir betrachten ein stochastisches Modell für das
Problem taxonomischer Identifikation in bakteriellen
Genomen, welches durch die Erkennung horizontalen
Gentransfer zwischen entfernt verwandten Species
motiviert ist. Wir konzentrieren uns auf die
Modellierung der Bevorzugung von Dinukleotiden in
prokaryotischen Genomen. Dazu konstruieren wir ein
gewichtetes Urnenmodell mit Hilfe der nichtzentrierten
hypergeometrischen Verteilung. Es wird gezeigt, dass
das Modell, welches sich in vier Schritten aufbaut,
wohldefiniert ist. Des weiteren ist es hinreichend
allgemein, um beliebige Dinukleotide im Hinblick auf
die Position innerhalb des Codons sowie deren
Kombinationen zu behandeln. Zur Ergänzung bestehender
Codon Usage Ansätze heben wir das
Intercodon-Übergangsdinukleotid hervor.Wir zeigen, dass sich die Bevorzugung von
Dinukleotiden durch ein 9-Parameter-Tupel, für welches
approximative Schätzer verfügbar sind, beschreiben
lässt. Zusätzlich zeigen wir, dass eine weitere
Parameterreduktion unmöglich ist. Die
Leistungsfähigkeit der Detektionsprozedur für
horizontalen Gentransfer, die auf diesem Modell
basiert, wird an Hand eines Benchmark-Datensatzes
evaluiert und kann mit bisherigen Ansätzen
konkurrieren.
Schließlich wird gezeigt, dass sich die biologischen
Verwandtschaftsbeziehungen in der Geometrie des
Parameterraumes widerspiegeln, was es uns ermöglicht,
das Phylum zum Organismus, aus welchem eine
Genomsequenz stammt, vorherzusagen. Das erlaubt
Anwendungen im Bereich der Metagenomik, für die wir
eine denkbare Vorgehensweise darlegen. | de |
dc.format.mimetype | application/pdf | de |
dc.language.iso | eng | de |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/2.0/de/ | de |
dc.title | A Biased Urn Model for Taxonomic Identification | de |
dc.type | doctoralThesis | de |
dc.title.translated | Ein gewichtetes Urnenmodell zur taxonomischen Identifikation | de |
dc.contributor.referee | Waack, Stephan Prof. Dr. | de |
dc.date.examination | 2008-06-26 | de |
dc.subject.dnb | 500 Naturwissenschaften allgemein | de |
dc.description.abstracteng | We consider a stochastic model for the problem of
taxonomic identification in bacterial genomes,
motivated by the detection of horizontal gene transfer
between non-closely related species. We focus on
modelling the dinucleotide bias in prokaryotic
genomes.
To this end, we construct a biased urn model based on
the noncentral hypergeometric distribution. The model,
which is designed in four steps, is shown to be
well-defined and sufficiently general to capture either
dinucleotide with respect to the positions in the codon
and combinations thereof. To complement existing codon
usage approaches, we emphasise the intercodon
transition dinucleotide.We show that the dinucleotide bias can be captured
by a 9-tupel of parameters for which approximative
estimators are available. Additionally, we show that no
further reduction of this parameter set is possible.
The performance of the horizontal gene transfer
detection procedure based on this model is evaluated on
benchmark datasets and found to be competitive with
existing approaches. Finally, biological relations are
found to reflect themselves in the geometry of the
parameter space, enabling us to predict the phylum of
the organism that a given genomic sequence belongs to.
This allows applications in the context of metagenomics
for which we sketch a possible procedure. | de |
dc.contributor.coReferee | Denker, Manfred Prof. Dr. | de |
dc.subject.topic | Mathematics and Computer Science | de |
dc.subject.ger | Horizontaler Gentransfer | de |
dc.subject.ger | Gewichtetes Urnenmodell | de |
dc.subject.ger | Dinukleotidmodell | de |
dc.subject.ger | Nichtzentrierte Hypergeometrische Verteilung | de |
dc.subject.eng | horizontal gene transfer | de |
dc.subject.eng | biased urn model | de |
dc.subject.eng | dinucleotide model | de |
dc.subject.eng | non-central hypergeometric distribution | de |
dc.subject.bk | 31.80 | de |
dc.subject.bk | 54.80 | de |
dc.subject.bk | 31.70 | de |
dc.identifier.urn | urn:nbn:de:gbv:7-webdoc-2071-8 | de |
dc.identifier.purl | webdoc-2071 | de |
dc.affiliation.institute | Fakultät für Mathematik und Informatik | de |
dc.subject.gokfull | EAAA 690: General applied mathematics | de |
dc.subject.gokfull | EGA 000: General reference works {Probability theory and stochastic processes} | de |
dc.subject.gokfull | AHJ 300: Life and Medical Sciences {Computer Applications} | de |
dc.identifier.ppn | 614144248 | de |