Zur Kurzanzeige

PATTERNS OF NUCLEOTIDE VARIATION AND GENE-ASSOCIATED SNP ANALYSIS IN A QUERCUS spp. FOREST AT ISOCITRATE DEHYDROGENASE GENES

dc.contributor.advisorFinkeldey, Reiner Prof. Dr.de
dc.contributor.authorVidalis, Amaryllisde
dc.date.accessioned2011-01-26T15:12:40Zde
dc.date.accessioned2013-01-18T11:01:21Zde
dc.date.available2013-01-30T23:50:11Zde
dc.date.issued2011-01-26de
dc.identifier.urihttp://hdl.handle.net/11858/00-1735-0000-0006-B142-Cde
dc.description.abstractGenomische DNS ist der primäre Informationsträger des Erbgutes, und die Analyse von DNS-Sequenzen erlaubt die unmittelbare Beobachtung genetischer Information. Methoden der DNS-Sequenzierung und der Genotypisierung, im speziellen die Genotypisierung über Single Nucleotide Polymorphism (SNP), hat neue Ansätze auf dem Gebiet der Forstgenetik ermöglicht. Sowohl quantitative als auch populationsgenetische Methoden werden genutzt, um das Verständnis über das Zusammenspiel zwischen genotypischen und phänotypischen Merkmalen zu verbessern und um genomische Signaturen der natürlichen Selektion in Gehölzen und deren Populationen zu charakterisieren.Aufgrund ihrer Bedeutung und weiten geographischen Verbreitung werden natürliche Populationen von Eichen (Quercus spp.) oft als Model zur Studie der Adaption von Gehölzen an verschiedenste klimatische und edaphische Bedingungen genutzt. In der hier vorgelegten Arbeit wurden vier Eichenarten betrachtet: Quercus robur, Q. petraea, Q. pubescens and Q. frainetto. Diese Arten koexistieren in einem der artenreichesten Eichenwälder Europas, dem Eichen-Reservat Bejan, gelegen im westlichen Zentral-Rumänien. Die vier Arten sind genetisch eng miteinander verwandt, und können Hybride bilden. Taxonomisch werden sie der Sektion Quercus sensu stricto ( Weisseichen') zugeordnet. Bezüglich der geographischen Verbreitung liegt das Bejan Oak Reservat im Zentrum der beiden in Europa dominierenden Arten Q. robur und Q. petraea, wohingegen für die beiden zu den so genannten "thermophilen und xerophilen" zugehörigen Eichenarten Q. pubescens und Q. frainetto das Reservat am nordöstlichen Rand ihrer natürlichen Verbreitung liegt.In der vorliegenden Arbeit wurde die genomische Sequenz der NADP+ und der NAD+ abhängigen Isocitratdehydrogenase (IDH) untersucht. IDH Gene kodieren für zentrale metabolische Enzyme des Krebs-Zyklus. Grundlegende Forschung an diesen Enzymen deutet auf eine signifikante Rolle für adaptive Ereignisse in verschiedenen Organismen hin. Die Nukleotidsequenz und die genomische Lokalisierung eines NADP+ IDH Gens in Q. robur wurde mittels der bekannten Sequenz aus Populus trichocarpa entschlüsselt. Das entschlüsselte Gen umfasst 3481bp (Basenpaare) und beinhaltet 15 Exon- und 14 Intronbereiche. Des Weiteren wurde ein NAD+ IDH Gen per "genome walking" teilweise sequenziert. Das sequenzierte Genfragment hat eine Länge von 2080bp und umfasst das erste Exon und das erste Intron des Gens. Zur populationsgenetischen Analyse der vier Eichenarten wurden beide Gensequenzen per PCR aus genomischer DNS amplifiziert, kloniert und sequenziert, wobei je Art fünf individuelle Replikate analysiert wurden. Die Gensequenz der NADP+ abhängigen IDH wurde aus sieben sequenzierten PCR Amplifikaten assembliert.Die hohe Diversität in der DNS Sequenz der hier analysierten IDH Gene zwischen den untersuchten Eichenarten entsprach der hohen genetischen Diversität in vorangegangenen Studien, obwohl ein konservativ ausgwertet wurde; Single Sequence Repeat (SSR) Motive und unbestätigte Singleton' SNPs wurden ausgeschlossen, um Artefakte, also falsche' Variation, weitestgehend zu vermeiden. Im Gegensatz zur hohen genetischen intraspezifischen Diversität zeigten die hier untersuchten Eichenarten geringe interspezifische Variabilität mit Ausnahme des vierten Fragmentes (Locus 4) des NADP+ abhängigen IDH Gens, welches eine außerordentlich hohe Differenzierung aufwies.Das neutrale Modell der Koaleszenztheorie wurde anhand der Tajima D Statistik und mit der Berechnung des Verhältnisses zwischen synonymen und nicht-synonymen SNPs getestet. Der Tajima D Test war für den überwiegenden Teil der SNP Positionen in allen Arten negativ, was auf einen Überschuss seltener Varianten deutet. Über alle SNP Positionen innerhalb der untersuchen Arten betrachtet zeigte der Tajima D Test allerdings Unterschiede, was weniger auf demographische Effekte zurückzuführen sein dürfte als auf unterschiedlich starke Selektionsprozesse, die an verschiedenen Genabschnitten des gleichen Gens stattfanden. Das Verhältnis zwischen synonymen und nicht-synonymen SNPs war innerhalb des NADP+ abhängigen IDH Gens klein, was auf eine gerichtete Selektion hindeutet und für essentielle Enzyme typisch ist. Der Tajima D Test war positiv für drei der hier untersuchten Eichenarten, allerdings nicht signifikant abweichend von der Annahme der Neutralität.Für eine weitere Genotypisierung wurden 13 bestätigte SNP Positionen des NADP+ IDH Gens ausgewählt und bei 253 Individuen untersucht, deren Artzugehörigkeit in einer vorherigen Studie anhand von morphologischen und molekularen Merkmalen bestimmt wurde. SNP Positionen wurden so ausgewählt, dass das komplette Gen und innerhalb dessen sowohl die nicht kodierenden SNPs (SNP 9, SNP 10, SNP 11, SNP 12 uns SNP 13) als auch kodierende SNPs abgedeckt waren. Innerhalb der kodierenden Sequenz wurden sowohl nicht-synonyme SNPs (SNP 1, SNP 2, SNP 3 and SNP 4) als auch synonyme SNPs (SNP 5, SNP 6, SNP 7 and SNP 8) ausgewertet. In den Positionen SNP 3 und SNP 4 kam es aufgrund der jeweiligen Nukleotidsubstitution und dem daraus folgenden Aminosäurenaustausch zu einer Ladungsverschiebung.Die intraspezifische Diversität was wie auch bei Isozym-Genorten moderat in allen hier untersuchten Eichenarten, wobei nicht-synonyme SNPs eine geringere Diversität aufwiesen. Paarweise Fst Tests mit allen SNP Markern ergaben eine geringe aber signifikante Differenzierung zwischen allen Arten, außer bei den beiden Arten Q. petraea und Q. frainetto. Nicht-synonyme SNP Marker allein konnten Q. frainetto nicht signifikant von einer der anderen Arten differenzieren. Des Weiteren differenzierten kodierende SNP Marker alle Arten deutlich besser als nicht kodierende SNPs, was mit dem abweichend hohen Fst Wert für die Position SNP 6 zu erklären ist. Dieser SNP erwies sich sogar als statistisch signifikanter Ausreißer' bei der Betrachtung der Differenzierung zwischen den Arten relativ zur als erwarteter Heterozygotie' gemessener Variation bei Annahme des Neutralitätsmodells.Eine Analyse auf nicht-zufällige Assoziationen von Allelen ergab keine eindeutigen Gruppierungen der identifizierten SNP Positionen; Kopplungsungleichgewichte (Linkage Disequilibrium, LD) wurden sowohl zwischen nahe beieinanderliegenden als auch weiter voneinander entfernten SNP Positionen beobachtet. Die getrennte Analyse jeder Art ergab eine geringere Anzahl an Positionen innerhalb signifikanter LD für die Art Q. robur, was wahrscheinlich sowohl auf eine lange Geschichte dieser Art in der Region hinweist, als auch auf eine geringere Neigung zur Rekombination. Dies kann mit besonder großen Populationen bei Q. robur zusammenhängen. Auf der anderen Seite zeigten Q. frainetto and Q. pubescens eine höhere Anzahl von SNPs mit signifikantem LD auch bei Paaren mit größerer physischer Distanz auf. Dies könnte mit einem "Gründereffekt" am Rande ihrer geographischen Ausbreitung oder mit der genetischen Vermischung untereinander zusammenhängen. Eine Assoziationsanalyse aller SNPs mit blatt-morphologischen Daten (Sinus-Weite, Lamina-Länge, Grundform der Lamina, Blattstiellänge), die die untersuchten Eicharten differenzieren (Curtu et al. 2007b), ergaben sieben statistisch signifikante Zusammenhänge unter Verwendung eines linearen Modells. Drei der signifikanten Assoziationen wurden in nicht-synonymen SNPs identifiziert. Die Berechnung statistischer Assoziationen ist nicht automatisch gleichbedeutend mit biologischen oder sogar kausalen Assoziationen. Daher ist es ratsam, die in dieser Arbeit ausgewerteten SNP Assoziationen an weiteren genetisch nicht strukturierten und differenzierten Populationen zu bestätigen.de
dc.format.mimetypeapplication/pdfde
dc.language.isoengde
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/de
dc.titlePATTERNS OF NUCLEOTIDE VARIATION AND GENE-ASSOCIATED SNP ANALYSIS IN A QUERCUS spp. FOREST AT ISOCITRATE DEHYDROGENASE GENESde
dc.typedoctoralThesisde
dc.title.translatedMuster der Nukleotid-Variation und Gen-assoziierte SNP-Analyse in einem Eichenbestand (Quercus spp.) an Isocitrat-Dehydrogenase Genede
dc.contributor.refereeFinkeldey, Reiner Prof. Dr.de
dc.date.examination2010-09-16de
dc.subject.dnb570 Biowissenschaftende
dc.subject.dnbBiologiede
dc.description.abstractengGenomic DNA contains the primary source of genetic information. Thus, its analysis provides the highest level of genetic resolution. DNA sequencing and genotyping methodologies based on it in particular genotyping of Single Nucleotide Polymorphisms (SNPs) facilitated new research approaches in forest genetics. Both quantitative and population genetic methods are being applied to better understand the association between genotypic and phenotypic diversity, and to detect the signatures of natural selection upon different parts of the genome in forest trees and their populations.Oak populations have been widely used as model species to study adaptation of forest trees in variable environments due to their wide geographical range and the large variation of climatic and edaphic condition that they occupy. Four oak species that coexist in the Bejan Oak Reserve (a species rich temperate oak forest in west-central Romania) were investigated in the present study: Quercus robur, Q. petraea, Q. pubescens and Q. frainetto. The four species are closely related, likely to hybridize and belong taxonomically to the section Quercus sensu stricto (white oaks) according to the most recent classifications. According to the geographical range of the species, the site of investigation is for the two more widely spread European species (Q. robur and Q. petraea) in the centre of their distribution, whereas for the two so called "thermophilous and xerothermic" oak species (Q. pubescens and Q. frainetto), the Bejan Oak Reserve is located at the east-northern margins of their distribution.The nucleotide sequences of NADP+ and NAD+ dependent isocitrate dehydrogenases (IDH) were investigated in the present study. IDH genes are key metabolic enzymes participating in the Krebs cycle. Considerable evidence points towards an adaptive significance of IDH genes in many different organisms. The nucleotide sequence of an NADP+ IDH locus was obtained on the basis of the published genome sequence of Populus trichocarpa. In total, 3481bp organized in 15 exons and 14 introns were identified representing the almost complete sequence of the gene. The sequence of the NAD+ IDH locus was partially obtained with the "genome walking" technique. A total of 2080bp were obtained containing one complete exon and one complete intron. The obtained sequences for both genes were PCR amplified from the genomic DNA of five individuals per species, cloned and sequenced. The PCR amplification for the NADP+ IDH gene was done in seven overlapping fragments.The nucleotide diversity observed in this study was high, and similar to that found in the few earlier studies dealing with nucleotide diversity in Quercus spp., despite the conservative analysis of excluding the Single Sequence Repeat (SSR) motifs and the non-verified singletons from further analyses. This kind of analysis was done in order to avoid incorporation of false variation in the data. In contrast to the high within species nucleotide diversity, the species were in total weakly differentiated at both genes with the exception of significant differentiation among species at the fragment 4 of NADP+ IDH gene. In order to test the neutral model of the coalescent theory Tajima's D statistic and the ratio between non-synonymous and silent polymorphisms were tested. Tajima's D was found for most loci and species negative, indicating an excess of low frequency variants. However, there were differences detected in the Tajima's D species-wide among the different loci, suggesting that the trends might not be subject to demographic effects but rather either an artifact of the low sample size or might reflect the different action of selection upon different fragments even within the same gene. The ratio between non-synonymous and silent polymorphisms was for the NADP+ IDH gene in most fragments low, suggesting purifying selection acting, as expected for proteins and enzyme gene loci. Tajima's D for the NAD+ IDH gene was found positive in three species but not significantly departing from neutral expectations.From the NADP+ IDH gene, 13 verified SNPs were chosen for further genotyping in a total of 253 white oaks, assigned as "pure" species according to morphological traits and molecular markers by a previous study. The SNPs were chosen to cover the whole gene and to locate in non-coding (SNP 9, SNP 10, SNP 11, SNP 12, and SNP 13) and coding regions. Non-synonymous (SNP 1, SNP 2, SNP 3 and SNP 4) and synonymous SNPs (SNP 5, SNP 6, SNP 7 and SNP 8) were investigated within the coding regions. SNP 3 and SNP 4 result in a charge change through the amino acid replacement caused by the respective nucleotide substitutions. The levels of gene diversity within species were moderate and similar for all the species, comparable to those exhibited in isozyme analyses. The non-synonymous SNPs showed in general lower levels of gene diversity. Pairwise Fst values at all SNP markers revealed low but significant differentiation between almost all pairs of species, except Q. petraea and Q. frainetto. Non-synonymous SNPs alone failed to differentiate Q. frainetto from all other species. Coding SNPs differentiated the species better than non-coding SNPs. This result is mainly caused by the high Fst values of the synonymous SNP 6. In particular, SNP 6 was indicated as an outlier candidate locus for selection by an Fst outlier analysis, which compared the observed Fst values as a function to the expected heterozygosities, against those expected under a neutral model.The analysis for non-random association of alleles revealed no clear physical clustering of SNP sites in linkage disequilibrium (LD). The separate analysis of each species showed a lower number of sites in significant LD for Q. robur than for the other species, possibly reflecting the history of the species in the specific geographical site, and the less efficient recombination effect due to a larger effective population size of Q. robur. On the other hand, Q. frainetto and Q. pubescens, showed larger number of SNPs in significant LD and spanning larger physical distances, reflecting a possible founder effect due to the location at the margins of their geographical distribution, or the genetic admixture among them. An association analysis of all the SNPs with leaf morphological traits that differentiate the species (measured by Curtu et al. 2007b): sinus width, lamina length, basal shape of lamina and petiole length showed seven statistically significant associations under a general linear model. Three of the significant associations were found at non-synonymous SNPs. Statistical association does not necessarily mean a biological or even causal association. Genetic structure is the most serious bias in the association analyses. It is proposed that the SNPs suggested by the associated analysis in this study should be further analyzed in populations that are genetically not differentiated and structured.de
dc.contributor.coRefereeBecker, Heiko C. Prof. Dr.de
dc.subject.topicForest Sciences and Forest Ecologyde
dc.subject.gerNukleotiddiveristätde
dc.subject.gerSingle Nucleotide Polymorphisms (SNP)de
dc.subject.gerIsocitrat-Dehydrogenasede
dc.subject.gerQuercus spp.de
dc.subject.engNucleotide diversityde
dc.subject.engSingle Nucleotide Polymorphisms (SNP)de
dc.subject.engisocitrate dehydrogenasede
dc.subject.engQuercus spp.de
dc.subject.bk42.13de
dc.identifier.urnurn:nbn:de:gbv:7-webdoc-2786-0de
dc.identifier.purlwebdoc-2786de
dc.affiliation.instituteFakultät für Forstwissenschaften und Waldökologiede
dc.subject.gokfullYQH 000: Genetikde
dc.subject.gokfullFortpflanzungde
dc.subject.gokfullZüchtung {Forstbotanik}de
dc.identifier.ppn668414278de


Dateien

Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige