Genetic differentiation within and between populations under selection – studies on diverse chicken populations and the Göttingen Minipig
by Christian Gärke
Date of Examination:2012-05-21
Date of issue:2013-05-03
Advisor:Prof. Dr. Henner Simianer
Referee:Prof. Dr. Henner Simianer
Referee:Prof. Dr. Georg Thaller
Referee:Prof. Dr. Christoph Knorr
Files in this item
Name:Dissertation_C.Gärke.pdf
Size:1.43Mb
Format:PDF
Abstract
English
In this thesis different aspects of the use of high density markers in the genetic characterisation and analysis of farm and experimental animal populations are addressed. First, a general introduction and an overview over the different fields of marker applications in animal breeding and farm animal genetics is given. The first analysis deals with the marker-based differentiation of chicken populations. Eight chicken breeds were genotyped for 9'216 single nucleotide polymorphisms (SNPs) and 29 microsatellites (single sequence repeats, SSRs). Two different methods were applied to differentiate the breeds: (i) a Bayesian model-based clustering approach, which is implemented in the software STRUCTURE version 2.3 and (ii) a partitioning of the Euclidean distance matrix based on a principal component analysis (PCA). In the model-based clustering, the similarity coefficient obtained with SNPs compared to SSRs showed significantly higher values between repeated runs. The membership coefficients, reflecting the proportion in which a fraction segment of the genome belongs to a particular cluster, showed the highest values for 29 SSRs and 100 SNPs, respectively. The PCA-based partitioning showed that 2.4 SNPs per SSR were required to achieve equivalent differentiation ability. This result is comparable with studies conducted on humans or farm animals reported in the literature. With the use of high SNP numbers it was possible to detect genetic heterogeneity of one breed which was completely missed when all available SSRs were used. The results of our study and the availability and cost-efficiency of larger numbers of SNPs compared to SSRs suggest that SNP-based approaches will probably become the technology of choice in farm animal genetic studies. In a second analysis, a genome-wide mapping of selection signatures on the autosomes of the Göttingen Minipig (GMP) was carried out. To search for signatures of recent positive selection, genotypes obtained with the Illumina Porcine BeadChip 60K (Illumina, San Diego, USA) were analysed by two methods: (i) the Long Range Haplotype (LRH) test, which is integrated in the software SWEEP and (ii) the estimation of the membership coefficient of the three founder breeds for each SNP using a Bayesian method. The breed composition of the Göttingen Minipig (i.e. the estimated proportion of the three founder breeds) was found to deviate significantly from to the proportions expected from pedigree information. The probability of alleles to originate from one of the three founder breeds of the GMP is highly variable between the chromosomes and even within each chromosome. It was assumed that selection is a genetic mechanism having a locus-specific impact on the composition of the genome and considerable local deviations from the genome-wide average can be interpreted as regions being under directional selection. Combining the membership coefficient and the results of the LRH test, several regions under selection were identified. Some regions of recent selection overlapped with candidate genes which are related to breeding goals of the Göttingen Minipig, e.g. SOCS2, TXN, DDR2 and GRB10, which are connected with the body size, and the PRLR gene, which affects the litter size. The results suggest that the connection between the SOCS2 and GRB10 gene with the IGF-1 gene might be one reason for the small body size of the Göttingen Minipigs. In a further step the results of the LRH test and the membership coefficient were validated with the Cross Population Extended Haplotype Homozygosity (XPEHH) approach. This method is based on the detection of long haplotype homozygosity between different breeds. The XPEHH test was used to detect selective sweeps between the Göttingen Minipig and German Landrace and Large White pigs based on genotypes obtained with the Illumina Porcine 60K BeadChip. The XPEHH test revealed additional regions that might have been under divergent selection in the GMP compared to the two normal-sized breeds. Again the region containing the SOCS2 gene produced one of the most prominent signals, so that the conjecture is confirmed that this might be one of the most important genes involved in the dwarfism in the Göttingen Minipig. In conclusion the applications of high density genotyping data reported in this study suggest that SNP-based approaches allow a much better insight in the genomic architecture of populations and, by this, lead to a better understanding of the mechanisms underlying selection and breed differentiation on the genomic level.
Keywords: Göttingen Minipig, SSR, SNP, selection signatures, EHH
Other Languages
Ziel dieser Arbeit war es, verschiedene Aspekte der Verwendung von genetischen Markern in der genomischen Charakterisierung und Analyse von verschiedenen Tierpopulationen zu untersuchen. Zu Beginn werden die verschiedenen Anwendungsbereiche von genetischen Markern in der Tierzucht beschrieben.
In der ersten Analyse wurden acht Hühnerrassen für 9‘216 Single Nucleotide Polymorphism (SNPs) und 29 Microsatelliten (Single Sequence Repeats, SSRs) typisiert. Um die Rassen zu differenzieren wurden zwei unterschiedliche Methoden herangezogen: (i) die Bayesian Model-based Clustering Analyse, die im Programm STRUCTURE (Version 2.3) implementiert ist und (ii) eine Hauptkomponenten-Analyse (Principal Component Analysis, PCA), bei der eine Differenzierung der Rassen aufgrund ihres Euklidischen Abstandes zueinander durchgeführt wurde.
Die Ergebnisse der STRUCTURE Analyse zeigten, dass die Wiederholbarkeit bei SNPs, unabhängig von Ihrer Anzahl, höher war als bei den SSR. Bei der Zuordnung eines Individuums zu einer der Rassen wurden die höchsten Werte für 29 SSRs und 100 SNPs errechnet. Die PCA-basierte Methode ergab, dass 2.4 SNPs je SSR benötigt werden, um eine vergleichbare Differenzierung zu erreichen. Dieses Ergebnis ist vergleichbar mit Untersuchungen, die an Menschen oder Rindern durchgeführt wurden. Unter Verwendung aller SNPs konnte im Vergleich zu allen vorhandenen SSRs eine genetisch inhomogene Rasse detektiert werden. Aufgrund dieser Ergebnisse und der deutlich größeren Anzahl an verfügbaren SNPs verglichen mit SSRs kann davon ausgegangen werden, dass SNP-basierte Ansätze weiter an Bedeutung gewinnen werden.
Des Weiteren wurde eine umfassende Kartierung von Selektionssignaturen auf den Autosomen des Göttinger Minischweins durchgeführt. Für die Suche nach Selektions-signaturen wurden die mittels des Illumina Porcine BeadChip 60K (Illumina, San Diego, USA) gewonnenen SNP Daten anhand von zwei Methoden untersucht: Zum einen wurde der Long Range Haplotype Test (LRH) angewendet, der im Softwarepacket SWEEP integriert ist. Zum anderen wurden die genomischen Anteile der drei Ausgangsrassen für jeden SNP aufgrund einer Bayes‘schen Methode geschätzt.
Es konnte eine signifikante Veränderung der Anteile der Ausgangsrassen verglichen mit den berechneten pedigree-basierten Erwartungswert festgestellt werden. Hierbei fiel auf, dass die Zuteilung der Allele zu einer der drei Ausgangsrassen sowohl zwischen als auch innerhalb der Chromosomen hoch variabel ist. Es wurde angenommen, dass eine lokale Abweichung der Zusammensetzung als Hinweis darauf interpretiert werden kann, dass diese Region unter gerichteter Selektion stand. Mit Hilfe dieses Indikators und den Ergebnissen des LRH-Testes konnte eine Vielzahl von Regionen identifiziert werden, die unter Selektion standen. Einige dieser Regionen beherbergen Kandidatengene, die funktionell mit den Zuchtzielen der Göttinger Minischweine im Zusammenhang stehen, z.B. SOCS2, TXN, DDR2 und GRB10, die mit der Körpergröße in Verbindung gebracht werden, oder das PRLR Gen, das die Wurfgröße beeinflusst. Die Ergebnisse dieser Untersuchungen lassen Rückschlüsse darauf zu, dass die Beziehung der Gene SOCS2 und GRB10 zu dem IGF-1 Gen der mögliche Grund für den Zwergwuchs im Göttinger Minischwein sein könnte.
In einem weiteren Schritt wurden die Ergebnisse der Kartierung der Selektionssignaturen auf den Autosomen des Göttinger Minischweins validiert. Hierfür wurde die Cross Population Extended Haplotype Homozygosity (XPEHH) berechnet. Diese Methode basiert, genau wie der LRH-Test, auf dem Auffinden von Regionen ausgedehnter Haplotypenhomozygotie. Die beiden Ansätze unterscheiden sich dadurch, dass beim LRH-Test innerhalb einer Rasse und beim XPEHH im Vergleich zweier Rassen Selektionssignaturen aufgedeckt werden. Als Vergleichsrassen wurden Tiere der Rassen Göttinger Minischwein, Deutsche Landrasse und Large White mit dem Illumina Porcine BeadChip 60K (Illumina, San Diego, USA) genotypisiert.
Mit Hilfe des XPEHH-Tests konnten weitere Regionen identifiziert werden, die unter Selektion standen. Aufgrund des Vergleichs von Großschweinerassen mit dem Göttinger Minischwein und dem erneuten Auffinden des SOCS2 Gens wird die Vermutung bestärkt, dass es sich hierbei um eines der wichtigsten Gene für den Zwergwuchs beim Göttinger Minischwein handelt.
Zusammenfassend ergibt sich, dass SNP-basierte Ansätze einen deutlich besseren Einblick in die genomische Architektur von Populationen ermöglichen. Dadurch wird ein besseres Verständnis von Selektion und Differenzierung von Rasse auf genomischer Ebene erreicht.
Schlagwörter: Göttingen Minipig, SSR, SNP, selection signatures, EHH