The Empirical Hierarchical Bayes Approach for Pathway Integration and Gene-Environment Interactions in Genome-Wide Association Studies
Der empirische hierarchische Bayes Ansatz für Pathway-Integration und Gen-Umwelt Interaktionen in genomweiten Assoziationsstudien
by Melanie Sohns
Date of Examination:2012-07-12
Date of issue:2012-10-24
Advisor:Prof. Dr. Heike Bickeböller
Referee:Prof. Dr. Martin Schlather
Referee:Prof. Dr. Heike Bickeböller
Files in this item
Name:sohns.pdf
Size:3.27Mb
Format:PDF
Abstract
English
Complex diseases such as cancer result from a complicated interplay of multiple genetic and environmental factors. To unveil their genetic component, the simple analysis of single-nucleotide polymorphisms (SNP) as done in genome-wide association studies (GWAS) is not sufficient. Complementary approaches considering the complexity of diseases, such as the incorporation of biological pathway information or detection of gene-environment interaction, are necessary. In this thesis we focus on an empirical hierarchical Bayes model proposed for the integration of external information into genome-wide association studies. We use the approach to incorporate biological pathway information and provide a new test for gene environment interaction (GxE) by adapting the method for that purpose. In an application, we furthermore integrate pathway information with GxE interaction effects by two different strategies. The integration of pathway information by the empirical hierarchical Bayes approach in a GWAS for Rheumatoid Arthritis, characterized by an extremely high number of strong association signals, supports the simple single SNP results, while in an application to four lung cancer GWAS it leads to higher consistency of results between the different studies. In both cases, the strength of the pathway integration approach is supported by the biological plausibility of the results. In comprehensive simulation studies, our new empirical hierarchical Bayes approach for GxE interaction outperforms other GxE methods, having high power to identify GxE interactions in the presence of population-based gene-environment associations (G-E). In our real data application to the lung cancer GWAS with smoking as environmental factor, the method leads to similar results as the powerful case-only test, with the latter in general accompanied by false positive results given population-based G-E associations. However, in the particular data sets, no strong G-E association effects with smoking are observed. By additional integration of pathway information with GxE effects, the consistency of results between the studies increases. Due to the biological plausibility of the results, good candidates for further investigations are identified.
Keywords: empirical hierarchical Bayes model; pathway integration; gene-environment interaction; gene-environment association; genome-wide association; lung cancer
Other Languages
Komplexe Erkrankungen wie Krebs entstehen
durch ein kompliziertes Zusammenspiel zahlreicher Umwelteinflüsse
und genetischer Faktoren. Um die genetische Komponente solcher
Krankheiten aufzudecken ist die einfache Analyse von
Einzel-Nukleotid-Polymorphismen (SNP), wie sie in genomweiten
Assoziationsstudien (GWAS) angewendet wird, nicht ausreichend.
Vielmehr sind komplementäre Ansätze erforderlich, welche die
Komplexität der Krankheit mit einbeziehen. Diese umfassen zum
Beispiel die Integration von biologischen Pathway-Informationen
oder die Identifizierung von Gen-Umwelt-Interaktionen. Die
vorliegende Arbeit beschäftigt sich mit einem empirischen
hierarchischen Bayes-Modell, welches zur Integration externer
Informationen in genomweite Assoziationsstudien vorgeschlagen
wurde. Wir verwenden diesen Ansatz, um biologische Pathways in
unseren Analysen zu berücksichtigen und entwickeln basierend auf
dem empirischen hierarchischen Bayes-Modell einen neuen Test zum
Auffinden von Gen-Umwelt-Interaktion (GxE) durch entsprechende
Anpassungen. In einer Anwendung kombinieren wir darüber hinaus die
Integration von Pathway-Informationen mit der Analyse von GxE
Interaktionen anhand von zwei Strategien. Basierend auf einer GWAS
zur Rheumatoiden Arthritis, charakterisiert durch eine extrem hohe
Anzahl von starken Assoziationseffekten, liefert die Integration
von Pathway-Informationen ähnliche Ergebnisse wie die einfache
Single-SNP Analyse, während die Konsistenz der Ergebnisse zwischen
vier verschiedenen Lungenkrebsstudien durch die Integration der
biologischen Pathways gesteigert werden kann. In beiden Fällen kann
der Nutzen der Pathway-Integration durch die biologische
Plausibilität der Ergebnisse gestärkt werden. In umfangreichen
Simulationsstudien ist unser neuer empirischer hierarchischer Bayes
Ansatz für GxE Interaktionen anderen GxE Methoden überlegen, indem
er eine höhere statistische Power zur Identifizierung von GxE
Interaktionen in Gegenwart von populationsbasierten
Gen-Umwelt-Assoziationen (G-E) vorweist. In unserer Anwendung auf
die Lungenkrebs GWAS mit Rauchen als betrachtetem Umweltfaktor
führt das Verfahren zu ähnlichen Ergebnissen wie der
leistungsfähige Case-Only Test, wobei letzterer im Allgemeinen von
falsch positiven Ergebnissen aufgrund von populationsbasierten G-E
Assoziationen begleitet wird. Allerdings werden in unseren
Lungenkrebsdaten keine starken G-E Assoziations-Effekte bezüglich
Rauchen entdeckt. Durch die zusätzliche Integration von
Pathway-Informationen für die Analyse von GxE Interaktionseffekten
nimmt die Konsistenz der Ergebnisse zwischen den Studien zu.
Aufgrund der biologischen Plausibilität der Ergebnisse können gute
genetische Kandidaten für weitere Untersuchungen identifiziert
werden.
Schlagwörter: empirisches hierarchisches Bayes-Modell; Pathway-Integration; Gen-Umwelt Interaktion; Gen-Umwelt Assoziation; Genomweite Assoziation; Lungekrebs