by Helmuth Edisson Nieves Orduña
English
The tropical cacao tree, Theobroma cacao L., is cultivated to produce seeds, the unique raw material for the chocolate industry. Thus, conservation and use of cacao genetic resources in breeding programs are vital for the cacao-chocolate global economy. Wild cacao populations have a wide geographic distribution in their native range along the Amazon basin, but northwestern Amazonia is the hotspot of cacao genetic diversity. From the rich diversity of cacao (at least twelve genetic clusters are identified) the domestication of cacao in South America led to the development of Criollo, whose seeds are characterized by reduced bitterness, a trait appreciated for the international cacao market. Criollo ancestry still is a primary source for the development of cultivated cacao varieties. A narrow genetic base in cultivated cacao and disease vulnerability led to collecting disease resistant genotypes in Amazonia since the 1930s. This was followed by conservation via ex situ collections, agronomic evaluation of accessions to improve and broaden the genetic base of cultivated cacao. Disease resistance and yield are the most important economic traits in cocoa breeding, as diseases can destroy up to 40% of cocoa production. The conservation and utilization of the rich cacao diversity are the primary source of novel alleles necessary to address current and future cacao breeding objectives.
The first paper reviews key topics in cacao genetics essential for crop improvement. By analyzing the geographic distribution of wild cacao in Amazonia, which consisted of 4413 observation points compiled from the years 1938 to 2022, and mapping the patterns of genetic variation, new areas for germplasm collection were identified in the border region between Ecuador and Peru in northwestern Amazonia. Despite the deforestation in Amazonia, this analysis suggests that it is still possible to collect wild material in the identified areas. In terms of conservation, germplasm collections in cacao producing countries can benefit from available SNP markers to improve genotype identity and characterization of agronomic traits at early stages.
The studies addressing the genetic basis of disease resistance, seed quality traits, and yield suggest a polygenic architecture. For example, at least 44 genes reported and distributed over the ten cacao chromosomes are associated with resistance to three different diseases (Black Pod-BP, Witches’ Broom Disease WBD and Frosty Pod Rot-FPR). Further evaluations with more diverse germplasm and different fungal strains likely will reveal more disease resistance genes and genotypes. Recently, the genetic basis of seed quality traits such as reduced cadmium and flavor has been addressed, but informative molecular markers need to be developed to accelerate breeding. Other traits of particular importance to West Africa, the largest producer of cacao, include heat and drought tolerance. Cacao breeding efforts have not fully exploited heterosis but can profit from modern genome-wide SNP data to develop inbred lines and design crosses, followed by genomic selection of untested hybrids. Overall, cacao breeding requires data generated by standard phenotyping (of different cacao populations) integrated with analytical methods such as genome-wide association studies (GWAS), quantitative trait locus (QTL) mapping, genomic selection, and field trials to identify relevant genotypes for breeding and cultivation.
The second paper investigates the phylogeographic structure of cacao using nine informative chloroplast DNA (cpDNA) microsatellite (simple sequence repeat - SSR) markers to genotype 233 cacao samples. Nineteen out of the twenty-three chloroplast haplotypes identified were observed in western Amazonia, including seven geographically restricted haplotypes, confirming northwestern Amazonia as a hotspot for cacao genetic diversity and center of crop domestication. Two observed haplotypes were widespread from west to east along the Amazon basin, suggesting seed dispersal by humans. When comparing the observed haplotypes with previously identified genetic clusters using nuclear SSRs, specific chloroplast haplotypes were observed within eight genetic clusters. Evidence of selection of plant material was provided by the observation of a single haplotype common in cacao farms of west Ecuador and reference Trinitario accessions, the most important breeding population. The identified chloroplast haplotypes can be used to determine the geographic origin of planting material at a finer geographic scale. In addition, these chloroplast haplotypes, in combination with phenotypic assessments, can help to select geographically distinctive varieties for cacao breeding programs.
The third paper analyses the population structure of wild and managed cacao (cultivated and breeding populations), identifies agronomic traits under selection, and uncovers valuable cacao genotypes not observed in cultivated and breeding populations. Forty published SNPs associated with disease resistance and 11 SNPs with yield traits were investigated in 346 accessions using the MassARRAY® system. The structure analysis revealed four genetic clusters. Two clusters were overrepresented in managed cacao, which is characterized by admixed individuals, representing artificial hybrids. A cluster overrepresented in managed cacao is linked to the preference for maintaining the superior flavor of cultivated cacao from the Criollo ancestry. Under-utilization of genetic resources such as Guiana cacao was detected in managed cacao, and published agronomic evaluation of this germplasm group showed yield and disease resistance traits. Yield and disease resistance traits (mainly resistance to WBD) show divergence between wild and cultivated cacao (FST > 0.05). This divergence likely reflects selection during domestication, cultivation, and breeding. The identified SNPs showing divergence between wild and cultivated cocoa can be used to improve selection in breeding populations. Agronomic evaluation of wild populations can expand the genetic base for breeding cacao, especially for traits of economic importance such as low seed Cadmium and disease resistance against FPR.
Keywords: cacao; tropical forest; Amazonia; crop breeding; chloroplast haplotypes; chocolate; agronomic traits; SNPs; forest genetics
German
Der tropische Kakaobaum, Theobroma cacao L., wird für die Samenproduktion angebaut, die den einzigartigen Rohstoff für die Schokoladenindustrie darstellen. Daher sind Zuchtprogramme für Erhaltung und Nutzung der genetischen Ressourcen von Kakao für die globale Wirtschaft und den Handel von Kakao und Schokolade von entscheidender Bedeutung. Wildkakao weist eine große geografische Verbreitung auf, die sich ursprünglich entlang des Amazonasbeckens erstreckte. Hierbei liegt der „Hotspot“ der genetischen Vielfalt von Kakao im Nordwesten Amazoniens. Insgesamt wurden in der Art zwölf genetische Gruppen (Cluster) identifiziert. Aus dieser reichen Vielfalt des Kakaos führte die Domestizierung des Kakaos in Südamerika zur Entwicklung der Sorte Criollo, dessen Samen sich durch eine reduzierte Bitterkeit auszeichnen. Diese Eigenschaft wird auf dem internationalen Kakaomarkt hochgeschätzt. Die Criollo-Abstammung ist nach wie vor eine Hauptquelle für die Entwicklung kultivierter Kakaosorten. Eine schmale genetische Basis in den kultivierten Kakaosorten und deren Anfälligkeit für Krankheiten führten dazu, dass seit den 1930er Jahren krankheitsresistente Genotypen in Amazonien gesammelt wurden. Diese Akzessionen wurden in ex-situ-Sammlungen erhalten und eine agronomische Bewertung durchgeführt. Sie erhielten Einzug in die Zuchtprogramme, um die genetische Basis des angebauten Kakaos zu verbessern und zu erweitern. Krankheitsresistenz und Ertrag sind die wichtigsten wirtschaftlichen Merkmale in der Kakaozüchtung, da Krankheiten bis zu 40% der Kakaoproduktion zerstören können. Die Erhaltung und Nutzung der reichen Kakaovielfalt sind die Hauptquelle für neue Allele, die notwendig sind, um aktuelle und zukünftige Ziele der Kakaozüchtung zu erreichen.
Der erste Artikel befasst sich mit Schlüsselthemen der Kakaogenetik, die für die Verbesserung von Nutzpflanzen unerlässlich sind. Durch die Analyse der geografischen Verbreitung von Wildkakao in Amazonien, die aus Beobachtungspunkten aus den Jahren 1938 bis 2022 bestand, und die Kartierung der Muster der genetischen Variation wurden neue Gebiete für die Sammlung genetischer Ressourcen in der Grenzregion zwischen Ecuador und Peru im Nordwesten Amazoniens identifiziert. Trotz der Entwaldung in Amazonien deuten die Analysen darauf hin, dass es in den identifizierten Gebieten immer noch möglich ist, Wildmaterial zu sammeln. In Bezug auf den Naturschutz können Genbanken in kakaoproduzierenden Ländern von den verfügbaren SNP-Markern profitieren, um die Genotypidentität und die Charakterisierung agronomischer Merkmale in frühen Stadien zu verbessern. Die Studien, die sich mit den genetischen Grundlagen der Krankheitsresistenz, den Merkmalen der Samenqualität und dem Ertrag befassen, deuten auf eine polygene Architektur hin. Zum Beispiel werden 40 Gene, die über die zehn Kakaochromosomen verteilt sind, mit der Resistenz gegenüber dreier Krankheiten (Kakao- oder Schwarzfäule, Hexenbesenkrankheit und Monilia-Fruchtfäule) in Verbindung gebracht. Weitere Auswertungen mit genetisch vielfältigerem Pflanzenmaterial und verschiedenen Pilzstämmen werden wahrscheinlich mehr krankheitsresistente Gene und Genotypen aufdecken. In jüngster Zeit wurde die genetische Grundlage von Saatgutqualitätsmerkmalen wie reduziertem Cadmiumgehalt und geschmacksbestimmenden Inhaltsstoffen untersucht. Diese Arbeiten könnten für die Entwicklung aussagekräftiger molekulare Marker für eine Beschleunigung der Züchtung genutzt werden. Weitere Eigenschaften, die für Westafrika als den größten Kakaoproduzenten, von besonderer Bedeutung sind, sind Hitze- und Trockenheitstoleranz. Die Bemühungen in der Kakaozüchtung haben die Heterosis nicht vollständig ausgenutzt, können aber von modernen genomweiten SNP-Daten profitieren, um Inzuchtlinien zu entwickeln und Kreuzungen zu entwerfen, gefolgt von genomischer Selektion ungetesteter Hybriden. Insgesamt erfordert die Kakaozüchtung Daten, die durch Standard-Phänotypisierung (verschiedener Kakaopopulationen) generiert werden. Diese werden mit analytischen Methoden wie genomweiten Assoziationsstudien (GWAS), Quantitative Trait Locus (QTL)-Kartierung, genomischer Selektion und Feldversuchen zur Identifizierung relevanter Genotypen für Züchtung und Anbau kombiniert.
Die zweite Arbeit untersucht die phylogeografische Struktur von Kakao unter Verwendung von neun informativen Mikrosatellitenmarkern (Simple Sequence Repeat - SSR) der Chloroplasten-DNA (cpDNA) für 233 Kakaoproben. Neunzehn der dreiundzwanzig identifizierten Chloroplasten-Haplotypen wurden im westlichen Amazonasgebiet beobachtet, darunter sieben geografisch begrenzte Haplotypen, was den Nordwesten Amazoniens als „Hotspot“ für die genetische Vielfalt von Kakao und als Zentrum der Domestizierung von Nutzpflanzen bestätigt. Zwei beobachtete Haplotypen waren von West nach Ost entlang des Amazonasbeckens weit verbreitet, was auf Samenausbreitungsmuster durch den Menschen hindeutet. Beim Vergleich der beobachteten Haplotypen mit zuvor identifizierten genetischen Clustern unter Verwendung nuklearer SSRs wurden spezifische Chloroplasten-Haplotypen innerhalb von acht genetischen Clustern beobachtet. Einen Beweis für die Selektion des Pflanzenmaterials lieferte die Beobachtung eines einzigen Haplotyps, der in den Kakaofarmen West Ecuadors und der wichtigsten Zuchtpopulation der Trinitario-Akzessionen verbreitet ist. Die identifizierten Chloroplasten-Haplotypen können verwendet werden, um die geografische Herkunft von Pflanzmaterial auf einer feineren geografischen Skala zu bestimmen. Darüber hinaus können diese Chloroplasten-Haplotypen in Kombination mit phänotypischen Bewertungen dazu beitragen, geografisch unterschiedliche Sorten für Kakaozüchtungsprogramme auszuwählen.
Die dritte Arbeit analysiert die Populationsstruktur von Wild-, Kultur- und Zuchtpopulationen. Es konnten, agronomische Merkmale unter Selektion identifiziert und wertvolle Kakao-Genotypen aufgedeckt werden, die in Kultur- und Zuchtpopulationen nicht beobachtet wurden. Vierzig publizierte SNPs assoziiert mit Krankheitsresistenz und 11 SNPs mit Ertragsmerkmalen wurden in 367 Akzessionen mit dem MassARRAY-System® untersucht. Die Strukturanalyse ergab vier genetische Cluster. Zwei Cluster waren im bewirtschafteten Kakao überrepräsentiert, welcher durch genetisch gemischte Individuen gekennzeichnet ist, die künstliche Hybriden darstellen. Ein Cluster, der bei bewirtschaftetem Kakao überrepräsentiert ist, hängt mit der Vorliebe für die Beibehaltung des überlegenen Geschmacks von kultiviertem Kakao aus der Criollo-Abstammung zusammen. Eine Krankheitsresistenz gegen die Hexenbesenkrankheit (engl.: Witches’ Broom Disease—WBD) wurde auch bei der Introgression von Wildmaterial beobachtet, das in Peru gesammelt wurde. Bei bewirtschaftetem Kakao konnte eine geringe Verwendung einiger genetischer Akzessionen wie Guyana-Kakao festgestellt werden. Diese Akzessionen zeigen in veröffentlichten agronomischen Bewertungen bessere Ertrags- und Krankheitsresistenzmerkmale gegenüber anderen Sorten/Gruppen. Ertrags- und Krankheitsresistenzmerkmale (hauptsächlich Resistenz gegen WBD) zeigen eine Divergenz zwischen Wild- und Kulturkakao (FST > 0,05). Diese Divergenz spiegelt wahrscheinlich die Selektion während der Domestizierung, Kultivierung und Zucht wider. Die identifizierten SNPs, die eine Divergenz zwischen Wild- und Kulturkakao zeigen, können zur Verbesserung der Selektion in Zuchtpopulationen verwendet werden. Agronomische Auswertungen von Wildpopulationen können die genetische Basis für die Zucht von Kakao erweitern, insbesondere für Merkmale von wirtschaftlicher Bedeutung wie geringer Cadmium-Konzentration in Samen und Krankheitsresistenz gegen Frosty Pod Rot (FPR).