Information

Was ist der Unterschied zwischen Nukleotidpolymorphismus (θ) und Nukleotiddiversität (π)?

Was ist der Unterschied zwischen Nukleotidpolymorphismus (θ) und Nukleotiddiversität (π)?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

In meinem Buch zur Populationsgenetik (siehe Referenz unten) definieren sie sie als:

  • Nukleotidpolymorphismus (θ): Anteil der Nukleotidstellen, von denen erwartet wird, dass sie in jeder Probe der Größe 5 aus dieser Region polymorph sind. Vom Genom. $hat{θ}$ entspricht dem Anteil des in der Probe beobachteten Nukleotidpolymorphismus (S) geteilt durch $a_1 = sum_{i=1}^{n-1} frac{1}{I}$. Wenn n= 5, $a_1 = frac{1}{1}+ frac{1}{2}+ frac{1}{3}+ frac{1}{4}+ frac{1}{ 5}=2.083$
  • Nukleotiddiversität ist der durchschnittliche Anteil der Nukleotidunterschiede zwischen allen möglichen Sequenzpaaren in der Probe. In R habe ich diesen Code entwickelt, der mit dem übereinstimmt, was im Buch steht.

    data # Nur polymorphisms total.snp # Dies ist die Gesamtzahl der untersuchten Seiten (zB könnten 16 von den 500 untersuchten Seiten polymorph sein. Also sind 484 Seiten monomorph) n = nrow(data) # Anzahl der Samples pwcomp = n*(n-1)/2 # Anzahl der paarweisen Vergleiche for(i in 1:n.col){ # Berechne die Anzahl der Differenzen in den polymorphen Samples tv = as.vector(table(data[ ,i])) z = äußere(tv,tv,'*') temp= c(temp,sum(z[lower.tri(z)])) } pi.hat = sum(temp)/(pwcomp*total .snp) # Nb verschiedener paarweiser Vergleiche/(nb alle paarweisen Vergleiche * Gesamtanzahl der Loci (polymorph oder nicht))

Im Buch heißt es

Andererseits gibt es eine theoretische Beziehung zwischen θ und π, die unter der vereinfachenden Annahme erwartet wird, dass die Allele für die natürliche Selektion unsichtbar sind.

Zusammenfassend = π mit dieser Annahme und großen Stichprobengrößen.

  1. Was ist also der Unterschied in der
  2. Warum berechnen wir beide (was könnten sie uns sagen)?

Hartl, D.L. & Clark, A.G. (1997). Prinzipien der Populationsgenetik (3. Aufl.). Sinauer Associates Incorporated.


Sie verwechseln auch die Definition dieser Begriffe mit ihren Erwartungswerten (in der Regel aus der Koaleszenztheorie berechnet). Schauen wir uns ein Beispiel an.

Betrachten Sie eine haploide Population von 6 Individuen. Wir werden diese Personen mit 5 Websites vertreten, die die Werte 0 oder 1 annehmen können.

00000 00001 00000 00010 00010 00000

Polymorphismus

In dieser Population gibt es $S=2$ polymorphe Stellen. Mit anderen Worten, es gibt zwei Standorte, für die verschiedene Individuen unterschiedliche Werte in der Population annehmen. Über diese 5 Stellen beträgt der Anteil der polymorphen Stellen $frac{2}{5}$. Sie verwenden $ heta$ für diese Größe, aber für mich wird $ heta$ normalerweise als kurze Hand für $2 N mu$ verwendet (oder $4 N mu$ für diploide Populationen).

Unter einem unendlichen Allelmodell in einer einzelnen panmiktischen haploiden Population (ohne Selektion und andere Annahmen) ist $E[S] = 2 N mu a$, wobei $a = sum_{i=1}^{k-1} frac{1}{i}$, wobei $k$ die Stichprobengröße ist.

Genetische Vielfalt

Genetische Diversität wird auch als erwartete Heterozygotie bezeichnet. Obwohl es meistens $pi$ genannt wird, werde ich es $H$ nennen, um Verwirrung zu vermeiden. Stellen Sie sich vor, Sie nehmen eine zufällige Stichprobe von zwei Individuen in der Population. Wie groß ist die Wahrscheinlichkeit, dass an einem bestimmten Locus unterschiedliche Allele vorhanden sind?

  • An Ort 1 $H = 0$
  • An Ort 2 ist $H = 0$
  • An Ort 3 ist $H = 0$
  • Am Ort 4 ist $H = 2 frac{2}{5} frac{3}{5} = frac{12}{25}$
  • Am Ort 5 ist $H = 2 frac{1}{5} frac{4}{5} = frac{8}{25}$

Sie können über alle Loci mitteln, wenn Sie möchten.

Die erwartete Heterozygotie in der panmiktischen Population (ohne Selektion und andere Annahmen), $E[H] = frac{4 N mu}{1 + 4 N mu}$. Sie sollten hier eine Beziehung zwischen $H$ und $F_{ST}$ bemerken!

Nukleotid-Diversität

Die Nukleotiddiversität entspricht $D$ von Nei und Li (1979) und ist stark verwandt mit $D_{XY}$ (Nei, 1987). Sobald Sie es geschafft haben zu demonstrieren, dass die erwartete Koaleszenzzeit $N$ beträgt (ich werde die Demonstration hier nicht durchführen), dann beträgt die Anzahl der Fehlpaarungen zwischen zwei Individuen unter einem unendlichen Standortmodell logischerweise $E[D] = 2 N mu$ (es ist die Anzahl der Mutationen, die in beiden Linien seit dem Koaleszenzereignis aufgetreten sind). Für diploide Populationen alles mit 2 multiplizieren.

Verwandtschaft zwischen $D$ und $S$

Unter einem neutralen Modell ist $frac{S}{a} = D$. Tatsächlich wird der Standardisierungsunterschied zwischen $frac{S}{a}$ und $D$ in Tajimas $D$-Tests verwendet.

Informationsquelle

Hartl and Clarck ist IMO gut, aber ich möchte auch empfehlen, Population Genetics: A Concise Guide von Gillespie zu lesen, die all das wunderbar erklären.


Nukleare Genvariation bei wilden braunen Ratten

Obwohl die braune Ratte (Rattus norvegicus) in der gesamten Biologie als Modellsäugetier verwendet wird, ist wenig über die genetische Variation in Wildrattenpopulationen oder die Beziehung häufig verwendeter Inzuchtstämme zu ihren wilden Verwandten bekannt. Wir haben wilde braune Ratten aus dem vermuteten Vorfahren der Art in Nordwestchina und aus einer abgeleiteten Population in Großbritannien entnommen und die Nukleotiddiversität und Populationsunterteilung basierend auf den Sequenzen von 30 autosomalen Protein-kodierenden Loci geschätzt. Die neutrale genetische Diversität betrug in beiden Populationen nahe 0,2 %, was etwa fünfmal niedriger ist als die Diversität an den orthologen Standorten in einer Population von Wildhausmäusen aus dem mutmaßlichen Vorfahren der Art in Indien. Wir fanden eine signifikante Bevölkerungsdifferenzierung zwischen der britischen und der chinesischen Bevölkerung, bewertet von FNS und das Programm STRUKTUR. Basierend auf der synonymen Diversität und Divergenz zwischen der braunen Ratte und der Hausmaus schätzen wir, dass die aktuelle effektive Populationsgröße bei braunen Ratten ungefähr 130.000 beträgt (ca. 95% Konfidenzintervall 85.000-184.000), etwa fünfmal niedriger als bei wilden Hausmäusen.

Die braune Ratte ist das führende Tiermodell in der physiologischen und pharmakologischen Forschung und nach der Hausmaus das am häufigsten untersuchte Modellsäugetier in der Genetik. Über die Herkunft von Inzuchtrattenstämmen oder die genetische Verwandtschaft zwischen Inzuchtstämmen und Wildratten ist jedoch wenig bekannt. Untersuchungen des mitochondrialen Genoms (Brown und Simpson 1981 Li et al. 1999 Lin et al. 2012), Allozyme (Bender et al. 1985 Cramer et al. 1988) und zufällig amplifizierte polymorphe DNA-Marker (Jiang et al. 2005) weisen auf das Vorhandensein einer beträchtlichen genetischen Vielfalt in wilden braunen Rattenpopulationen hin. Es wurde über geografische Variationen für morphologische Merkmale in chinesischen Populationen berichtet (Wu 1982), und vier Unterarten wurden auf der Grundlage der Variation in der Morphologie erkannt (Wu 1982 Wilson und Reeder 2005). Das Ausmaß der genetischen Variation in nuklearen Genen und das Ausmaß der geografischen Differenzierung zwischen Populationen in der Natur sind jedoch nicht bekannt.

Es gibt wesentlich mehr Informationen über die genetische Diversität unter ingezüchteten Laborrattenstämmen. Vermessungen von Mikrosatelliten (Canzian 1997 Thomas et al. 2003) und Einzelnukleotidpolymorphismen [SNPs (Smits et al. 2004 STAR Consortium 2008)] legen nahe, dass Inzuchtstämme genetisch vielfältig sind und sich von Brown-Norwegen-Stämmen unterscheiden, von denen angenommen wird, dass sie die engsten verwandten Stämme mit wilden braunen Ratten sind (Thomas et al. 2003). Brown Norway ist der Referenzstamm für das Rattengenomprojekt (Gibbs et al. 2004). Rattus Arten stammen höchstwahrscheinlich aus Südostasien, dem Zentrum der aktuellen Artenvielfalt der Ratten (Rowe et al. 2011). Rattus norvegicus Es wird angenommen, dass sie sich in den Ebenen Asiens in NW China und der Mongolei entwickelt haben, wo wilde braune Ratten noch in ihrem vermutlich heimischen Lebensraum gefunden werden. Obwohl die schwarze Ratte (Ratrrus rattus) ist in Europa aus der Antike bekannt (Barnett 2001), R. norvegicus vermutlich erst viel später, vermutlich zwischen dem 16. und 18. Jahrhundert, Europa erreicht hat, von wo aus es sich weltweit verbreitet und weitgehend verdrängt hat R. rattus in gemäßigten Regionen.

Im Gegensatz zu Wildratten gibt es bei Wildhausmäusen viele Informationen über die genetische Vielfalt (Muskulatur). Unterarten der Hausmaus variieren in ihrer mittleren Nukleotiddiversität (Baines und Harr 2007 Salcedo et al. 2007) und das Ausmaß des Genflusses zwischen den verschiedenen Unterarten variiert über das Genom (Teeter et al. 2008). Die Diversität der nuklearen Gene ist am größten in Populationen aus ihren mutmaßlichen Vorfahren, die in den Fällen Iran und NW Indien sind M. m. domestiziert und M. m. Castaneus(Baines und Harr 2007). Es wird auch angenommen, dass NW Indien das angestammte Verbreitungsgebiet des gesamten Artenkomplexes ist (Din et al. 1996). Vielfalt aus dem mutmaßlichen Ahnenbereich von M. m. muskulös (NW-Afghanistan) ist derzeit unbekannt (Baines und Harr 2007). Synonyme Site-Diversität von proteinkodierenden Genen in M. m. castaneus und M. m. domestiziert Ahnenpopulationen ist mehr als acht- bzw. dreifach größer als in menschlichen Populationen beobachtet [(Baines und Harr 2007 Halligan et al. 2010) DL Halligan, A. Kusathanas, RW Ness, B. Harr, L. Eöry, H. Li, TM Keane, DJ Adams und PD Keightley, unveröffentlichte Ergebnisse], vermutlich eine Folge einer wesentlich höheren effektiven Populationsgröße bei wilden Mäusen. Wir erwarteten daher ein ähnliches Muster bei braunen Ratten, wobei die Diversität bei Individuen aus dem Vorfahrenbereich am größten ist und die Gesamtdiversität mit Mäusen vergleichbar ist, unter der Annahme, dass die effektive Populationsgröße der Rattenvorfahren wahrscheinlich sehr groß war. Hier berichten wir über die erste Untersuchung der nuklearen Gensequenzdiversität bei wilden braunen Ratten. Wir sequenzierten 30 autosomale Loci in einer Stichprobe von Individuen aus dem vermuteten Vorfahren der Art in NW China und aus einer abgeleiteten Population in Großbritannien.


Analysen des Sequenzpolymorphismus und der Haplotyp-Diversität von BELAUBT Gene zeigten eine Selektion nach der Domestikation in den chinesischen Elite-Maisinzuchtlinien

Die Selektion nach der Domestikation bezieht sich auf die künstliche Selektion an den Loci, die wichtige agronomische Merkmale während des Prozesses der genetischen Verbesserung in einer Population kontrolliert. Die Mais-Gene Zfl1 und Zfl2, doppelte Orthologe von Arabidopsis LEAFY, sind wichtige Regulatoren bei der Pflanzenverzweigung, dem Blütenstand und der Blütenentwicklung sowie der Reproduktion. In dieser Studie wurden die vollständigen Gensequenzen von Zfl1 und Zfl2 aus 62 chinesischen Elite-Inzuchtlinien wurden amplifiziert, um ihre Nukleotidpolymorphismen und Haplotyp-Diversitäten zu bewerten. Aus den vollständigen Sequenzen von wurden insgesamt 254 und 192 Varianten identifiziert, die SNPs und Indels enthielten Zfl1 und Zfl2, bzw. Obwohl gefunden wurde, dass die meisten Varianten in den nicht-kodierenden Regionen lokalisiert sind, wurden die Polymorphismen der CDS-Sequenzen klassifiziert Zfl1 in 16 Haplotypen, die für 16 verschiedene Proteine ​​kodieren und Zfl2 in 18 Haplotypen, die für acht verschiedene Proteine ​​kodieren. Die Population von Huangzaosi und ihre abgeleiteten Linien zeigten statistisch signifikante Signale der Selektion nach der Domestikation auf der Zfl1 CDS-Sequenzen sowie geringerer Nukleotidpolymorphismus und Haplotyp-Diversität als der gesamte Satz. Allerdings ist die Zfl2 Locus wurde nur in der heterotischen Gruppe Reid ausgewählt. Weitere Beweise zeigten, dass mindestens 17 Rekombinationsereignisse zu den genetischen und Haplotyp-Diversitäten an der Zfl1 Locus und 16 Rekombinationsereignisse im Zfl2 Ort.


Nukleotiddiversität und Assoziationsgenetik von Xyloglucan-Endotransglycosylase/Hydrolase (XTH)- und Cellulosesynthase (CesA)-Genen in Neolamarckia cadamba

1283 bp) und CesA (778 bp) DNA-Sequenzen und assoziiert diese SNPs weiter mit der grundlegenden Holzdichte. Primer wurden entworfen, um die partiellen XTH- und CesA-Gene von 15 N. cadamba-Bäumen zu flankieren. Die amplifizierten DNA-Fragmente wurden sequenziert und die grundlegenden Holzdichtemessungen wurden für jeden Baum bestimmt. Die Sequenzvariationsanalysen ergaben, dass in 15 partiellen genomischen DNA-Sequenzen von NcXTH1 bzw. NcCesA1 34 SNPs (2,65 % Vorkommen) und 3 SNPs (0,39 % Vorkommen) gefunden wurden. Alle SNPs wurden sowohl in Exon- als auch in Intronregionen entdeckt. Die untersuchten NcXTH1-Stellen zeigten im Vergleich zu NcCesA1 (π = 0,00127 θ w = 0,9226) höhere Nukleotiddiversitäten von π = 0,00402 und θ w = 8,919. Die LD zerfiel langsam mit dem Abstand der polymorphen Stellen in einem linearen Muster mit einem mittleren R 2 -Wert von 0,000687. Eine Assoziationsgenetikstudie zeigte, dass 2 SNPs von NcXTH1-Genen signifikant mit der grundlegenden Holzdichte (p<0,05) von N. cadamba assoziiert waren. Sobald die Gen-assoziierten SNP-Marker in NcXTH1-Genen validiert sind, könnte es möglicherweise als Werkzeug bei der Gen-Assisted Selection (GAS) von N. cadamba-Bäumen verwendet werden. Diese Studie hat auch gezeigt, dass die auf Kandidatengenen basierende Assoziationsgenetik ein leistungsfähiger Ansatz ist, um komplexe adaptive Merkmale von Organismen zu sezieren, denen eine Genomsequenz oder genomische Referenzressourcen fehlen.

S. Y. Tiong, W. S. Ho, S. L. Pang und J. Ismail, 2014. Nukleotiddiversität und Assoziationsgenetik von Xyloglucan-Endotransglycosylase/Hydrolase (XTH) und Cellulosesynthase (CesA) Genen in Neolamarckia cadamba. Journal of Biological Sciences, 14: 267-275.

Neolamarckia cadamba oder lokal bekannt als Kelampayan ist eine der immergrünen und schnell wachsenden tropischen Waldbaumarten aus der Familie der Rubiaceae (Joker, 2000). Diese Art ist natürlich in Indien, Pakistan, Sri Lanka, Burma, Malaysia, Kambodscha, Thailand und Laos verbreitet. Das Holz wird zur Herstellung von Sperrholz, Zellstoff, Papier, Kisten, Möbeln und mehr verwendet. Darüber hinaus diente N. cadamba auch als Heilpflanze für die traditionelle Aushärtung unter Verwendung von Blatt, Rinde und Dach (Patel und Kumar, 2008 Mondal et al., 2009 Bussa und Pinnapareddy, 2010). Trotz seines hohen wirtschaftlichen Wertes sind Studien zu N. cadamba auf molekularer Ebene bisher noch begrenzt. Kürzlich wurde eine Kelampayan-Baum-Transkriptom-Datenbank (NcdbEST) eingerichtet, um Forschern nützliche Genomikinformationen und Ressourcen zur Verfügung zu stellen, um die genomischen Grundlagen von N. cadamba eingehend zu erforschen (Ho et al., 2010).

Die molekulare Untersuchung von Holz ist wichtig, um das grundlegende Studium der Holzbiologie und -genetik zu entwickeln, um ‘Designerholz’ oder Holz mit den gewünschten Eigenschaften herzustellen. DNA-Marker werden heute häufig in der molekularen Charakterisierung verwendet, da DNA-Marker Sorten, Provenienzen oder Genotypen präzise charakterisieren und die Messung genetischer Verwandtschaften ermöglichen (Narayanan et al., 2007 Lau et al., 2009). Assoziationsgenetik ist der Ansatz, der statistische Assoziationen zwischen phänotypischen Merkmalsvariationen und allelischem Polymorphismus in Zielgenen identifiziert. Die Assoziationsstudien an Pflanzen sind im Allgemeinen Highlights in der Nutzung einer breiten Palette von kommerziellen und Fitnessmerkmalen, die mit den gut charakterisierten Kandidatengenen kartiert wurden. Beispielsweise wurden bei Mais Kandidatengene mit der Verdaulichkeit (Guillet-Claude et al., 2004), der Maysin-Synthese (Szalma et al., 2005) und der Kornzusammensetzung und der Stärkeproduktion (Wilson et al., 2004) in Verbindung gebracht. Bei Waldbaumarten war Eukalyptus die erste Studie, die durchgeführt wurde, um die Beziehung zwischen dem Mikrofibrillenwinkel und dem Cinnamoyl-CoA-Reduktase (CCR)-Gen unter Verwendung des SNP-Assoziationsansatzes zu finden (Thumma et al., 2005). Die erste assoziationsgenetische Studie mit Multigenen in Waldbaumarten, Pinus radiata, wurde mit 58 SNPs aus 20 Holz- und dürrebedingten Kandidatengenen durchgeführt (Gonzalez-Martinez et al., 2007). Dillonet al. (2010) untersuchten auch die allelische Variation, die die Holzeigenschaften von Pinus radiata beeinflusst, unter Verwendung von 36 Zellwand-Kandidatengenen. Gen-assoziierte SNPs, die in Cinnamat-4-Hydroxylase (C4H)- und Cinnamylalkohol-Dehydrogenase (CAD)-Genen von Acacia mangium gefunden wurden, zeigten auch ihre signifikante Beziehung zu Holzdichte, spezifischem Gewicht und Zellwanddicke (Tchin et al., 2011).

SNP ist der am häufigsten verwendete molekulare Marker der neuen Generation in Züchtungsprogrammen, da es als die am häufigsten vorkommende Ressource für . gilt genetische Variation s-Studien und sind über das gesamte Genom verteilt (Halushka et al., 1999, Kwok et al., 1994). Gemäß Wang et al. (1998) treten SNPs einmal alle 500-1000 bp auf, wenn zwei Chromosomen verglichen werden. Andere Schätzungen schließen auch ein, dass ein SNP alle 100–300 bp in jedem Genom auftritt (Gupta et al., 2001). Es wird angenommen, dass SNP im Vergleich zu anderen Markersystemen eine relativ stabile Vererbung aufweist. SNP mit der niedrigen Mutationsrate macht es zu einem ausgezeichneten Marker, um komplexe genetische Merkmale wie die Holzbildung zu untersuchen und als Werkzeug zum Verständnis der Genom-Evolution (Syvanen, 2001). SNP wird auch bevorzugt verwendet, da es als direkter Marker dient, wobei die Sequenzinformation über die genaue Natur der allelischen Variante bereitgestellt wird (Gupta et al., 2001). Technologische Verbesserungen haben SNP und Indel zu attraktiven Markern für die Marker-unterstützte Hochdurchsatz-Züchtung, EST-Kartierung und die Integration genetischer und physikalischer Karten gemacht (Nasu et al., 2002 Rafalski, 2002 Gonzalez-Martinez et al., 2007 Ibitoye and Akin-Idowu, 2010 Thomson et al., 2010).

Holz besteht aus sekundären Xylemgeweben und besitzt einen chemischen Komplex aus Zellulose, Lignin, Hemizellulose und Extrakten. Der Synthese- und Entwicklungsprozess von Zellwänden ist bei der Holzbildung sehr wichtig. Xyloglucan-Endotransglycosylase/Hydrolase (XTH) und Cellulosesynthase (CesA) sind zwei Schlüsselproteine, die in primären bzw. sekundären Zellwänden eine wesentliche Rolle spielen. CesA-Proteine ​​katalysieren die Cellulosepolymerisation (Somerville, 2006) und wirken vermutlich als zentraler Katalysator bei der Erzeugung von pflanzlicher Zellwandbiomasse (Kumar et al., 2009). XTH wird als Schlüsselmittel zur Regulierung der Zellwandexpansion angesehen und es wird angenommen, dass es für den Einbau von neu synthetisiertem Xyloglucan (XG) in die Wandmatrix verantwortlich ist (Darley et al., 2001).

Die Auswahl hochwertiger Holzmerkmale in der frühen Phase ist wichtig, um qualitativ hochwertige Hölzer zu niedrigen Kosten (Anfangsmodalität), Energie (Arbeit) und Flächenverbrauch zu produzieren, um den kommerziellen Wert zu maximieren. Assoziationsgenetik wird zu einem der effektivsten Ansätze, um den Zusammenhang zwischen genetischer Variation und Phänotyp zu identifizieren. Daher kann die Identifizierung von genassoziierten SNPs, die mit den Holzeigenschaften (Basisholzdichte) korrelieren, in einem markergestützten Züchtungsprogramm für Plantagenansiedlungen von Vorteil sein. Daher waren die Ziele dieser Studie, SNPs in der partiellen genomischen DNA-Sequenz von XTH- und CesA-Genen zu identifizieren und die genetische Assoziation von XTH- und CesA-Genen mit der grundlegenden Holzdichte von N. cadamba zu identifizieren.

Pflanzenmaterial: Insgesamt 15 Kelampayan-Bäume wurden im Oktober 2011 zufällig aus den natürlichen Beständen in Kota Samarahan, Sarawak, Malaysia ausgewählt. Die inneren Rindenprobleme wurden gesammelt und die gesamte genomische DNA wurde unter Verwendung eines modifizierten Doyle- und Doyle-Protokolls (1990) isoliert . Die isolierte DNA wurde unter Verwendung des Wizard Genomic DNA Purification Kit (Promega, USA) gemäß dem Protokoll des Herstellers gereinigt.

PCR-Amplifikationen: Ein Primerpaar, das die Flanke der vollständigen kodierenden Sequenz in genomischer XTH-DNA umfasst, wurde basierend auf der NcXTH1-cDNA voller Länge (GenBank-Zugangsnummer: JX134619) entworfen. Für das CesA-Gen wurde ein Primerpaar, das partielle genomische DNA flankiert, die die HVRII-Region umfasst, basierend auf der vollständigen kodierenden Sequenz von NcCesA1 (GenBank-Zugangsnummer: JX134621) entworfen. Alle Primer wurden mit der Primer Premier 5.0-Software (PREMIER Biosoft International, USA) entworfen, wie in Tabelle 1 gezeigt ), 1,5 mM MgCl 2 , jeweils 10 pmol Vorwärts- und Rückwärtsprimer, 1,0 U Taq DNA-Polymerase (Invitrogen, Brasilien) und 30 ng DNA-Matrize. Das Temperaturwechselprofil wurde bei 94 °C für 2 Minuten, 35 Zyklen bei 94 °C für 30 Sekunden, 57 °C (XTH-Amplifikation) oder 64 °C (CesA-Amplifikation) für 45 Sekunden, 72 °C für 30 Sekunden und schließlich Verlängerung bei 72 °C für 7 Minuten programmiert.

Klonierung und Sequenzierung: Amplikons wurden unter Verwendung des QIAquick ® Gel Extraction Kit (QIAGEN, Deutschland) gereinigt und in das pGEM ®-T Easy Vector System (Promega, USA) ligiert. Klone mit gezielten Inserts wurden identifiziert, indem eine Kolonie-PCR unter Verwendung des universellen M13-Primerpaars durchgeführt wurde. Plasmide positiver Klone wurden unter Verwendung des Wizard Plus SV Minipreps DNA Purification Systems (Promega, USA) isoliert. Gereinigte Plasmide wurden dann zur Sequenzierung unter Verwendung eines 3730 xl DNA Analyzer (Applied Biosystem, USA) geschickt.

Sequenzvariationsanalyse: Basenaufruf- und Vektorsequenzen wurden unter Verwendung von Chromas Version 2.33 (Technelysium, AU) entfernt. Jede der Sequenzen wurde verifiziert und auf ihre Homologie unter Verwendung von BLASTn, bereitgestellt von NCBI, überprüft. Die Sequenzen wurden unter Verwendung der Software CLC Main Workbench Version 5.0 (CLC bio, Dänemark) ausgerichtet, um Einzelnukleotidpolymorphismen zu identifizieren. Alle dann detektierten Sequenzpolymorphismen wurden visuell erneut anhand von Chromatogrammen überprüft. Später wurden die offenen Leserahmensequenzen für jedes Gen in . übersetzt Aminosäure Sequenzen mithilfe des ExPASy-Übersetzungstools (http://web.expasy.org/translate/). Das Proteinsequenz-Alignment wurde unter Verwendung der CLC Main Workbench Version 5.0 (CLC bio, Dänemark) durchgeführt, um die synonymen und nicht-synonymen Mutationen zu bestimmen.

Grundlegende Holzdichtemessung: Holzkerne von 5 mm Durchmesser und 8 cm Länge wurden aus dem Stamm von jedem ausgewählten N. cadamba-Bäumen unter Verwendung eines Stufenbohrers in einer Höhe von etwa 1,3-1,4 m entnommen. Für jede Probe wurde eine Wiederholung genommen. Holzkerne wurden in unterschiedlich gekennzeichneten Röhrchen aufbewahrt, die auf Eis gelegt wurden, um die konstante Feuchtigkeit für die Messung des Grünwertes aufrechtzuerhalten. Das Grünvolumen jedes Holzkerns wurde durch Messen des im Holzkern verdrängten Wassers genommen. Nach dem Satz von Phytagora hat Wasser eine Dichte von 1. Daher ist das gemessene Gewicht des verdrängten Wassers gleich dem Volumen der Probe. Das Ofentrockengewicht wurde von derselben Probe gemessen, indem sie in einem gut belüfteten Ofen bei 103 °C getrocknet wurde, bis sie ein konstantes Gewicht erreichte (Chave, 2005). Die Basisholzdichte wurde als Ofentrockengewicht pro Grünvolumen berechnet.

Nukleotiddiversitäts- und Assoziationsgenetikanalyse: Die Software DNA Sequence Polymorphism Version 5 (DnaSP v.5.0) (Librado und Rozas, 2009) wurde verwendet, um die durchschnittliche Anzahl der Nukleotiddiversität pro Standort (π), θ Werte pro Standort . zu schätzen , synonyme und nicht-synonyme Nukleotidpolymorphismen und Tajimas D-Test. Die von DnaSP durchgeführten statistischen Tests umfassen nicht die Insertions- und Deletionsstellenmutationen. TASSEL Version 3.0 (Bradbury et al., 2007) wurde verwendet, um den R 2 -Wert zu berechnen, um die Korrelation von SNPs zu bestimmen. Der Graph des Kopplungsungleichgewichts (LD) wurde unter Verwendung von R 2 -Werten gegen paarweise polymorphe Nukleotidabstände aufgetragen. Das allgemeine lineare Modell (GLM) wurde auch unter Verwendung eines 1.000-Permutationstests für jeden SNP in Bezug auf die grundlegende Holzdichte getestet. SNPs, die einen p-Wert von weniger als 0,05 erzielten, wurden als signifikant mit ihrem Merkmal assoziiert angesehen.

SNP-Entdeckung: In NcXTH1-Genen wurden insgesamt 34 SNPs gefunden (

1.290 bp), was einem SNP pro 38 bp entspricht (2,65% Vorkommen). Ähnliche Werte von SNP-Frequenzen wurden in anderen Studien gefunden. Tchinet al. (2012) zeigten, dass in N. cadamba alle 59 bp im C4H-Gen ein SNP vorkommt. Krutovsky und Neale (2005) fanden auch heraus, dass in 18 Douglasienholzqualitätskandidatengenen ein SNP in jeweils 46 bp vorhanden ist. Eine andere Studie, die 35 Zellwandverbindungsgene verwendet, verzeichnete alle 54 bp einen SNP (Kelleher et al., 2012). Der große Unterschied des SNP-Vorkommens könnte auf die Unterschiede in der Art und Anzahl der verwendeten Proben zurückzuführen sein. In einer Studie von Dillon et al. (2010) wurde ein SNP in allen 466 bp des XTH-Gens mit nur fünf Proben von Pinus radiate aufgezeichnet.

Von den 34 polymorphen Stellen befanden sich 20 Substitutions-SNPs und 3 Indels in den kodierenden Regionen (Exons) und weitere 9 Substitutions-SNPs sowie 2 Indels befanden sich in den nicht-kodierenden Regionen (Introns und untranslatierte Regionen). In dieser Studie wurde mehr Sequenzpolymorphismus in der kodierenden Sequenz (856 bp) gefunden, da die Anzahl der untersuchten Stellen länger war als die der nicht kodierenden Region (434 bp). Allerdings war die SNP-Frequenz in der nicht-kodierenden Region etwas höher (39 bp/SNP) als in der kodierenden Region (37 bp/SNP). Insgesamt waren 24 von 34 (71%) der SNPs in NcXTH1 Singletons (Locus mit nur einer Sequenz, die ein mutiertes Nukleotid zeigt), von denen die meisten in Exons lokalisiert waren (Tabelle 2). In der vollständigen DNA-Sequenz von NcXTH1 wurden nur 5 aufschlussreiche SNPs (Locus mit zwei oder mehr Sequenzen, die eine Nukleotidvariante besaßen) gefunden.

Es wurde festgestellt, dass genomische NcXTH1-DNA voller Länge eine gleiche Anzahl von synonymen und nicht-synonymen SNPs mit einem Anteil von jeweils 0,060 aufweist. Obwohl die meisten nicht-synonymen SNPs in der kodierenden Region gefunden wurden, war das Auftreten von nicht-synonymen SNPs in der nicht-kodierenden Region am höchsten (1,84%). Die Nukleotiddiversität in NcXTH1 war parallel zu den Ergebnissen von Krutovsky und Neale (2005), wo die meisten SNPs Singletons waren, synonym und meist in der nicht-kodierenden Region in 18 holzqualitätsbezogenen Kandidatengenen in Douglasien gefunden. Die meisten SNPs wurden durch Übergangsmutationen (71 %) verursacht, insbesondere durch die A-G-Substitution (Tabelle 2). Eine Studie von Tchin et al. (2012) zeigt auch eine höhere Häufigkeit von Übergangsmutationen (55%) in anderen zwei Holzbildungs-Kandidatengenen, Cinnamat-4-Hydroxylase (C4H) und Cinnamylalkohol-Dehydrogenase (CAD) in N. cadamba. Tchinet al. (2011) fanden auch heraus, dass A-G-Übergangsmutationen häufig (83%) in partiellen DNA-Sequenzen von CAD in A. mangium Superbulk-Bäumen gefunden wurden.

Die Häufigkeit von SNP in partiellen DNA-Sequenzen des NcCesA1-Gens war niedriger als in NcXTH1, wobei alle 259 bp ein SNP nachgewiesen wurde. Es wurde vorhergesagt, dass das SNP-Vorkommen des CesA-Gens in N. cadamba niedriger ist als das SNP, das in CesA1 von Shorea parvifolia gefunden wurde, wo ein SNP in allen 115 bp DNA-Sequenzen mit nur der Verwendung von fünf Proben nachgewiesen wurde (Seng et al., 2011) . Andererseits zeigte NcCesA1 eine höhere SNP-Frequenz als in CesA-Genen von Pinus radiate. Dillonet al. (2010) berichteten, dass in allen 403 bzw. 374 bp DNA-Sequenzen von CesA1 bzw. CesA3 in Pinus radiate ein SNP nachgewiesen wurde. In dieser Studie wurde eine sehr niedrige SNP-Frequenz in der kodierenden Region nachgewiesen, wobei nur 1 SNP in jeweils 531 bp nachgewiesen wurde.

Tabelle 3 zeigt die Zusammenfassung der SNP-Verteilung in partiellen NcCesA1-DNA-Sequenzen (778 bp). Insgesamt drei in NcCesA1 gefundene SNPs wurden durch eine Substitutionsmutation verursacht und es wurde kein Indel nachgewiesen. Zwei von drei SNPs befinden sich in nicht-kodierenden Regionen. Umgekehrt mit NcXTH1 wurden mehr Transversions-SNPs in NcCesA1 gefunden, wobei jeweils eine G-C- und G-T-Substitution nachgewiesen wurde. Alle drei SNPs, die in NcCesA1-Teil-DNA-Sequenzen gefunden wurden, waren synonym mit einer höheren Häufigkeit in der nicht-kodierenden Region (0,80%). In der Zwischenzeit wurde nur ein Singleton-SNP im Exon von NcCesA1 gefunden, während zwei sparsame informative SNPs in den nicht-kodierenden Regionen gefunden wurden.

Nukleotid-Diversitätsanalyse: Die statistische Sequenzanalyse von NcXTH1 und NcCesA1 unter Verwendung der Software DnaSP v.5.0 (Librado und Rozas, 2009) wurde an allen Sequenzen (Sites) unter Ausschluss von Lücken und fehlenden Daten untersucht. In der gesamten Berechnung und Analyse wurde Indels nicht berücksichtigt. Die Ausrichtung von 15 NcXTH1-Volllängen-DNA-Sequenzen enthielt 13 Stellen mit Ausrichtungslücken und somit wurden 1.277 von 1.290 Stellen von NcXTH1-Volllängen-DNA-Sequenzen untersucht. Im NcCesA1-Teil-DNA-Sequenz-Alignment wurde keine Lücke gefunden und alle 778 Stellen wurden in die Analyse eingeschlossen. Die Nukleotiddiversität, der Tajima-Test und die minimale Anzahl von Rekombinationsereignissen von NcXTH1 und NcCesA1 sind in Tabelle 4 zusammengefasst.

Nukleotiddiversität (π) ist die durchschnittliche Anzahl von Nukleotidunterschieden pro Stelle zwischen zwei Sequenzen und der Populationsmutationsparameter wird durch θ dargestellt. Die Nukleotiddiversität von 15 DNA-Sequenzen von NcXTH1 wurde auf 0,00402 bzw. 0,00127 als höher als die von NcCesA1 geschätzt. Insgesamt waren alle θ-Werte pro Stelle, die aus der Anzahl der Nukleotiddiversität (π), der Gesamtzahl der Mutationen (n) oder der polymorphen Stellen (S) in NcXTH1 berechnet wurden, viel höher als in NcCesA1 (Tabelle 4) . Der θ Wert pro Sequenz, geschätzt aus S(θ w ) von NcXTH1 (8,919) war fast 10-fach höher als in NcCesA1 (0,9226). Dies wurde durch die höhere Häufigkeit von SNP bei NcXTH1 als bei NcCesA1 verursacht. Es wurde vorhergesagt, dass der θw-Wert beider untersuchten Gene in N. cadamba viel höher ist als bei anderen holzbezogenen Kandidatengenen, die einen θw-Wert unter 0,02 erreichten (Brown et al., 2004, Krutovsky und Neale, 2005).

Die D-Statistik von Tajima spiegelt den Unterschied zwischen Nukleotiddiversität, π und Theta (θ) pro Sequenz aus der Anzahl der polymorphen Stellen (S), θ w wider. Der Wert von D wird beim Gleichgewicht zwischen genetischer Drift und selektiv neutraler Mutation nahe Null erwartet (Brown et al., 2004). In NcXTH1 zeigten fast alle SNPs einen signifikanten D-Wert von Tajima (weniger als 0,05), mit Ausnahme derjenigen an stillen (synonymen und nicht kodierenden) Stellen. Die negativen Werte (-1,667 bis -2,008) zeigen an, dass sich ein Überschuss an niederfrequenten Varianten im NcXTH1-Gen segregiert. In ähnlicher Weise waren die meisten D-Werte von Tajima in holzqualitätsbezogenen Kandidatengenen bei Pseudotsuga menziesii (Krutovsky und Neale, 2005) und bei Pinus taeda (Brown et al., 2004) negativ. Im Gegensatz zu NcXTH1 zeigten alle in NcCesA1 getesteten D-Werte von Tajima mit einem positiven Gesamtwert von 0,2187 keine signifikanten Ergebnisse.

Kopplungsungleichgewicht (LD): Eine beträchtliche Menge an Kopplungsungleichgewicht (LD) wurde in NcXTH1- und NcCesA1-Sequenzen unter Verwendung der TASSEL-Software gefunden (Bradbury et al., 2007). Von den untersuchten Standorten wurden insgesamt 496 paarweise Vergleiche geschätzt. Mehr als 80 % der gepaarten Standorte zeigten in einem zweiseitigen Fisher’s Exact-Test eine statistisch signifikante LD. Es wurden R 2 -Werte berechnet, die die Korrelation zwischen Allelen an zwei Loci darstellen und für die Bewertung der Auflösung von Assoziationsansätzen informativ sind (Bradbury et al., 2007). In dieser Studie betrug der mittlere R 2 -Wert für 496 LD-Schätzungen 0,000687. Der durchschnittliche R 2 -Wert von N. cadamba war viel niedriger als bei einer anderen Holzart Balsampappel (0,52 Olson et al., 2010) und bei Sojabohnen (0,36 Zhu et al., 2003).

Gemittelt über alle Loci wurde ein merklicher Abfall von LD auf die Werte <0,10 innerhalb von 350 bp nachgewiesen, wenn R 2 gegen den Abstand zwischen Stellen in Basenpaaren für NcXTH1- und NcCesA1-sequenzierte Genfragmente aufgetragen wurde ( 1 ). Im Vergleich zu anderen Arten zeigt N. cadamba keinen signifikanten Zerfall, wenn nur zwei Gene für die LD-Schätzung verwendet wurden. Nukleotidstudien an anderen Arten zeigten, dass LD zu mehr als 50 % abgebaut wurde, einschließlich Loblolly-Kiefer (Brown et al., 2004), Sojabohne (Zhu et al., 2003) und Douglasie (Krutovsky und Neale, 2005). Laut einer Studie von Nordborg (2000) zerfällt LD bei auskreuzenden Arten im Vergleich zu sich selbst befruchtenden Arten schneller, da die Rekombination bei auskreuzenden Arten effektiver ist.

Grundholzdichte: Der Durchmesser in Brusthöhe (dbh) von N. cadamba-Bäumen lag im Bereich von 24,0 cm bis 102,0 cm mit einem Durchschnitt von 39,2 cm (Tabelle 5). Die meisten N. cadamba-Bäume haben einen Durchmesser zwischen 24,0 und 50,0 cm, mit Ausnahme der Probe NcMT1 (102,0 cm). Das Grüngewicht, das Ofentrockengewicht und das Grünvolumen jedes Replikats wurden genommen und aufgezeichnet, um die mittlere Holzgrunddichte zu berechnen. Im Durchschnitt betrug die Grundholzdichte von N. cadamba 368,93 kg m -3 . Die Holzprobe NcMT1 zeigte die höchste Grunddichte (444,03 kg m -3 ), während NcHT4 die niedrigste (300,25 kg m -3 ) von 15 Proben aufwies.

Die Grunddichte wurde bestimmt, weil sie eines der wichtigsten Kriterien in Züchtungsprogrammen zur Bewertung des Holzpotenzials für die Zellstoff-, Papier- oder Holzindustrie ist (Seca und Domingues, 2006).

Assoziationsgenetische Studie: Von 34 in NcXTH1 nachgewiesenen SNPs zeigten zwei (SNP8 und SNP29) eine signifikante Assoziation (p<0,05) mit der Grundholzdichte an Position 118 bzw. 1.173 bp (Abb. 2). Beide Marker befanden sich in Exons und wurden durch eine synonyme T-C-Übergangsmutation verursacht. Keiner der nicht-synonymen SNP war signifikant mit der Grunddichte assoziiert. Die assoziierten SNP8 und SNP29 wurden im Einzelbaum NcMT1 gefunden, der die höchste Holzdichte (444,03 kg m -3 ) aufwies. Eine ähnliche Studie wurde auch zur Assoziation von SNP-Markern in zwei weiteren Holzkandidatengenen (C4H und CAD) mit der grundlegenden Holzdichte durchgeführt (Tchin et al., 2011, 2012). In dieser Studie wurde auch festgestellt, dass zwei SNPs signifikant mit der grundlegenden Holzdichte von N. cadamba und A. mangium assoziiert sind. Dies unterstützt die Ergebnisse, dass SNP8 und SNP29 potenziell zu SNP-Markern für eine überlegene N. cadamba-Baumselektion entwickelt werden könnten, sobald sie in der Zukunft validiert sind.

Frühere Studien haben gezeigt, dass ein starker Zusammenhang zwischen holzqualitätsbezogenen Kandidatengenen und den Holzeigenschaften besteht (Plomion et al., 2000 Wegrzyn et al., 2010 Tchin et al., 2011, 2012). Plomionet al. (2000) hatten gezeigt, dass das Wachstum von Seekiefern durch den biochemischen Gehalt, wie Lignin- und Zellulosegehalt, beeinflusst wird, wobei dieser chemische Gehalt durch seine Genetik kontrolliert wird. Assoziationsgenetik von Merkmalen, die die Lignin- und Zellulosebiosynthese in P. trichocarpa kontrollieren, wurde auch durch den schnellen Zerfall der LD innerhalb der Gene (SuSy1 und C4H1) und die hohe Abdeckung von Amplikons über jedes Gen hinweg gezeigt (Wegrzyn et al., 2010). Diese Daten spiegelten wider, dass zahlreiche identifizierte Polymorphismen in unmittelbarer Nähe zu den verursachenden SNPs liegen.

Zusammenfassend hat diese Studie gezeigt, dass die Assoziationsgenetik ein wirksames Werkzeug ist, um natürlich vorkommende allelische Variationen in Genen zu entdecken, die mit wirtschaftlich wichtigen Merkmalen assoziiert sind, indem die genetische Variation auf Bevölkerungsebene.

Das im XTH-Gen von N. cadamba identifizierte Gen-assoziierte SNP könnte möglicherweise als Werkzeug für die Gen-Assisted Selection (GAS) von N. cadamba verwendet werden, nachdem es in Züchtungsprogrammen validiert wurde, um hochwertiges Pflanzmaterial mit schnellerem Wachstum und hoher Ertrag und hohe Holzqualität sowie an die örtlichen Gegebenheiten angepasst, so dass wir wirtschaftliche Vorteile von großer Bedeutung erzielen können.

Die Autoren danken allen an diesem Forschungsprojekt beteiligten Laborassistenten und Förstern für ihre hervorragende Feldunterstützung bei der Probenentnahme. Diese Studie ist Teil des gemeinsamen Industrie-Universitäts-Partnerschaftsprogramms, einem von der Sarawak Forestry Corporation und der Universiti Malaysia Sarawak finanzierten Forschungsprogramm (Grant No. 02(DPI09)832/2012(1)), RACE/a(2)884/ 20121(02) und GL(F07)/06/2013/STA-UNIMAS(06)).

2: Brown, G. R., G. P. Gill, R. J. Kuntz, C. H. Langley und D. B. Neale, 2004. Nukleotiddiversität und Kopplungsungleichgewicht in Loblolly-Kiefer. Proz. Natl. Akad. Wissenschaft USA., 101: 15255-15260.
CrossRef | Direktlink |

3: Bussa, S. K. und J. Pinnapareddy, 2010. Antidiabetische Aktivität der Stammrinde von Neolamarckiacadamba bei Alloxan-induzierten diabetischen Ratten. Int. J. Pharm. Technol., 2: 314-324.

4: Chave, J., 2005. Messung der Holzdichte für tropische Waldbäume: Ein Feldhandbuch für die CTFS-Standorte. Labor. Evolution et Diversite Biologique, Universität Paul Sabatier, Frankreich, 16. Februar 2005, S.: 1-7.

5: Darley, C. P., A. M. Forrester und S. J. McQueen-Mason, 2001. Die molekulare Grundlage der Erweiterung der Pflanzenzellwand. Plant Molecular Biol., 47: 179-195.
CrossRef |

6: Dillon, S. K., M. Nolan, W. Li, C. Bell, H. X. Wu und S. G. Southerton, 2010. Allelische Variation in Zellwandkandidatengenen, die die Eigenschaften von Massivholz in natürlichen Populationen und Landrassen von . beeinflussen Pinus strahlen. Genetik, 185: 1477-1487.
CrossRef | PubMed | Direktlink |

7: Doyle, J. J. und J. L. Doyle, 1990. Isolierung von Pflanzen-DNA aus frischem Gewebe. Fokus, 12: 13-15.
Direktlink |

8: Gonzalez-Martinez, S. C., N. C. Wheeler, E. Ersoz, C. D. Nelson und D. B. Neale, 2007. Assoziationsgenetik in Pinus taeda L.I. Eigenschaften von Holz. Genetik, 175: 399-409.
CrossRef | PubMed |

9: Guillet-Claude, C., C. Birolleau-Touchard, D. Manicacci, P. M. Rogowsky und J. Rigau et al., 2004. Nukleotiddiversität der ZmPox3 Maisperoxidase-Gen: Beziehungen zwischen einer MITE-Insertion in Exon 2 und der Variation in der Verdaulichkeit von Futtermais. BMC Genetik, 10.1186/1471-2156-5-19

10: Gupta, P. K., J. K. Roy und M. Prasad, 2001. Einzelnukleotidpolymorphismen: Ein neues Paradigma für die molekulare Markertechnologie und die Erkennung von DNA-Polymorphismen mit Schwerpunkt auf deren Verwendung in Pflanzen. Curr. Wissenschaft, 80: 524–535.
Direktlink |

11: Halushka, M. K., J. B. Fan, K. Bentley, L. Hsie und N. Shen et al., 1999. Patterns of single-nucleotide polymorphisms in Kandidatengenen für die Blutdruckhomöostase. Nat. Genet., 22: 239-247.
PubMed | Direktlink |

12: Ho, W. S., S. L. Pang, P. S. Lai, S. Y. Tiong und S. L. Phui et al., 2010. Genomische Studien an Plantagenbaumarten in Sarawak. Proceedings of the International Symposium on Forestry and Forest Products 2010: Addressing the Global Concerns and Changing Societal Needs, 5.-7. Oktober 2010, Kuala Lumpur, Malaysia, S.: 172-182.

13: Seng, H. W., P. S. Ling, P. Lau und I. Jusoh, 2011. Sequence Variation in the Cellulosesynthase (SpCesA1) Gen von Shorea parvifolia ssp. parvifolia Mutter Bäume. Pertanika J. Trop. Agrar. Wissenschaft, 34: 317-323.
Direktlink |

14: Ibitoye, D. O. und P. E. Akin-Idowu, 2010. Marker-Assisted-Selection (MAS): Ein schneller Weg zur Steigerung des genetischen Gewinns in der Pflanzenzüchtung im Gartenbau. Afr. J. Biotechnol., 9: 8889-8895.
Direktlink |

15: Joker, D., 2000. Neolamarckia cadamba (Roxb.) Bosser (Anthocephalus chinensis (Lam.) A. Rich. ex Walp.). Seed Leaflet No. 17, September 2000, Danida Forest Seed Centre, Dänemark, S.: 1-2.

16: Kelleher, C. T., J. Wilkin, J. Zhuang, A.J. Cortes und A.L.P. Quintero et al., 2012. SNP-Entdeckung, Gendiversität und Kopplungsungleichgewicht in Wildpopulationen von Populus tremuloides. Baum Genet. Genome, 8: 821-829.
CrossRef |

17: Krutovsky, K. V. und D. B. Neale, 2005. Nukleotiddiversität und Kopplungsungleichgewicht in winterharten und holzqualitätsbezogenen Kandidatengenen in Douglasie. Genetik, 171: 2029-2041.
CrossRef |

18: Kumar, M., S. Thammannagowda, V. Bulone, V. Chiang und K.H. Han et al., 2009. Ein Update zur Nomenklatur der Cellulosesynthase-Gene in Bevölkerung. Trends Plant Sci., 14: 248–254.
CrossRef | PubMed | Direktlink |

19: Kwok, P. Y., C. Carlson, T. D. Yager, W. Ankener und D.A. Nickerson, 1994. Vergleichende Analyse menschlicher DNA-Variationen durch fluoreszenzbasierte Sequenzierung von PCR-Produkten. Genomik, 23: 138-144.
CrossRef | PubMed | Direktlink |

20: Lau, E. T., W. S. Ho und A. Julaihi, 2009. Molekulares Klonen von Cellulosesynthase Gen, SpCesA1 aus der Entwicklung von Xylem von Shorea parvifolia spp. Parvifolia. Biotechnologie, 8: 416-424.
CrossRef | Direktlink |

21: Librado, P. und J. Rozas, 2009. DnaSP v5: Eine Software zur umfassenden Analyse von DNA-Polymorphismusdaten. Bioinformatik, 25: 1451-1452.
CrossRef | PubMed | Direktlink |

22: Mondal, S., G.K. Dash und S. Acharyya, 2009. Analgetische, entzündungshemmende und fiebersenkende Studien von Neolamarckia cadamba bellt. J. Pharm. Res., 2: 1133-1136.

23: Narayanan, C., S. A. Wali, R. Shukla, R. Kumar, A. K. Mandal und S.A. Ansari, 2007. RAPD- und ISSR-Marker für die molekulare Charakterisierung von Teakholz (Tectona grandis) plus Bäume. J. Trop. Sci., 19: 218–225.
Direktlink |

24: Nasu, S., J. Suzuki, R. Ohta, K. Hasegawa und R. Yuia et al., 2002. Suche und Analyse, ob Single Nucleotide Polymorphisms (SNPs) in Reis (Oryza sativa, Oryzarufipogon) und Etablierung von SNP-Markern. DNA Res., 9: 163–171.
CrossRef | PubMed | Direktlink |

25: Nordborg, M., 2000. Kopplungsungleichgewicht, Genbäume und Selbstbefruchtung: Ein Diagramm der Ahnenrekombination mit teilweiser Selbstbefruchtung. Genetik, 154: 923-929.
Direktlink |

26: Olson, M. S., A. L. Robertson, N. Takebayashi, S. Silim, W. R. Schroeder und P. Tiffin, 2010. Nucleotid Diversity and Linkage Disequilibrium in Balsam Pappel (Populus balsamifera). Neue Phytol., 186: 526-536.
PubMed | Direktlink |

27: Patel, D. und V. Kumar, 2008. Pharmakognostische Studien von Neolamarckia cadamba (Roxb.) Bosser-Blatt. Int. J. Green Pharm., 2: 26-27.
CrossRef |

28: Plomion, C., C. Pionneau, J. Brach, P. Costa und H. Bailleres, 2000. Compression Wood-responsive Proteins in Developing Xylem of Maritime Pine (Pinus pinaster Ait.). Plant Physiol., 123: 959-969.
PubMed |

29: Rafalski, A., 2002. Anwendungen von Einzelnukleotidpolymorphismen in der Pflanzengenetik. Curr. Meinung. Plant Biol., 5: 94-100.
CrossRef | Direktlink |

30: Seca, A.M.L. und F.M.J. Domingues, 2006. Beziehung zwischen Grunddichte und Zellstoffausbeute mit einigen chemischen Parametern in Eukalyptusbäumen. Pesquisa Agropecuaria Bras., 41: 1687-1691.
CrossRef | Direktlink |

31: Somerville, C., 2006. Cellulosesynthese in höheren Pflanzen. Annu. Rev. Cell Dev. Biol., 22: 53–78.
PubMed | Direktlink |


Danksagung

Wir danken Stephen Keller, Maren Friesen und Sergey Nuzhdin für die Diskussionen, Jean-Marie Prosperi und Magalie Delalande für die Entwicklung und das Management der M. truncatula Keimplasmasammlung (Samen erhältlich unter http://www1.montpellier.inra.fr/BRC-MTR/) und Thierry Huguet und M. El Arbi für die Entwicklung einiger M. truncatula Keimplasma. Diese Arbeit wurde teilweise unter Verwendung von Computerressourcen des Supercomputing Institute der University of Minnesota durchgeführt und durch den National Science Foundation Grant 0820005 finanziert.


Materialen und Methoden

Proben und Sequenzierung

Blattproben wurden von 24 Genotypen von P. tremula und 24 Genotypen von P. tremuloides (Tabelle S1). Genomische DNA wurde aus Blattproben extrahiert, und Paired-End-Sequenzierungsbibliotheken mit Insert-Größen von 650 bp wurden für alle Genotypen konstruiert. Auf der Illumina HiSequation 2000-Plattform des Science for Life Laboratory, Stockholm, wurde eine Sequenzierung des gesamten Genoms mit einer erwarteten Mindesttiefe von 20x durchgeführt, und es wurden 2x 100-bp Paired-End-Reads für alle Genotypen generiert. Zwei Proben von P. tremuloides nicht die erwartete Abdeckung und wurden daher aus nachfolgenden Analysen entfernt. Wir haben öffentlich verfügbare, kurz gelesene Illumina-Daten von 24 . erhalten P. trichocarpa Personen des National Center for Biotechnology Information (NCBI) Short Read Archive (SRA) (Tabelle S1). Die Individuen wurden so ausgewählt, dass sie eine ähnliche Lesetiefe wie die Proben der beiden Espenarten aufwiesen. Die Zugangsnummern von P. trichocarpa Muster finden Sie in Evans et al. (2014). Alle Analysen basieren somit auf Daten von 24 P. tremula, 22 P. tremuloides, und 24 P. trichocarpa Genotypen.

Raw Read Filtering, Read Alignment und Postprocessing Alignment

Vor der Leseausrichtung haben wir Trimomatic (Lohse et al. 2012), um Adaptersequenzen aus Lesevorgängen zu entfernen. Da die Qualität von Lesevorgängen gegen Ende der Lesevorgänge immer abnimmt, haben wir Trimomatic verwendet, um Basen vom Beginn und/oder Ende von Lesevorgängen abzuschneiden, wenn die Qualitätswerte <20 waren. Wenn die Länge der verarbeiteten Lesevorgänge nach dem Trimmen auf <36 Basen reduziert wurde, wurden Lesevorgänge vollständig verworfen. FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) wurde verwendet, um die Sequenzqualität pro Base zwischen den Rohsequenzdaten und den gefilterten Daten zu überprüfen und zu vergleichen. Nach der Qualitätskontrolle wurden alle Paired-End- und Orphaned-Single-End-Reads von jeder Probe auf die P. trichocarpa Version 3 (v3.0) Genom (Tuskan et al. 2006) unter Verwendung von BWA-MEM mit Standardparametern in bwa-0.7.10 (Li 2013).

Mehrere Nachbearbeitungsschritte der Ausrichtungen wurden durchgeführt, um die Anzahl von Artefakten in der Downstream-Analyse zu minimieren: Zuerst führten wir Insertionen und Deletions- (Indel-) Neuausrichtungen durch, da nicht übereinstimmende Basen normalerweise in Regionen mit Indels gefunden werden ( Wang et al. 2015). Der RealignerTargetCreator im Genome Analysis Toolkit (GATK) ( DePristo et al. 2011) wurde erstmals verwendet, um verdächtig aussehende Intervalle zu finden, die wahrscheinlich neu ausgerichtet werden mussten. Dann wurde der IndelRealigner verwendet, um den Realigner über diese Intervalle laufen zu lassen. Zweitens haben wir die MarkDuplicates-Methoden im Picard-Paket (http://broadinstitute.github.io/picard/) verwendet, um diese Reads oder Read-Paare mit identischen externen Koordinaten zu entfernen, da aus PCR-Duplikaten resultierende Reads während der Vorbereitung der Sequenzierungsbibliothek auftreten können und die gleiche Einschublänge. In solchen Fällen wurde nur der Single Read mit den höchsten aufsummierten Basisqualitäten für die nachgelagerte Analyse behalten. Drittens, um Genotypisierungsfehler auszuschließen, die durch paraloge oder repetitive DNA-Sequenzen verursacht werden, bei denen Reads schlecht mit dem Referenzgenom kartiert wurden, oder durch andere Genommerkmalsunterschiede zwischen P. trichocarpa und P. tremula oder P. tremuloides, haben wir Websites mit extrem niedrigen und extrem hohen Lesetiefen entfernt, nachdem wir die empirische Verteilung der Leseabdeckung untersucht hatten. Wir haben Standorte mit einer Gesamtabdeckung von <100× oder >1200× über alle Proben pro Art herausgefiltert. Wenn Reads mehreren Orten im Genom zugeordnet wurden, wurden sie nach dem Zufallsprinzip einem Ort mit einem Mapping-Score von Null durch BWA-MEM zugeordnet. Um solche Fehlausrichtungseffekte zu berücksichtigen, haben wir diese Stellen entfernt, wenn es >20 kartierte Reads mit einem Kartierungs-Score von Null für alle Individuen jeder Art gab. Da das Short-Read-Alignment in stark repetitiven Genomregionen im Allgemeinen unzuverlässig ist, haben wir schließlich Stellen herausgefiltert, die mit bekannten Wiederholungselementen überlappten, wie von RepeatMasker identifiziert (Trailo-Graovac und Chen 2009). Am Ende wird die Teilmenge der Websites, die alle diese Filterkriterien in den drei Bevölkerung Spezies wurde in Downstream-Analysen verwendet.

Einzelnukleotidpolymorphismus und Genotypaufruf

Wir haben zwei komplementäre Bioinformatik-Ansätze implementiert: Erstens haben viele Studien auf die Verzerrung von Populationsgenetikschätzungen unter Verwendung des Genotyp-Calling-Ansatzes aus NGS-Daten hingewiesen (Nielsen et al. 2011 Nevada et al. 2014). Single- oder Multi-Sample-Genotype Calling kann zu einer Verzerrung bei der Schätzung des Site-Frequency-Spektrums (SFS) führen, da ersteres in der Regel zu einer Überschätzung seltener Varianten führt, während letzteres oft zum Gegenteil führt ( Nielsen et al. 2011). Daher haben wir in dieser Studie eine im Softwarepaket implementierte Methode verwendet – Analyse von Sequenzierungsdaten der nächsten Generation (ANGSD v0.602) ( Korneliussen et al. 2014) – um das SFS und alle aus dem SFS abgeleiteten populationsgenetischen Statistiken zu schätzen, ohne Genotypen zu nennen. Zweitens führten wir für jene Analysen, die genaue Einzelnukleotidpolymorphismus (SNP) und Genotypaufrufe erfordern, SNP-Aufrufe mit HaplotypeCaller des GATK v3.2.2 (DePristo et al. 2011), die SNPs und Indels gleichzeitig über die lokale Reassemblierung von Haplotypen für jedes Individuum aufrief und genomische Einzelproben-VCFs (gVCFs) erstellte. gVCFs in GATK wurden dann verwendet, um Multi-Sample-Datensätze zusammenzuführen, Genotyp-Wahrscheinlichkeiten zu korrigieren, den neu zusammengeführten Datensatz erneut zu genotypisieren und eine Neuannotation durchzuführen. Die folgenden Filterschritte wurden dann verwendet, um die Anzahl falsch-positiver SNPs zu reduzieren und qualitativ hochwertige SNPs zu behalten: (1) Wir entfernten alle SNPs, die sich mit Standorten überlappten, die durch alle vorherigen Filterkriterien ausgeschlossen wurden. (2) Wir behielten nur biallelische SNPs mit einem Abstand von >5 bp von jeglichen Indels bei. (3) Wir behandelten Genotypen mit einem Genotyp-Qualitätsscore (GQ) <10 als fehlend und entfernten dann diese SNPs mit einer Genotyp-Missing-Rate >20%. (4) Wir haben SNPs entfernt, die eine signifikante Abweichung vom Hardy-Weinberg-Gleichgewicht zeigten (P < 0,001). Nach allen Filterungen wurden 8.502.169 SNPs unter den drei entdeckt Bevölkerung Arten und wurden in Downstream-Analysen verwendet.

Bevölkerungsstruktur

Wir haben vierfach synonyme SNPs mit geringer Allelfrequenz >0.1 verwendet, um Populationsstrukturanalysen mit ADMIXTURE (Alexander et al. 2009). Wir haben ADMIXTURE bei allen untersuchten Individuen unter den Arten und bei den Proben innerhalb jeder Art separat durchgeführt. Die Anzahl der genetischen Cluster (K) variierte von 1 bis 6. Die wahrscheinlichste Anzahl genetischer Cluster wurde ausgewählt, indem der Kreuzvalidierungsfehler in ADMIXTURE minimiert wurde.

Vielfalt und Divergenz: zugehörige zusammenfassende Statistiken

Für Nukleotiddiversitäts- und Divergenzschätzungen wurden in allen Downstream-Analysen mit ANGSD ( Korneliussen et al. 2014). Zuerst haben wir die -doSaf-Implementierung in ANGSD verwendet, um die Site-Allel-Frequency-Likelihood basierend auf dem SAMTools-Genotype-Likelihood-Modell (Li et al. 2009). Dann haben wir die -realSFS-Implementierung in ANGSD verwendet, um ein optimiertes gefaltetes globales SFS unter Verwendung des Erwartungsmaximierungsalgorithmus für jede Spezies zu erhalten. Basierend auf dem globalen SFS haben wir die -doThetas-Funktion in ANGSD verwendet, um die Nukleotiddiversität pro Stelle aus der späteren Wahrscheinlichkeit der Allelfrequenz basierend auf einem Maximum-Likelihood-Ansatz abzuschätzen (Kim et al. 2011). Zwei Standardschätzungen der Nukleotiddiversität, die durchschnittliche paarweise Nukleotiddiversität (Θπ) ( Tajima 1989) und der Anteil der Segregation Sites (ΘW) ( Watterson 1975) und ein statistischer Neutralitätstest, Tajimas D (Tajima 1989), wurden entlang aller 19 Chromosomen unter Verwendung von nicht überlappenden Gleitfenstern von 100 Kilobasen (kbp) und 1 Megabasen (Mb) zusammengefasst. Fenster mit <10 % der abgedeckten Websites, die von vorherigen Qualitätsfilterungsschritten übrig blieben, wurden ausgeschlossen. Am Ende wurden 3340 100-kbp- und 343 1-Mb-Fenster mit durchschnittlich 50.538 bzw. 455.910 abgedeckten Basen pro Fenster eingeschlossen.

Alle diese Statistiken wurden auch für jeden Typ von funktionellem Element (0-fach nicht synonym, vierfach synonym, Intron, 3′ UTR, 5′ UTR und intergene Stellen) über nicht überlappende 100-kbp- und 1-Mb-Fenster in allen drei . berechnet Bevölkerung Spezies. Die Kategorie der Genmodelle folgte der Genannotation von P. trichocarpa Version 3.0 (Tuskaner) et al. 2006). Für proteincodierende Gene haben wir nur Gene mit mindestens 90% der bedeckten Stellen aus vorherigen Filterschritten eingeschlossen, um sicherzustellen, dass die drei Arten die gleichen Genstrukturen aufweisen. Für Regionen, die von unterschiedlichen Transkripten in jedem Gen überlappt wurden, klassifizierten wir jede Stelle gemäß der folgenden Hierarchie (von der höchsten zur niedrigsten): kodierende Regionen (CDS), 3' UTR, 5' UTR und Intron. Wenn sich eine Site in einem Transkript in einem 3'-UTR und in einem anderen in einem CDS befindet, wurde die Site als CDS klassifiziert. Wir verwendeten das Transkript mit dem höchsten Gehalt an Protein-kodierenden Stellen, um synonyme und nicht-synonyme Stellen innerhalb jedes Gens zu kategorisieren. Insgesamt 16,52, 3,4, 7,19, 4,02, 31,89 und 73,46 Mb wurden aufgeteilt in 0-fach nicht synonym (wo alle DNA-Sequenzänderungen zu Proteinsequenzänderungen führen), vierfach synonym (wo alle DNA-Sequenzänderungen zu den gleichen Proteinsequenzen führen ), 3′ UTR, 5′ UTR, Intron und intergene Kategorien.

Kopplungsungleichgewicht und bevölkerungsskalierte Rekombinationsrate

Insgesamt 1.409.377 SNPs, 1.263.661 SNPs und 710.332 SNPs mit geringer Allelfrequenz >10% wurden für die Analyse des Kopplungsungleichgewichts (LD) und der populationsskalierten Rekombinationsrate verwendet (ρ) in P. tremula, P. tremuloides, und P. trichocarpa, bzw. Um die Rate des LD-Zerfalls unter den drei zu schätzen und zu vergleichen Bevölkerung Arten haben wir zuerst PLINK 1.9 (Purcell et al. 2007), um die Anzahl der SNPs in jeder Art zufällig auf 100.000 zu reduzieren. Dann berechneten wir die quadrierten Korrelationskoeffizienten (R 2) zwischen allen Paaren von SNPs, die sich innerhalb einer Entfernung von 50 kbp unter Verwendung von PLINK 1.9 befanden. Der Abfall von LD in Abhängigkeit von der physischen Distanz wurde mittels nichtlinearer Regression von paarweisen R 2 vs. der physikalische Abstand zwischen Standorten in Basenpaaren ( Remington et al. 2001).

Wir haben die bevölkerungsskalierte Rekombinationsrate geschätzt ρ mit dem Intervallprogramm von LDhat 2.2 ( McVean et al. 2004) mit 1.000.000 MCMC-Iterationen, die alle 2000 Iterationen abtasten, und einem Blockstrafparameter von 5. Die ersten 100.000 Iterationen der MCMC-Iterationen wurden als Burn-In verworfen. Wir haben dann den skalierten Wert von berechnet ρ in jedem 100-kbp- und 1-Mb-Fenster durch Mittelung über alle SNPs in diesem Fenster. Für die Schätzung von ρ.

Abschätzung der Verteilung von Fitnesseffekten neuer Aminosäuremutationen und des Anteils adaptiver Aminosäuresubstitutionen

Wir generierten das gefaltete SFS in jeder Spezies für eine Klasse ausgewählter Sites (0-fache nicht-synonyme Sites) und eine Klasse vermeintlich neutraler Referenzsites (vierfach synonyme Sites) aus SNP-Daten unter Verwendung eines benutzerdefinierten Perl-Skripts. Wir verwendeten einen Maximum-Likelihood-(ML-)Ansatz, wie er im Programm Verteilung von Fitnesseffekten (DFE)-α ( Keightley und Eyre-Walker 2007 Eyre-Walker und Keightley 2009) implementiert wurde, um ein demografisches Modell mit einer schrittweisen Veränderung der Bevölkerungsgröße anzupassen zum neutralen SFS. Die Fitnesseffekte neuer schädlicher Mutationen an der ausgewählten Standortklasse wurden aus einer Gammaverteilung nach Einbeziehung der geschätzten Parameter für das demografische Modell entnommen. Diese Methode geht davon aus, dass die Fitnesseffekte neuer Mutationen an neutralen Stellen null und an ausgewählten Stellen unbedingt schädlich sind, da vorteilhafte Mutationen zu selten sind, um zum Polymorphismus beizutragen (Keightley und Eyre-Walker 2007). Wir berichten über den Anteil der Aminosäuremutationen, die in verschiedene effektive Selektionsstärken fallen (nes) Bereich: 0–1, 1–10 bzw. >10.

Aus dem geschätzten DFE wurde der Anteil der adaptiven Aminosäuresubstitutionen (α) und die relative Rate (ω) der adaptiven Substitution an 0-fach nicht synonymen Stellen nach der Methode von Eyre-Walker und Keightley (2009) geschätzt. Diese Methode berücksichtigt explizit vergangene Veränderungen der Populationsgröße und das Vorhandensein von leicht schädlichen Mutationen. Von den insgesamt 8.502.169 SNPs, die von GATK entdeckt wurden, teilten sich durchschnittlich <1 % auf eine der beiden Espenarten und P. trichocarpa (Abbildung S2). Wir haben daher die Espenart verwendet und P. trichocarpa als die Fremdgruppenspezies der anderen, um die Nukleotiddivergenz zwischen den Spezies an vierfach synonymen und 0-fach nicht synonymen Stellen zu berechnen, da es unwahrscheinlich ist, dass sie durch gemeinsame Ahnenpolymorphismen beeinflusst wird. Die Jukes-Cantor-Mehrfachtrefferkorrektur wurde auf die Divergenzschätzungen angewendet (Jukes und Cantor 1969). Für die Parameter von nes, α und generierten wir 200 Bootstrap-Replikate durch zufälliges Resampling über alle SNPs in jeder Site-Klasse mit R (R Develpment Core Team 2014). Wir haben die oberen und unteren 2,5 % der Bootstrap-Replikate ausgeschlossen und den Rest verwendet, um die 95 %-Konfidenzintervalle für jeden Parameter darzustellen.

Genomische Korrelate der Diversität

Um die Faktoren zu untersuchen, die das Niveau des neutralen Polymorphismus in allen dreien beeinflussen Bevölkerung Spezies haben wir zunächst angenommen, dass die vierfach synonymen Stellen in den Genregionen selektiv neutral sind, da jede mögliche Mutation an vierfach degenerierten Stellen synonym ist. Im Folgenden beziehen wir uns auf die paarweise Nukleotiddiversität an vierfach synonymen Stellen (θvierfach) als „neutraler Polymorphismus“. Als Vergleich mit der Genregion haben wir auch die Nukleotiddiversität an intergenischen Stellen (θIntergene). Dann haben wir mehrere andere genomische Merkmale innerhalb jedes 100-kbp- und 1-Mb-Fensters tabellarisch dargestellt, die mit Polymorphismusmustern korrelieren können. Zuerst haben wir die bevölkerungsskalierte Rekombinationsrate zusammengefasst (ρ) wie oben für jede Art beschrieben. Zweitens haben wir den GC-Gehalt als den Anteil an Basen tabellarisch dargestellt, bei dem die Referenzsequenz (P. trichocarpa v3.0) war ein G oder ein C. Drittens haben wir die Gendichte als Anzahl der funktionellen Gene innerhalb jedes Fensters gemäß der Genannotation von . gemessen P. trichocarpa Version 3.0. Jeder Teil eines Gens, der in ein Fenster fiel, wurde als vollständiges Gen gezählt. Viertens berücksichtigten wir die Variation der Mutationsrate, indem wir die Anzahl der festen Unterschiede pro neutraler Stelle (entweder vierfach synonyme Stellen oder intergenische Stellen) zwischen Aspen und berechneten P. trichocarpa innerhalb jedes Fensters, das in den ngsTools ( Fumagalli et al. 2014). Der Grund, warum wir die Divergenz zwischen Espe und verwendet haben P. trichocarpa Mutationsrate zu messen, liegt daran, dass sie entfernt verwandt sind ( Wang et al. 2014) und es ist unwahrscheinlich, dass die Schätzung der Divergenz durch gemeinsame Ahnenpolymorphismen zwischen Arten beeinflusst wird, wie oben gezeigt. Fünftens haben wir die Anzahl der abgedeckten Basen in jedem Fenster als die von allen vorherigen Filterkriterien übriggebliebenen tabelliert.

Wir haben den Rangordnungskorrelationstest von Spearman verwendet, um paarweise Korrelationen zwischen den interessierenden Variablen zu untersuchen. Um die Autokorrelation zwischen Variablen zu berücksichtigen, berechneten wir weiter partielle Korrelationen zwischen den interessierenden Variablen, indem wir die Störeffekte anderer Variablen entfernten (Kim und Soojin 2007). Alle statistischen Tests wurden mit R Version 3.2.0 durchgeführt, sofern nicht anders angegeben.

Datenverfügbarkeit

Alle neu generierten Illumina-Reads von 24 P. tremula und 22 P. tremuloides aus dieser Studie wurden der SRA beim NCBI vorgelegt. Alle Zugangsnummern sind in Tabelle S1 zu finden.


Abstrakt

Die jüngsten Entwicklungen haben zu einer enormen Zunahme öffentlich verfügbarer großer Genomdaten, einschließlich vollständiger Genome, geführt. Das 1000-Genome-Projekt leistete einen wichtigen Beitrag, indem es die Ergebnisse der Sequenzierung einer großen Anzahl einzelner Genome veröffentlichte und eine Vielzahl von groß angelegten Studien zur menschlichen genetischen Variation ermöglichte. Die derzeit verfügbaren Werkzeuge reichen jedoch nicht aus, wenn das Ziel einige Analysen von Datensätzen betrifft, die mehr als Hunderte von Basenpaaren umfassen, und wenn man Haplotypsequenzen von Einzelnukleotidpolymorphismen (SNPs) betrachtet. Hier präsentieren wir ein neues und leistungsfähiges Werkzeug für den Umgang mit großen Datensätzen, das die Berechnung einer Vielzahl von zusammenfassenden Statistiken von populationsgenetischen Daten ermöglicht und die Geschwindigkeit der Datenanalyse erhöht.

Zitat: Soares I, Moleirinho A, Oliveira GNP, Amorim A (2015) DivStat: Ein benutzerfreundliches Werkzeug für die Analyse von Einzelnukleotidpolymorphismus der genomischen Diversität. PLoS ONE 10(3): e0119851. https://doi.org/10.1371/journal.pone.0119851

Wissenschaftlicher Redakteur: Swarup Kumar Parida, Nationales Institut für Pflanzengenomforschung (NIPGR), INDIEN

Empfangen: 19. Juni 2014 Akzeptiert: 18. Januar 2015 Veröffentlicht: 10. März 2015

Urheberrechte ©: © 2015 Soares et al. Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License vertrieben wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium gestattet, sofern der ursprüngliche Autor und die Quelle angegeben werden

Datenverfügbarkeit: Die DivStat-Software kann kostenlos für MACINTOSH-, UNIX- und WINDOWS-Systeme von den Websites https://www.mediafire.com/folder/za5wjlcoc5oi1/DivStat und http://www.portugene.com/DivStat.html heruntergeladen werden, begleitet von Tutorials , Beispieldateien und Installationsdetails.

Finanzierung: Diese Arbeit wurde durch das Stipendium der portugiesischen Stiftung für Wissenschaft und Technologie (FCT) (SFRH/BD/73508/2010) an A. M. IPATIMUP unterstützt, ist ein assoziiertes Labor des portugiesischen Ministeriums für Wissenschaft, Technologie und Hochschulbildung und wird teilweise von FCT unterstützt. Die Geldgeber spielten keine Rolle beim Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Erstellung des Manuskripts.

Konkurrierende Interessen: Die Autoren haben erklärt, dass keine konkurrierenden Interessen bestehen.


Nukleotiddiversität in Stärkesynthase IIa und Validierung von Einzelnukleotidpolymorphismen in Bezug auf die Verkleisterungstemperatur der Stärke und andere physikalisch-chemische Eigenschaften in Reis (Oryza sativa L.)

Die Eigenschaften der Stärke, wie Verkleisterungstemperatur (GT), scheinbarer Amylosegehalt (AAC), Anteigtemperatur (PT) und andere physikalisch-chemische Eigenschaften bestimmen die Qualität verschiedener Reisprodukte, z. B. Ess-, Koch- und Verarbeitungsqualitäten. Die GT von Reismehl wird durch die . kontrolliert alk Locus, der dem Stärkesynthase IIa (SSIIa) Ort. In dieser Studie sequenzierten wir ein 2.051 bp großes DNA-Fragment, das einen Teil von Intron 6, Exon 7, Intron 7, Exon 8 und einen Teil der 3′-untranslatierten Region von umfasst SSIIa für 30 Reissorten mit unterschiedlicher geografischer Verteilung und Variation der physikalisch-chemischen Eigenschaften der Stärke. Insgesamt wurden 24 Einzelnukleotidpolymorphismen (SNPs) und eine Insertion/Deletion (InDel) identifiziert, die in neun Haplotypen eingeteilt werden konnten. Die mittlere paarweise Nukleotiddiversität π war 0,00292, und Wattersons Schätzer θ war 0,00296 in dieser Sammlung von Reiskeimplasma. Tajimas D Auswahltest zeigte keine signifikante Abweichung von der neutralen Erwartung (D = − 0.04612, P >0,10). Es wurden jedoch signifikante Assoziationen zwischen sieben der SNPs und dem Peak-GT gefunden (T P) bei P < 0.05, von denen zwei zusammenhängende SNPs (GC/TT) eine sehr starke Assoziation mit . zeigten T P (P < 0,0001). Mit einigen seltenen Ausnahmen kann dieser GC/TT-Polymorphismus allein Reissorten mit hoher oder mittlerer GT (die das GC-Allel besitzen) von solchen mit niedriger GT (die das TT-Allel besitzen) unterscheiden. Im Gegensatz dazu war keiner dieser SNPs oder InDel signifikant mit dem Amylosegehalt verbunden. Für die SSIIa GC/TT-Allele. Die Assoziationsanalyse zeigte, dass 82 % der Gesamtvariation von AAC in diesen Proben durch eine (CT)n Simple Sequence Repeat (SSR) und ein G/T SNP des Waxy-Gens (Wx) und 62,4 % der Gesamtvariation von PT könnten durch den GC/TT-Polymorphismus erklärt werden. Eine zusätzliche Assoziationsanalyse wurde zwischen diesen molekularen Markern und den thermischen und Retrogradationseigenschaften für eine Untergruppe von 245 Proben aus den 509 Reissorten durchgeführt. Die SSIIa Der GC/TT-Polymorphismus erklärte mehr als 60 % der gesamten Variation der thermischen Eigenschaften, während SSR und SNP von Wx Gen erklärt so viel wie die SSIIa GC/TT der Gesamtvariation der Retrogradationseigenschaften. Unsere Studie liefert weitere Unterstützung für die Nutzung des GC/TT-Polymorphismus in SSIIa. Wie in unserer Studie mit 509 Reissorten gezeigt, konnte der GC/TT-SNP in etwa 90% der Fälle Reis mit hoher oder mittlerer GT von solchen mit niedriger GT unterscheiden. Unter Verwendung von vier Primern in einer einzigen PCR-Reaktion kann der GC/TT-Polymorphismus in großem Maßstab untersucht werden. Somit kann dieser SNP-Polymorphismus bei der markergestützten Selektion zur Verbesserung von GT und anderen physikalisch-chemischen Eigenschaften von Reis sehr nützlich sein.

Dies ist eine Vorschau von Abonnementinhalten, auf die Sie über Ihre Institution zugreifen können.


Einführung

Die Domestikation von Nutzpflanzen ist ein komplexer Prozess, der durch eine Reihe von phänotypischen Veränderungen vermittelt wird, um Anbau, Ernte und Konsum zu verbessern. Reis (Oryza sativa L.) ist eine der frühesten domestizierten Nutzpflanzenarten, und die genetische Vielfalt von Kulturreis wurde während der Domestikation und der künstlichen Selektion um bis zu 80% gegenüber der des wilden Vorfahren reduziert [1]. Der extremste Diversitätsverlust findet sich bei modernen Hochleistungsreissorten, was schwerwiegende Folgen für die Krankheitsanfälligkeit und die Anpassung an sich ändernde Umweltbedingungen hat [2]. Im Gegensatz dazu haben Reislandrassen, die über Jahrtausende durch gezielte Züchtung durch Landwirte auf dem Feld entstanden und weiterentwickelt wurden, genetische Variation bewahrt [3]. Diese Variation hat wichtige Auswirkungen auf die Reiszüchtung, indem sie neue Gene/Allele zur Verbesserung der Ernte liefert. Mit der Entwicklung der modernen Landwirtschaft wurde jedoch eine große Anzahl lokaler Landrassen durch moderne Sorten ersetzt, die in den letzten 40 Jahren eingeführt wurden [4]. In China werden in den meisten Provinzen keine Reislandrassen mehr angebaut, mit Ausnahme einiger Regionen ethnischer Minderheiten, wie den Gebieten der Provinzen Yunnan und Guizhou.

Die Auswahl durch verschiedene ethnische Gruppen, die Gebiete mit unterschiedlichen Höhen und klimatischen Bedingungen sowie mit unterschiedlichen Anbaumethoden, Kulturen und Traditionen bewohnen, hat zur Vielfalt der Reiskulturen in Yunnan beigetragen. Dementsprechend ist Yunnan eines der größten Zentren der genetischen Vielfalt für Reis weltweit [5–7]. Reislandrassen in Yunnan sind in einer Region von 21°8′ 32′′ N bis 29°11′ 18′′ N und 97°31′ 39′′ E bis 106°11′ 47′′ E weit verbreitet und werden angepflanzt in verschiedenen Höhenlagen und unter verschiedenen klimatischen Bedingungen [7]. Landrassen wachsen in Höhen von ca. 76 m im Kreis Hekou, Präfektur Honghe im südöstlichen Teil von Yunnan bis auf 2.700 m im Kreis Weixi, Präfektur Diqing [7]. Die weite Verbreitung von Reis-Landrassen bietet eine ausgezeichnete Gelegenheit für Studien der genetischen Struktur und der Differenzierungsmuster von Reis-Landrassen entlang des Höhenbereichs sowie der Rolle der Höhenlage bei der Gestaltung der genetischen Populationsstruktur. Mehrere Studien haben die genetische Differenzierung und die Verteilung von Reislandrassen entlang von Höhengradienten in Yunnan basierend auf phänotypischen Merkmalen oder molekularen Insertions-/Deletionsmarkern (Indel) untersucht [8–10]. Laut einer früheren Studie sind beide indica und japonika Reissorten werden in Yunnan angebaut [6], und die Verbreitung von Reislandrassen kann wie folgt künstlich in drei Reisanbauregionen eingeteilt werden: (1) die indica Gürtel in Höhen unter 1.400 m, (2) der gemischte indica und japonika Gürtel in Höhen zwischen 1.400 und 1.600 m und (3) die japonika in Höhen über 1.600 m [8]. Es ist jedoch wenig darüber bekannt, wie sich die Höhenvariation auf die genetische Struktur der Population auswirkt. Darüber hinaus ist nicht klar, ob Reislandrassen in Yunnan eine Isolation aufgrund der Höhe aufweisen. Diese Fragen müssen anhand von DNA-Daten untersucht werden.

Unter verschiedenen molekularen Markertypen werden häufig Simple Sequence Repeat (SSR)-Marker verwendet, um die genetische Diversität, Populationsstruktur und Differenzierung in zahlreichen Pflanzenarten abzuschätzen [11]. Darüber hinaus wurden mit der Entwicklung der DNA-Sequenzierungstechnologie Multi-Locus-DNA-Sequenzen erfolgreich zur Abschätzung der genetischen Diversität und für phylogenetische Analysen verwendet [12–15]. DNA-Sequenzunterschiede spiegeln genetische Unterschiede direkt wider, Sequenzvergleiche sind eine ideale Methode, um genetische Vielfalt und Differenzierung aufzudecken.

Wir sammelten verschiedene Reislandrassen in Yunnan, China, entlang einer Vielzahl von Höhenlagen und analysierten Gensequenzen und SSR-Marker. Unser Ziel war es, die genetische Struktur von Reislandrassen zu untersuchen und die Rolle der Isolierung nach Höhenlage bei der genetischen Differenzierung zu beurteilen.


Diskussion

Genetische Vielfalt und Bevölkerungsdemografie in P. krempfii

Unsere Analyse ergab einen extrem niedrigen Nukleotidpolymorphismus in P. krempfii. Für Kernloci ist die mittlere stille Nukleotiddiversität in P. krempfii (πS = 0.0015 θws = 0,0020) war vergleichbar mit denen in Pinus cembra (πS = 0.0024 θws = 0,0024) (Mosca et al. 2012 ), aber deutlich niedriger als bei anderen Kiefern (Abb. 3 Tabelle S7). Zum mtDNA haben wir über zehn keinen Polymorphismus festgestellt mtDNA-Regionen (ungefähr 10 kbp). Obwohl geringe Nukleotidvariation für mtDNA wurde in Nadelbäumen beobachtet, einige der mtDNA-Regionen, die in dieser Studie analysiert wurden, wurden in früheren Populationsstudien bei Kiefern häufig verwendet, und für die meisten Kiefernarten wurden verschiedene Polymorphiegrade berichtet, einschließlich solcher mit begrenztem Verbreitungsgebiet (Chiang et al. 2006 Eckert et al. 2008 Wang et al.). al. 2011). Eckert et al. ( 2008 ) entdeckte 14 Mitotypen in Pinus balfouriana, eine in Kalifornien endemische Kiefer mit nur zwei disjunkten Populationen, basierend auf vier mtDNA-Fragmente, die an dieser Studie beteiligt sind. Für die cpSSR, Haplotyp-Diversität (he = 0,911) erkannt in P. krempfii war hoch, wie bei den meisten Kiefernarten beobachtet (Höhn et al. 2005 Petit et al. 2005 Wang et al. 2011 , 2013 ). Die gegensätzlichen Ebenen der genetischen Vielfalt zwischen cpSSR und mt- und nukleäre DNA-Sequenzen beobachtet in P. krempfii Dies kann auf die unterschiedlichen Mutationsraten zwischen den genomischen Regionen zurückzuführen sein. Bei Kiefernarten beträgt die Mutationsrate für die Längenvariation bei cpSSR-Loci (3,2–7,9 × 10 −5 ) waren 5–6 Größenordnungen höher als die Substitutionsraten in mt- (4 × 10 –11 ) und nukleäre DNA (7 × 10 –10 ) Sequenzen (Provan et al. 1999 Mower et al. 2007 Willyard et al. 2007). Die asymmetrische Diversität zwischen genetischen Markern wurde bei anderen Kiefern beobachtet, wie z P. cembra mit cpSSR (he = 0,917) und nukleäre DNA-Sequenzen (πS = 0,0024) (Höhn et al. 2005 Mosca et al. 2012 ). Der Unterschied in der Vielfalt zwischen cpSSR relativ zu mt und nukleare Loci könnten auch auf unterschiedliche demographische und selektive Vorgeschichten verschiedener Genome zurückzuführen sein. Zum Beispiel während der Reichweitenfragmentierung, der Verlust der cpDNA-Diversität in einzelnen räumlich isolierten Populationen könnte durch einen effizienten Pollenfluss von benachbarten Populationen kompensiert werden, während isolierte Populationen stärkere Engpässe auf mt Genom durch begrenzte Samenausbreitung. Natürliche Selektion könnte die genetische Vielfalt funktioneller Kernloci reduzieren, aber möglicherweise nicht neutrale cpSSR-Loci. Zusammenfassend lässt sich sagen, dass der Nukleotidpolymorphismus in nuklearen und mt Genome von P. krempfii war unter den bisher untersuchten Kiefernarten am niedrigsten, während eine hohe genetische Vielfalt bei cpSSR-Loci möglicherweise aufgrund der hypervariablen Natur der SSR-Marker.

Wir stellten eine geringe (5,2%) aber signifikante Differenzierung zwischen den vorhandenen Populationen von . fest P. krempfii. Auch innerhalb jeder Region, FNS Werte (3,8–7,8 %) waren ebenfalls signifikant. Dieser Differenzierungsgrad ist vergleichbar mit Kiefernarten mit weiten Verbreitungsgebieten (Wang et al. 1991 Ma et al. 2006 Pyhäjärvi et al. 2007). Aufgrund fehlender geografischer Barrieren zwischen den Stichprobenpopulationen von P. krempfii, könnte die Populationsdifferenzierung bei dieser Art durch die fragmentierte Natur ihrer Verbreitung verursacht worden sein. Im Gegensatz zu den meisten anderen Kiefern, P. krempfii bildet keine Reinbestände, und einzelne Populationen bestehen aus kleinen Baumgruppen und/oder Einzelgängern, die im dichten Dickicht anderer Baumarten verstreut sind (Nguyen und Thomas 2004). Diese Bedingungen werden wahrscheinlich die Verbreitung von Pollen und Samen einschränken und zur Differenzierung zwischen lokalen Populationen beitragen. Außerdem, P. krempfii in einer feuchten Regenwaldumgebung verbreitet ist, was eine effiziente Windbestäubung ausschließen könnte (Turner 2001). Hohe Luftfeuchtigkeit dämpft die Pollenkörner und starke Regenfälle spülen Pollen aus der Luft. Zusammenfassend lässt sich sagen, dass trotz relativer Nähe einzelner Populationen die geringe Bevölkerungsdichte von P. krempfii und feuchte Umgebung haben den Genfluss verhindert und zu einem gewissen Grad an Populationsdifferenzierung geführt. Diese Ergebnisse weisen darauf hin, dass auch Arten mit einer sehr begrenzten Verbreitung genetisch differenzierte Populationen beherbergen können.

Ungefähre Bayes'sche Berechnungssimulationen unter Verwendung von Kernorten legten nahe, dass P. krempfii erlebte ein exponentielles Bevölkerungswachstum, das vor etwa 2450 Jahren begann. Die Bevölkerungsexpansion wurde auch durch den Test der Mismatch-Verteilung gestützt auf die cpDNA-Daten. Der Zeitpunkt des Bevölkerungswachstums in P. krempfii war viel später als bei anderen eurasischen Kiefern, die zum Beispiel auf einige hunderttausend Jahre datiert wurden, P. densata vom tibetischen Plateau (Gao et al. 2012) und P. sylvestris aus Europa (Pyhäjärvi et al. 2007). So zeigte sich die Bevölkerungsexpansion in P. krempfii könnte eher durch regionale Klimaänderungen oder menschliche Aktivierungen als durch globale Klimaschwankungen während des Pleistozäns verursacht worden sein. Angenommen Generierungszeit von P. krempfii als 50 Jahre dauerte das Populationswachstum bei dieser Art nur 49 Generationen. Diese Episode der Populationsexpansion ist zu kurz, um eine Akkumulation von extensivem Polymorphismus zu ermöglichen. Außerdem ist der Lebensraum von P. krempfii hat sich in den letzten Jahrzehnten verschlechtert und fragmentiert (Nguyen und Thomas 2004), was zu einer Verringerung und Fragmentierung von P. krempfii Bevölkerungen. Wie in früheren Studien angedeutet, sind die in ABC- und Mismatch-Verteilungsanalysen implementierten und untersuchten Modelle höchstwahrscheinlich zu simpel (Ingvarsson 2008 Gao et al. 2012). Vermutlich, P. krempfii hat wiederholte Expansionen und Kontraktionen der Populationsgröße durchgemacht, und der jüngste Populationsrückgang wurde durch die aktuellen Simulationen nicht aufgedeckt. Die Verringerung der Populationsgröße und die Populationsfragmentierung könnten die Häufigkeit seltener Allele in sehr kurzer Zeit verringern (Ellstrand und Elam 1993).

Die extrem geringe Nukleotiddiversität, die in P. krempfii ist fast 2–8 mal niedriger als bei den meisten anderen eurasischen Kiefern (Abb. 3 Tabelle S7) und stimmt mit ihrer geringen Populationsgröße (1,43 × 10 4 ) überein. ABC-Analysen legten nahe, dass P. krempfii hat eine extrem kleine Vorfahrenpopulation beibehalten, die nur wenige hundert Individuen (455) für mehr als 2,8 Myr umfasst, bevor sie in die Phase des Populationswachstums eingetreten ist. Diese Situation von P. krempfii mit kleiner Vorfahrenpopulationsgröße unterscheidet sich von der anderer Relikt-Gymnospermen wie z Ginkgo biloba und Cathaya argyrophylla, die vor der Vereisung reichlich und weit verbreitet waren (Wang und Ge 2006 Gong et al. 2008 ). Brodribb und Feild ( 2008 ) spekulierten, dass die Konkurrenz durch Angiospermen und subtropische Podokarpen den Erfolg von P. krempfii.

Eine geringe Populationsgröße hat zwei wichtige genetische Konsequenzen. Einer davon ist der Verlust der genetischen Vielfalt durch genetische Drift. Ein anderer ist die vermehrte Inzucht, die zu einer höheren Homozygotie und Mortalität durch letale oder semi-letale Allele führt. Der Inzuchtkoeffizient (FIS = 0,26) Zoll P. krempfii ist viel höher als bei anderen Kiefern wie P. pinaster (0,069) (Eveno et al. 2008). In dieser Studie sammelten wir Zapfen von den meisten der untersuchten Individuen und stellten fest, dass praktisch alle Samen leer waren. Obwohl das Paarungssystem von P. krempfii wurde nicht untersucht, Kiefernarten sind selbstkompatibel und es ist allgemein bekannt, dass das Vorhandensein von leerem Samen in dieser Gruppe von Nadelbäumen ein sicherer Indikator für eine erhöhte Inzucht ist (Karkkainen et al. 1996). Abgesehen von dem Verlust an Vielfalt durch genetische Drift sind daher die vorhandenen Populationen von P. krempfii kann auch einen zusätzlichen Verlust durch Inzucht erleiden. Zukünftige Studie zum Paarungssystem von P. krempfii könnten die wahren Auswirkungen von Inzucht auf den Verlust der genetischen Vielfalt dieser Art aufdecken.

Pinus krempfii gilt als uraltes Relikt (Nguyen und Thomas 2004). Es ist die einzige erhaltene Art im Unterabschnitt Krempfianae und divergierte vor mehr als 10 Millionen Jahren von anderen Kiefern (Willyard et al. 2007). Die einzigartige Morphologie, Physiologie, Anatomie, das begrenzte Verbreitungsgebiet und der ausgeprägte Lebensraum weisen auch darauf hin, dass diese Art seit langem von den anderen Kiefern isoliert war. Eine langfristige Isolation zusammen mit einer geringen Populationsgröße könnte die Auswirkungen von genetischer Drift und Inzucht verstärkt haben P. krempfii, was zu einer starken Verringerung der genetischen Vielfalt führt.

Die Nukleotiddiversität könnte auch durch selektive Sweeps reduziert werden, die die Variation an und um bestimmte Gene verringern, oder durch Reinigung der Selektion gegen schädliche Mutationen, die eng mit neutralen Varianten verbunden sind (Hahn 2008). Wir fanden jedoch an keinem der analysierten Loci starke Hinweise auf eine Selektion. Die rasche Abnahme der LD über die Entfernung deutete auch auf begrenzte Auswirkungen des genetischen Trampens hin. Obwohl die Selektion die geringe Nukleotidvariation an mehreren Loci teilweise erklären kann, scheint sie daher nicht ausreichend zu sein, um die in unserer Studie eingeschlossene geringe Variation zwischen den Nukleotid-Loci zu erklären.

Auswirkungen auf den Naturschutz

Der niedrige Nukleotidpolymorphismus, die eingeschränkte Verteilung und der hohe Anteil an leeren Seeds in P. krempfii deuten darauf hin, dass die Art einem erheblichen Aussterberisiko ausgesetzt ist. Obwohl die am weitesten verbreiteten Populationen von P. krempfii derzeit in Nationalparks in Vietnam unter gesetzlichem Schutz stehen, sind sie aufgrund ihrer geringen Größe durch stochastische Prozesse ernsthaft bedroht und vom Aussterben bedroht. Die Populationsgröße ist das wichtigste der fünf Kriterien für die Auflistung von Arten als gefährdet im Rahmen des Systems der Internationalen Union für die Erhaltung der Natur und der natürlichen Ressourcen (IUCN) (http://www.iucn.org/) und der Verlust genetischer Variation kann das Überlebenspotenzial einer Art angesichts biotischer und abiotischer Veränderungen verringern. Daher sollten Anstrengungen unternommen werden, um die genetische Vielfalt und die Populationsgröße von P. krempfii. Pinus krempfii bildet keine reinen Wälder und kommt typischerweise als kleine Gruppen von 10–30 Bäumen in dichten subtropischen Wäldern vor (Nguyen und Thomas 2004). Die Persistenz und Regeneration dieser Art hängt stark von der subtropischen Waldumgebung ab. Zum Beispiel die Sämlinge und Setzlinge von P. krempfii wurden auf die Schattenumgebung unter dem Blätterdach des Waldes beschränkt (Nguyen und Thomas 2004). Leider nehmen Umfang und Qualität seiner Lebensräume aufgrund menschlicher Aktivitäten (z. Der Verlust des Lebensraums könnte die Populationsgröße von . verringert haben P. krempfii in der Vergangenheit und würde eine Erholung der Bevölkerung in der Zukunft verhindern. Daher der erste Versuch, das vorhandene zu bergen P. krempfii Bevölkerung sollte der Schutz und die Wiederherstellung des Lebensraums sein, der P. krempfii angepasst ist.

Die vor Ort Naturschutz allein kann die Art jedoch nicht erhalten und wiederherstellen wegen der begrenzten Verbreitung von P. krempfii. Deswegen, ex situ Auch der Erhaltung sollte hohe Priorität eingeräumt werden, um die Verschlechterung und Fragmentierung der Lebensräume auszugleichen. In dieser Hinsicht können Einführungen entworfen werden, um sich selbst erhaltende Wildpopulationen zu etablieren, und diese Praxis sollte in geeigneten Lebensräumen durchgeführt werden.

Der hohe Anteil an leerem Saatgut erkannt in P. krempfii deutet darauf hin, dass diese Art an Inzuchtdepression leidet. Daher könnten traditionelle Züchtungspraktiken wie kontrollierte Kreuzungen zwischen genetisch unterschiedlichen Populationen, sogar zwischen Individuen desselben Bestands, hilfreich sein, um die genetische Vielfalt in P. krempfii. Kontrollierte Kreuzungen sind wichtige genetische Werkzeuge sowohl für die Züchtung als auch für die Erhaltung von Wildpopulationen von wirtschaftlich und ökologisch wichtigen Pflanzenarten. Obwohl die Bevölkerungsdifferenzierung gering war in P. krempfii, einige Populationspaare (z. B. Bidoup vs. Cong Troi 103) zeigte eine beträchtliche Divergenz (Daten nicht gezeigt). Daher erscheinen kontrollierte Kreuzungen zwischen diesen Populationen sinnvoll, und es könnte eine Samenplantage für die Produktion von genetisch verbessertem Saatgut von P. krempfii, aber der potenzielle Nutzen sollte vor der vollständigen Umsetzung evaluiert werden. Zukünftige Studien sollten sowohl genomische als auch ökologische Daten verwenden, um die Evolutionsgeschichte von . besser zu verstehen P. krempfii und zusätzliche Erhaltungsanstrengungen (z. B. Auskreuzungsbewertung und Bestandsanalyse der Population) zu unternehmen, um bessere quantitative Wiederfindungskriterien für diese Art zu entwickeln.


Schau das Video: Single Nucleotide Polymorphisms SNPs (Kann 2022).