Information

Verständnis der Rekombinationsbewertung in Familienstammbäumen

Verständnis der Rekombinationsbewertung in Familienstammbäumen


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich habe einige Probleme, die Rekombination zu verstehen, und ich bin mir nicht sicher, welches Element mir hier fehlt. Diese Figur ist ein Beispiel aus meinem Lehrbuch. Der Stammbaum gehört einer Familie mit einem autosomal Dominant Krankheit, typisiert für einen Marker mit den Allelen A1-A6.

Also, alle Meiose sind phasenbekannt, was bedeutet, dass wir wissen, welche Kombination von Allelen von jedem Elternteil geerbt wurde. Anscheinend führt uns dies dazu, in der Lage zu sein eindeutig Score III1-III5 als nicht-rekombinant (N) und III6 als rekombinant (R).

Hier verliere ich mich, ich verstehe nicht, wie es möglich ist, jedes Individuum eindeutig als N oder R zu bewerten. Auch wenn die Krankheit dominant ist, wie ist es möglich, dass III6 betroffen ist, da beide Allele von beiden stammen? unbeeinflusst I1 und II2?

EDIT: Blaue Farbe im Stammbaum bedeutet, dass die Person von einer Krankheit betroffen ist, Weiß symbolisiert nicht betroffene Personen. Ich glaube, die roten Sterne symbolisieren, dass die Person das Krankheitsgen trägt. Das würde bedeuten, dass Blau das Krankheitsgen nicht trägt. Wenn dies der Fall ist Die rote Farbe von III2 ist ein Fehler in der Abbildung.


Ns sind auf genomischer Ebene nicht nicht rekombinant. Was Sie wissen ist, dass sie keine Rekombinationsereignisse am Risikoallel-Locus zeigen, da Probanden, die den Marker A1 tragen, Anzeichen der Krankheit zeigen und ähnlich gesunde Probanden keinen Marker A1 tragen. Daher werden sie als nicht rekombinant bezeichnet. Darüber hinaus zeigen Probanden der 3. Generation (außer III6) Kombinationen von Allelen, die die Vererbung eines Allels von jedem Elternteil widerspiegeln.

Ganz wichtig ist, dass A1 nicht das Allel ist, sondern das Marker für das Risikoallel. Dies bedeutet, dass A1 nicht direkt das Allel ist, sondern eine DNA-Region in der Nähe des die Krankheit auslösenden Allels, ausreichend nahe, um die meiste Zeit mit dem Krankheitsallel mitvererbt zu werden.

Für III6 wissen Sie eigentlich, dass eine Rekombination stattgefunden haben muss, da diese Person offensichtlich das Risikoallel trägt (zeigt die Krankheit), aber nicht den damit verbundenen Marker, daher fand ein Rekombinationsereignis zwischen dem Marker und dem Krankheitsallel statt.


Analyse der genetischen Verknüpfung

Abstrakt

Die Kopplungsanalyse ist eine etablierte statistische Methode zur Kartierung der Gene für erbliche Merkmale auf ihre Chromosomenpositionen. Genomweite Marker werden in Stammbäumen getestet, die ein Merkmal trennen. Das statistische Verfahren der Kopplungsanalyse kombiniert diese Daten, um Chromosomenregionen zu identifizieren, die wahrscheinlich Gene für das Merkmal beherbergen. Die parametrische Kopplungsanalyse wird für Merkmale mit einer Mendelschen Form der Vererbung verwendet. LOD-Scores und Rekombinationsfraktionen werden verwendet, um die Genorte zu testen. Die modellfreie Kopplungsanalyse wird für komplexe Merkmale verwendet, wenn das Vererbungsmodell nicht bekannt ist. Die Kopplungsanalyse kann verwendet werden, um Gene für binäre und quantitative Merkmale zu kartieren.


Immunologie der Infektion

Aurelie Cobat, . Erwin Schurr, in Methoden der Mikrobiologie, 2010

1 Prinzip

Die modellbasierte Kopplungsanalyse nach der klassischen Lod-Score-Methode (Morton, 1955) erfordert die Definition des Modells, das die Beziehung zwischen dem Phänotyp und Faktoren spezifiziert, die seine Expression beeinflussen können, hauptsächlich ein mutmaßliches Gen mit zwei Allelen (d, D) und andere relevante Risikofaktoren, die oft als genetisches (oder Phänotyp/Genotyp-)Modell bezeichnet werden. Im Kontext eines binären Phänotyps (zB betroffen/unbetroffen, seronegativ/seropositiv) sollte dieses genetische Modell neben der Häufigkeit des mit D bezeichneten Suszeptibilitätsallels auch den Penetranzvektor, also die Wahrscheinlichkeit, mit der ein Individuum betroffen ist, spezifizieren einen Genotyp (dd, Dd oder DD) und einen fachspezifischen Satz relevanter Kovariaten wie Alter oder Intensität der Exposition gegenüber einem Infektionserreger. Im Rahmen eines quantitativen Phänotyps (zB Infektionsniveaus) umfasst die vollständige Spezifikation des genetischen Modells neben der Häufigkeit des Allels, das für hohe Werte des mit D bezeichneten Merkmals prädisponiert, die drei genotypspezifischen Mittelwerte und Varianzen, die kann auch durch einzelne Kovariaten beeinflusst werden. Aufgrund des Genotyps wird die Verteilung des Phänotyps als normal angenommen, so dass die Gesamtverteilung eine Mischung aus drei Normalverteilungen ist.

Das genetische Modell wird im Allgemeinen durch Segregationsanalyse bereitgestellt und geschätzt, die der erste Schritt ist, um aus Familiendaten den Vererbungsmodus eines bestimmten Phänotyps zu bestimmen. Das Ziel der Segregationsanalyse besteht darin, zwischen den verschiedenen Faktoren zu unterscheiden, die eine familiäre Ähnlichkeit verursachen, mit dem Hauptziel, die Existenz eines einzelnen Gens, das als Hauptgen bezeichnet wird, zu testen. Der Hauptgenbegriff bedeutet nicht, dass es das einzige Gen ist, das an der Expression des Phänotyps beteiligt ist, sondern dass es unter den beteiligten Genen mindestens ein Gen gibt, dessen Wirkung wichtig genug ist, um von den anderen unterschieden zu werden. Für einen binären Phänotyp kann dieser Effekt durch relative Risiken ausgedrückt werden, z. das Verhältnis der Wahrscheinlichkeit, dass ein Subjekt bei einem „DD“-Genotyp betroffen ist, zur gleichen Wahrscheinlichkeit bei einem „dd“-Genotyp. Bei einem quantitativen Phänotyp wird dieser Effekt anhand des Anteils der phänotypischen Varianz gemessen, der durch das Hauptgen erklärt wird (auch als Heritabilität bezeichnet). Ein eleganter Weg, dieses Phänotyp/Genotyp-Modell auszudrücken, besteht darin, einen regressiven Ansatz für binäre (Bonney, 1986) sowie für quantitative (Bonney, 1984) Merkmale zu verwenden. Eine detaillierte Übersicht über die Vor- und Nachteile der Segregationsanalyse findet sich in Jarvik (1998) . Beachten Sie, dass in Kopplungsstudien der Ausdruck „Hauptgen“ für jedes Gen verwendet wird, das einem signifikanten Kopplungspeak unterliegt.

Wenn durch Segregationsanalyse Beweise für ein Hauptgen vorliegen, ermöglicht die modellbasierte Kopplungsanalyse die Bestätigung und Lokalisierung dieses Gens, das im Folgenden als Phänotyp-Locus bezeichnet wird. Die modellbasierte Kopplungsanalyse testet in Familien, ob der Phänotyp-Locus mit genetischen Markern bekannter chromosomaler Lage ko-segregiert und liefert eine Schätzung der Rekombinationsrate zwischen diesen beiden Loci (Ot, 1999) (siehe Kasten 2). Die Verknüpfung mit dem Phänotyp-Locus kann Marker für Marker (Zweipunktanalyse) oder unter Berücksichtigung eines Satzes verknüpfter Marker (Mehrpunktanalyse) getestet werden. Bei dieser Analyse werden wie bei der Segregationsanalyse alle Rückschlüsse auf einzelne Genotypen am Phänotyp-Locus aus den einzelnen Phänotypen und dem spezifizierten Phänotyp/Genotyp-Modell gezogen. Für quantitative Phänotypen wird die Wahrscheinlichkeit, dass ein Individuum den Genotyp dd, dD oder DD am Phänotyp-Locus trägt, aus der Mischung der drei oben beschriebenen Normalverteilungen berechnet, für die Mittelwerte und Varianzen durch Segregationsanalyse geschätzt wurden.

Modellbasierte Verknüpfungsanalyse

Prinzip:

Die modellbasierte Kopplungsanalyse testet in Familien, ob der Trait-Locus mit genetischen Markern bekannter chromosomaler Lage ko-segregiert. Die Methode basiert auf der Schätzung eines einzigen Parameters, der Rekombinationsfraktion (bezeichnet als θ) zwischen dem Merkmalslokus und einem bestimmten genetischen Marker. Der Linkage-Test ist ein Likelihood-Ratio-Test, der die Likelihood unter der Nullhypothese ohne Kopplung (θ0 = 0.5), LH0, auf die Wahrscheinlichkeit unter der Alternativhypothese der Verknüpfung (θ1 & 0,5), LH1. Die Linkage-Statistik wird klassisch als Lod-Score ausgedrückt, Z(θ) = log10(LH1/LH0). Die klassischen kritischen Werte, um eine signifikante Verknüpfung zu deklarieren und eine Verknüpfung auszuschließen, sind lod-Score ≥3 (entspricht a P-Wert von 10 –4 ) bzw. lod-Score &lt–2 (Morton, 1955).

Beispiel:

Der obige Stammbaum zeigt die Segregation eines seltenen autosomal dominanten Trait Locus (D/d, wobei D das kausale Allel ist) mit vollständiger Penetranz und Abwesenheit von Phänokopien (dh Individuen mit den Genotypen Dd oder DD sind betroffen und Individuen mit dem Genotyp dd sind unbeeinflusst) und einen informativen Marker (1/2). Die Mutter ist für die Verknüpfung nicht informativ. Da die Phase bekannt ist, können wir die Anzahl der Rekombinanten zählen k (das ist 1 und bezeichnet R) aus n = 10 Meiose. Die Arbeitswahrscheinlichkeit des Stammbaums beträgt L(θ) = k (1 – θ) nk = θ(1 – θ) 9 . Die Wahrscheinlichkeit des Stammbaums unter der Nullhypothese ist L(0,5) = (0,5) 10 . Die Schätzung der maximalen Wahrscheinlichkeit von θ ist einfach zu berechnen, da k/n = 1/10 und der lod-Score ist lod = log10(0,1(1–0,1) 9 /0,5 10 ) = 1,6. Die Ergebnisse der modellbasierten Kopplungsanalyse werden in lod-Score-Tabellen präsentiert, in denen die lod-Scores für eine Reihe von Rekombinationsfraktionen von 0 bis 0,5 tabelliert sind.

Die Schwäche:

Die modellbasierte Kopplungsanalyse erfordert die Definition des genetischen Modells, das die Beziehung zwischen Phänotyp und Genotyp beschreibt, dh die Krankheitsallelhäufigkeit, den Vererbungsmodus (dominant, rezessiv oder additiv) und das Penetranzmuster (dh die Wahrscheinlichkeit, dass aufgrund des Genotyp-Status betroffen sind) müssen spezifiziert werden, um aus ihrem Phänotyp auf den Krankheitslokus-Genotyp aller Individuen schließen zu können. Diese Parameter werden im Allgemeinen durch komplexe Segregationsanalysen geschätzt.

Stärke:

Der Lod-Score-Ansatz ist die leistungsstärkste Kopplungsmethode, wenn das angenommene genetische Modell das wahre Modell ist. Dieser Ansatz liefert eine maximale Wahrscheinlichkeitsschätzung der genetischen Distanz (θ) zwischen dem genetischen Marker und dem Lokus der Krankheitsmerkmale.

Beliebte Software:

VERBINDUNG (Lathrop et al., 1984), FASTLINK (Cottingham et al., 1993), MERLIN (Abecasis et al., 2002 )

Eine Liste mit Genanalyse-Software ist verfügbar unter http://linkage.rockefeller.edu/soft

Der Lod-Score-Ansatz ist sicherlich die leistungsstärkste Kopplungsmethode, wenn das angenommene genetische Modell dem wahren Modell (nahe genug) entspricht. Dies ist bei einer monogenen Vererbung der Fall, bei der ein einfaches genetisches Modell angenommen werden kann. Eine Fehlspezifikation des genetischen Modells kann jedoch sowohl zu einem starken Verlust der Fähigkeit zum Nachweis von Kopplungen (und damit zu einem falschen Ausschluss der Region, die den Phänotyp-Locus enthält) als auch zu einer Verzerrung bei der Schätzung des Rekombinationsanteils (dh der genetischen Distanz) zwischen den Phänotyp-Locus und der Marker-Locus ( Clerget-Darpoux et al., 1986). Dennoch beeinträchtigt eine solche Fehlspezifikation die Robustheit der Methode nicht, d. h. sie führt nicht zu falschen Schlussfolgerungen zugunsten einer Kopplung, solange nur ein Phänotyp/Genotyp-Modell getestet wird. Wenn einige Kenntnisse über die Prävalenz der untersuchten Krankheit und den Grad der familiären Aggregation vorliegen, besteht ein übliches Verfahren zur Verringerung des Risikos einer Fehlspezifikation darin, eine begrenzte Anzahl realistischer genetischer Modelle für die Lod-Score-Analyse zu erstellen. Wenn die Analyse jedoch unter einer Reihe verschiedener genetischer Modelle durchgeführt wird, muss man eine Korrektur für Mehrfachtests vornehmen und das Signifikanzniveau des Lod-Scores anpassen ( MacLean et al., 1993). Das gleiche Problem tritt auf, wenn mehrere Marker getestet werden, und es wurden Richtlinien vorgeschlagen, um die Lod-Score-Schwellenwerte an den Kontext einer genomweiten Suche anzupassen. Weithin akzeptierte Schwellenwerte werden von Lander und Kruglyak (1995) vorgeschlagen. Basierend auf komplexen analytischen Berechnungen definierten diese Autoren die P-Werte, die verwendet werden sollten, um eine suggestive oder signifikante Verknüpfung zu beanspruchen, als 1,7 × 10 –3 und 4,9 × 10 –5 (entsprechend einem Lod-Score von 1,9 bzw. 3,3) (Lander und Kruglyak, 1995). Ein weiteres Problem entsteht, wenn bei einigen Familienmitgliedern Markerdaten fehlen. In diesem Fall hängt die Kopplungsanalyse auch von Markerallelfrequenzen ab und eine Fehlspezifikation dieser Frequenzen kann sowohl die Leistung als auch die Robustheit der Methode beeinträchtigen. Dies ist ein wichtiges Thema, denn es bedeutet, dass man sehr vorsichtig sein sollte, wenn man im Zusammenhang mit einer Stichprobe mit vielen vermissten Eltern über einen suggestiven oder signifikanten Zusammenhang berichtet. Beachten Sie, dass die beiden letztgenannten Probleme (Testen mehrerer Marker und Fehlspezifikation der Markerallelfrequenzen) auch bei modellfreien Methoden auftreten.


Komplexe Erkrankungen entstehen durch viele genomische Varianten, gepaart mit Umwelteinflüssen (wie Ernährung, Schlaf, Stress und Rauchen). Sie werden auch als „polygene“ Krankheiten bezeichnet – wobei „poly“ viele und „gene“ mit Beteiligung von Genen bedeutet.

Die koronare Herzkrankheit ist eine komplexe Erkrankung. Forscher haben etwa 60 Genomvarianten gefunden, die bei Menschen mit koronarer Herzkrankheit häufiger vorkommen. Die meisten dieser Varianten sind über das Genom verteilt und gruppieren sich nicht auf einem bestimmten Chromosom.


Diskussion

Rekombination und Reassortierung elterlicher Genome führen zu einer Zunahme der genetischen Variation. Das Verständnis der Mechanismen, die die Rekombinationsrate während der Meiose regulieren, würde ihre Manipulation ermöglichen, die Rekombinationsraten gemäß den in [39] beschriebenen spezifischen Anforderungen zu erhöhen oder zu verringern. Obwohl viele Gene identifiziert wurden, die den grundlegenden Prozess der CO-Bildung steuern, ist wenig über Faktoren bekannt, die die CO-Zahl und -Verteilung sowie die GWRR beeinflussen. Unseres Wissens ist die vorliegende Arbeit die umfassendste Studie, die meiotische Rekombinationsraten und CO-Interferenz innerhalb einer Spezies und zwischen Genpools derselben Spezies vergleicht. Wir verwendeten zwei Panels von Mais-Halbgeschwisterfamilien mit 23 Vollgeschwister-Populationen mit insgesamt 2.233 DH-Linien, um die intraspezifische Variation der Rekombinationsraten und Rekombinationslandschaften zu analysieren. Die Eltern der beiden Panels für Dent- und Flint-Mais wurden ausgewählt, um die Vielfalt des europäischen Maiskeimplasmas zu repräsentieren. Wir haben DH-Linien analysiert von in vivo haploide Induktion, die eine einzelne weibliche Meiose widerspiegelt. Erwartungsgemäß war die durchschnittliche Anzahl von Kreuzungen pro DH-Linie in unserer Studie (15,1) etwa halb so hoch wie bei Mais-RILs (28,9) [32]. Dieser Nachteil von DH-Linien wird durch die schnellere Entwicklung der DH-Populationen im Vergleich zu RILs und durch die vollständige Homozygotie der DH-Linien, die eine unsterbliche Ressource sind, ausgeglichen. Darüber hinaus bietet die Arbeit an DH-Populationen die einzigartige Möglichkeit, CO-Interferenzen zu analysieren, während dies in RILs unmöglich ist, da die aufeinanderfolgenden unabhängigen Meioses die während jeder Meiose entstehenden COs überlagern. Das Design unserer verbundenen Halbgeschwister-Panels mit einer großen Anzahl von Populationen ermöglichte Vergleiche von GWRR, Rekombinationslandschaft und Interferenzen (1) über die Eltern innerhalb jedes Panels und (2) über die Panels über Kreuze der Mittellinien mit der Linie B73.

Als Voraussetzung für unseren Ansatz haben wir hochdichte genetische Karten für eine Vielzahl von Populationen erstellt. Die Längen der genetischen Karten der 23 Populationen variierten von 1.180 cM bis 1.893 cM mit einem Mittelwert von 1.508 cM, was in dem Bereich liegt, der in anderen genetischen Karten mit hoher Dichte von Mais beobachtet wird [32, 33]. Aufgrund von IBD-Regionen in einigen unserer Populationen wurden Lücken in den genetischen Karten beobachtet. Da sich die meisten dieser Lücken jedoch in perizentromeren Regionen befanden, wo die Rekombinationsraten niedrig sind, waren die meisten von ihnen nicht größer als 15 cM, wobei die extremste Lücke (53,7 cM) auf Chromosom 7 in CFF13 lag. Für 76 Marker fanden wir Chromosomenzuordnungen, die sich von ihrer Annotation im B73 AGPv2 unterscheiden. Wir lieferten genetische Koordinaten für 118 Marker, für die keine Annotation verfügbar war. Diese Ergebnisse könnten dazu beitragen, zukünftige B73-Genom-Assemblys zu verbessern. Darüber hinaus wurden genetische Karten für mehrere chromosomale Regionen gefunden, die nicht kollinear mit der B73-Sequenz waren, wie zuvor von zwei anderen Maispopulationen nachgewiesen wurde [33]. Diese Diskrepanzen können die Folge von Fehlanordnungen im B73-Genom sein oder auf mangelnde Locus-Spezifität für einige SNP-Marker zurückzuführen sein, die in duplizierte genomische Regionen fallen würden. Die Hypothese von strukturellen Umlagerungen zwischen einigen der Elternlinien und B73 kann nicht ausgeschlossen werden. Angesichts des Versuchsdesigns ist jedoch die Möglichkeit, dass beide Elternteile einer Kreuzung innerhalb einer der Halbgeschwistertafeln eine strukturelle Variation aufweisen, die bei beiden Elternteilen einer anderen Kreuzung in derselben Tafel fehlt, sehr begrenzt.

Intraspezifische Variation der Rekombinationsrate

Die durchschnittliche GWRR in unseren Populationen betrug 0,73 cM/Mbp, was im gleichen Bereich liegt, der aus anderen Maiskarten berechnet werden kann [30]. Dieser Wert ist etwa 5-mal niedriger als in A. thaliana (3,6 cM/Mb) [40], das ein 20-fach kleineres Genom als Mais hat, was die bekannte negative Korrelation der Rekombinationsrate mit der Genomgröße zwischen den Arten widerspiegelt [41]. Wir fanden klare Unterschiede zwischen den chromsomweiten Rekombinationsraten, wobei Chromosom 4 den niedrigsten Durchschnittswert (0,60 cM/Mbp) und Chromosom 9 den höchsten (0,88 cM/Mb) aufwies. Wir beobachteten auch eine negative Korrelation zwischen der Rekombinationsrate und der physikalischen Länge der Chromosomen (R = 0.66, P Wert 0,003), ähnlich wie bei Mensch, Maus und Ratte [19]. Solche Korrelationen legen nahe, dass die Mechanismen, die die CO-Bildung in diesen Organismen regulieren, dazu neigen, ein gewisses Maß an Homöostase in der Anzahl der COs pro Meiose und pro Chromosom zu erzwingen. Bei sehr kurzen Chromosomen sorgt das obligatorische CO dafür, dass für jedes Bivalent mindestens ein CO vorhanden ist. Wir beobachteten in dieser Studie eine klare intraspezifische Variation für GWRR. Ähnliche Variationen für GWRR wurden in beiden Pools beobachtet, nachdem der Effekt der zentralen Linie entfernt wurde.

Die Berechnung des GWRR geht von einer konstanten Genomgröße in Mais aus. Bei Mais wurden Genomgrößenunterschiede berichtet, wobei gemäßigte Maislinien im Vergleich zu B73 bis zu 10 % kleinere Genome aufwiesen und diese Unterschiede mit der Anzahl der Knob-Wiederholungen korrelierten [42]. Die Genomgrößen für die Linien in unserer Studie sind nicht bekannt, jedoch ist der Unterschied der Kartenlängen von bis zu 60 % (1.180 bis 1.893 cM) in unserer Studie viel größer als die kürzlich berichteten Genomgrößenunterschiede [42]. Daher kann davon ausgegangen werden, dass über mögliche Genomgrößenvariationen hinaus genetische Faktoren, die GWRR beeinflussen, eine starke Rolle in unserem Pflanzenmaterial spielen. Unterschiede in der Rekombinationshäufigkeit zwischen Mais-Inzuchtlinien wurden auf der Grundlage genetischer Kopplungskarten und unter Verwendung zytologischer Methoden zum Nachweis von Rekombinationsknoten und zur Berechnung von CO-Raten beschrieben [3, 43]. Trans-wirkende QTL, die GWRR beeinflussen, wurden identifiziert in A. thaliana, Mais, Maus und Weizen [44]. Bei Rindern wurden mehrere QTL für männliche GWRR kartiert [45].Für zwei QTL wurden mutmaßliche kausale Varianten in den Genen nachgewiesen REC8 (ein Mitglied der Kleisin-Familie von Proteinen zur "strukturellen Erhaltung der Chromosomen") und RNF212, ein mutmaßliches Homolog der Hefe PLZ3 Gen, das an der meiotischen Rekombination beteiligt ist. RNF212 Es ist auch bekannt, dass es beim Menschen mit einer genomweiten Rekombination assoziiert ist [46]. Unsere Ergebnisse zu unterschiedlichen GWRR zwischen einzelnen Maislinien ebnen den Weg für die Entwicklung spezifischer Kreuzungen zur Identifizierung genetischer Faktoren, die die GWRR durch QTL-Kartierung beeinflussen [47]. Angesichts der Fortschritte bei der Hochdurchsatz-Genotypisierung und Genomsequenzierung können solche QTL ein Ausgangspunkt für die Feinkartierung und anschließende Klonierung von Genen sein, die die GWRR in Pflanzen bestimmen. Die Charakterisierung der strukturellen und funktionellen Variation solcher Gene würde unser Verständnis der molekularen Mechanismen fördern, die die meiotische Rekombination in Pflanzen regulieren, und wäre ein äußerst wertvolles Werkzeug für Pflanzenzüchter und Genetiker.

Rekombinationslandschaften in Mais

Nicht nur GWRR, sondern auch die Landschaften der Rekombination entlang der Chromosomen sind in unseren Populationen sehr variabel. Wir beobachteten charakteristische Formen von Marey-Kartenkurven für jedes der 10 Maischromosomen. Die Gesamtrekombinationsprofile für jedes Chromosom folgen tendenziell der Gendichte [34], aber dies erklärt nicht die lokalen Unterschiede in der Rekombinationsrate zwischen den Populationen. Strukturelle Variationen zwischen Elternlinien können ein Mechanismus sein, der die lokalen Rekombinationsraten beeinflusst, wie für einen 26-kb-Retrotransposon-Cluster gezeigt, der die lokale Rekombinationsrate um die bz1 Lokus um den Faktor zwei [48]. Für dieselbe genomische Region wurde gezeigt, dass die Haplotypstruktur, definiert durch das Vorhandensein von Helitronen und Retrotransposons, das Auftreten von Rekombinationsereignissen in heterozygoten Pflanzen stark beeinflusst [49]. Die umfangreiche strukturelle Variation im Maisgenom ist bereits auf Karyotyp-Ebene zu erkennen, wo große Variationen berichtet wurden [50], aber noch mehr auf Sequenzebene, wo große Variationen für den Gehalt an repetitiven Elementen, Anwesenheit-Abwesenheit oder beobachtet wurden Kopienzahlvarianten [42, 51, 52]. Solche strukturellen Variationen können die Paarung von Homologen und die Rekombination beeinflussen [53], obwohl auch invertierte Regionen in Pachyten normal paaren können [54]. Abgesehen von den niedrigen Rekombinationsraten in den heterochromatischen perizentromeren und NOR-Regionen und einem allgemeinen Anstieg der Rekombinationsraten in Richtung der Telomere beobachteten wir Knicke in unseren Marey-Kartenkurven in Regionen, in denen heterochromatische Knospen in Mais kartiert wurden. Dies ist zum Beispiel auf Chromosom 4L in allen Populationen der Fall, aber nur in einigen Populationen auf Chromosom 1L, was darauf hindeutet, dass Variationen in den Knob-Regionen in unseren Linien existieren können. Obwohl bei Mais und seinem wilden Vorläufer Teosinte 34 verschiedene Knob-Regionen beschrieben wurden, enthalten die meisten Maislinien weniger als 12 solcher Knobs, bei denen zusätzlich Polymorphismen zwischen den Linien beobachtet werden [38, 55]. Aufgrund fehlender Daten zu Knob-Positionen in unseren Elternlinien konnten wir den Einfluss des Knob-Polymorphismus auf die Form der Rekombinationslandschaften für einzelne Chromosomen nicht genauer untersuchen. Da Noppen häufig in gendichten Regionen lokalisiert sind und die lokale Rekombination unterdrücken [38] ist es wahrscheinlich, dass einige Unterschiede in der Form der Rekombinationslandschaft durch Noppen-Polymorphismus verursacht werden. Auch außerhalb der mutmaßlichen Knob-Regionen beobachteten wir viele signifikante lokale Unterschiede beim paarweisen Vergleich von Rekombinationsprofilen zwischen Populationen und für Chromosomen 2, 4, 5 und 6 zwischen den gepoolten Dent- und Flint-Populationen. Wir fanden keine signifikante Korrelation zwischen der genetischen Ähnlichkeit der Eltern, die durch SNP-Marker bestimmt wurde, und der Rekombinationsrate, ein Ergebnis, das durch eine kürzlich durchgeführte Studie in . bestätigt wurde A. thaliana[40]. Daher müssen andere Faktoren als die Gendichte und Ähnlichkeit auf DNA-Ebene existieren, die die lokalen Rekombinationsraten beeinflussen. Es muss jedoch angemerkt werden, dass für die Charakterisierung des Einflusses genomischer Merkmale wie der Nukleotiddiversität auf die lokale Rekombinationsrate die 10-Mbit/s-Skala zu grob sein kann, sodass eine viel höhere Auflösung auf der Kilobasen-Skala erforderlich sein könnte, wie kürzlich im Modell gezeigt Pflanze, Anlage Medicago Truncatula[56]. Darüber hinaus spiegelt die elterliche Diversität, wie sie von den hauptsächlich genetischen SNPs des MaizeSNP50-Arrays bewertet wird, möglicherweise nicht gut die strukturellen Unterschiede wider, die einen großen Einfluss auf die lokalen Rekombinationsraten haben können [49]. Unsere Studie hat genomische Regionen mit großen Unterschieden in den lokalen Rekombinationsraten zwischen Inzuchtlinien identifiziert. Dies ist eine wichtige Grundlage für zukünftige Studien, um Rekombinations-Hotspots zu identifizieren und den Einfluss von struktureller Variation und Genomdiversität in definierten Kreuzungen und genomischen Regionen in Mais zu untersuchen.

Frequenzweichenstörung

In Mais wurde bereits gezeigt, dass Interferenzen auftreten [17], basierend auf der Anzahl und Position der Knötchen der späten Rekombination. Diese Arbeit ergab, dass bei Mais zwei Wege funktionieren, von denen einer stört (P1) und der andere (P2) einen Anteil beisteuert P von nicht störenden Frequenzweichen. In der vorliegenden Studie fanden wir in den meisten Fällen auch Werte von P deutlich von Null verschieden, mit durchschnittlichen Werten von 0,1. Diese Schlussfolgerung ist mit den vorherigen Schätzungen kompatibel, die einen Durchschnittswert von 0,15 auswiesen [17]. Die Populationen, in denen wir gefunden haben P = 0 (CFF04, CFF06, CFF13) kann aufgrund begrenzter Populationsgrößen meist eine geringe Power widerspiegeln: Hier haben einzelne Populationen zwischen 50 und 134 DH-Linien, während in [17] der Datensatz mehr als 200 pachytene synaptonemale Komplexe aufwies ( SCs), jeder von ihnen gibt der Analyse etwa viermal mehr Leistung als eine DH-Linie. Es sollte jedoch beachtet werden, dass unsere statistischen Tests aufgrund der Bonferroni-Korrektur sehr konservativ waren. Dennoch fanden wir, dass CFF02 einen Anteil hatte P der nicht störenden (P2) Crossovers signifikant höher als bei fast allen anderen Populationen, wenn alle Chromosomen gepoolt werden. Unterschiede in den Interferenzmerkmalen zwischen verschiedenen Genotypen derselben Art wurden unseres Wissens bisher nicht gezeigt. Werte von P zwischen 0 und 0,2 für verschiedene Chromosomen wurden in . gemeldet A. thaliana[11] und beim Menschen zwischen 0 und 0,21 [57]. Basierend auf Vergleichen zwischen MLH1-Foci und späten Rekombinationsknoten, P Bei Tomaten wurden Werte um 0,3 gefunden [14]. In Anbetracht der Intensität nu der Interferenz im Interferenzweg P1 zeigten unsere Ergebnisse Werte im Bereich zwischen 2,5 und 8 für alle gepoolten Chromosomen, was dem Bereich von 4 bis 10 ähnlich ist, der zuvor in Mais gefunden wurde [17]. In Arabidopsis, nu lag im Bereich von 10 bis 21 [11], während nu wurde bei Tomaten auf einen Bereich von 6,9 bis 7,9 geschätzt [14]. Schließlich fanden wir, basierend auf den 23 Vollgeschwister-Populationen, eine signifikant negative Korrelation zwischen den Chromosomen-gepoolten nu und die genomweite Rekombinationsrate. Dieses Ergebnis stimmt mit der Hypothese überein, dass Interferenz einer der Mechanismen sein könnte, um das Ausmaß der meiotischen Rekombination zu regulieren und die Reparatur von DSBs in Richtung von Nicht-COs statt COs zu verlagern. Im Vergleich zu den in unserer Studie gefundenen hochsignifikanten Unterschieden für GWRR wird die Variation für CO-Störungen hier mit deutlich geringerer statistischer Aussagekraft erfasst. Zukünftige Arbeiten mit höheren Populationsgrößen, die kleinere Konfidenzintervalle liefern, aber unter Verwendung des gleichen Halbgeschwisterdesigns sollte es möglich sein, die Auswirkungen der Gründereltern allein auf die Interferenzparameter zu schätzen, indem die Auswirkungen der Zentrallinien entfernt werden, wie wir es für getan haben GWRR. Ähnlich wie bei GWRR soll dies auch die Identifizierung und Lokalisierung genetischer Einflussfaktoren auf Störparameter ermöglichen.

Einfluss der Variation der Rekombinationsraten auf genetische Studien und angewandte Züchtungsprogramme

Die Abdeckung des gesamten Genoms mit dichten genetischen Karten erhöht die Chance, Marker-Merkmals-Assoziationen zu erkennen, sowohl bei Kopplungsanalysen als auch bei Assoziationskartierungen. Die Erstellung hochdichter genetischer Karten ist heute für viele Nutzpflanzenarten auf sehr kosteneffiziente Weise möglich, entweder durch SNP-Genotypisierungs-Arrays oder durch Genotyping-by-Sequencing-Ansätze [33, 58]. Für eine präzise Abschätzung von QTL-Effekten in genomweiten Assoziationsstudien und eine hochgenaue genomweite Vorhersage von Zuchtwerten ist es eine Voraussetzung, dass Marker entweder die kausalen Allele markieren oder sich in einem hohen Kopplungsungleichgewicht mit dem interessierenden QTL befinden [24, 59]. Die Kopplungsphase zwischen Marker- und günstigen QTL-Allelen ist entscheidend für die Vorhersage von Zuchtwerten über Rassen oder Genpools hinweg [60]. Rekombinationsereignisse können Kopplungsphasen von Marker- und QTL-Allelen zwischen nicht verwandten Pools umkehren und somit zu einer verringerten Genauigkeit bei der Vorhersage von Zuchtwerten und Markereffekten führen. Im Kontext genomischer Vorhersagen oder genomweiter Assoziationsstudien ist das Verständnis der Rekombinationslandschaft innerhalb einer Art von besonderem Interesse, da Regionen mit hohen Rekombinationsraten höhere Markerdichten erfordern. Darüber hinaus ermöglicht ein detailliertes genomweites und lokales Bild der Rekombinationsraten eine angemessene Dimensionierung von kartenbasierten Klonierungsprojekten, markergestützten Selektionsstrategien für bestimmte Merkmale und Kreuzungsprogrammen in Fällen, in denen ungünstige Verknüpfungen zwischen Merkmalen aufgebrochen werden müssen. Die Rekombination ist ein Schlüsselfaktor, der den Erfolg bei der Einschleusung neuer Variabilität aus entfernt verwandten pflanzengenetischen Ressourcen oder schlecht angepasstem Material bestimmt, da die Einschleusung neuer Allele oder Merkmale wie Resistenzgene bei der rekurrenten Selektion oft mit einem unerwünschten Kopplungsschleppen einhergeht. Diese Effekte des Bindungswiderstands können drastisch sein, wenn die interessierenden Regionen in (peri)zentromeren, rekombinationsarmen Regionen lokalisiert sind. Die Auswahl von Elite-Linien mit hohem GWRR als wiederkehrende Rückkreuzungseltern kann helfen, den Introgressionsprozess zu beschleunigen. Schließlich kann die Identifizierung von Genotypen, die Allele für eine höhere Rekombinationsrate tragen, die Auswahl geeigneter Eltern zur Optimierung der Anzahl von Generationen, die in Zuchtschemata erforderlich sind, leiten. Variabilität der Interferenzstärke kann auch in Zuchtprogrammen von Interesse sein, da angenommen wird, dass Interferenzen die Rekombinationsraten mechanistisch beeinflussen. Ebenso wie bei der Auswahl von Linien mit höheren oder niedrigeren Rekombinationsraten [61] sollte es möglich sein, Maislinien mit unterschiedlicher CO-Störung bzw. P2-CO-Anteil zu entwickeln.


RootsTech Connect 2021: Umfassende DNA-Sitzungsliste

Ich habe mich gefragt, wie viele DNA-Sessions dieses Jahr bei RootsTech waren und welche die beliebtesten sind.

Leider konnten wir nicht einfach eine Liste aller Sitzungen anzeigen, also habe ich meine eigene erstellt. Ich wollte sicherstellen, dass jede Session mit eingeschlossen wird, einschließlich Tipps und Tricks und Vendor-Sessions, die möglicherweise nur an ihren Ständen verfügbar sind. Ich habe jedes Menü und jede Gruppe durchforstet und immer mehr vergrabene DNA-Schätze an verschiedenen Orten gefunden.

Ich teile diese Schatzkiste unten mit dir. Und das hat übrigens einen ganzen Tag gedauert, weil ich den YouTube-Direktlink aufgelistet habe UND wie viele Views jede Session heute gesammelt hat.

Verkauf verlängert

Die Stammbaum-DNA-RootsTech-Verkaufspreise einschließlich Upgrades sind weiterhin verfügbar – hier.

  • Der FamilyTreeDNA autosomal Family Finder Test kostet jetzt nur 49 US-Dollar.Klicken Sie hier, um mit dem Gutscheincode RTCTFF zu kaufen. bietet das erweiterte Tool Unlock für nur 9 $ nach einer kostenlosen Überweisung bis zum 7. März an. Klicken Sie hier, um sich anzumelden, laden Sie Ihre DNA-Datei hoch, wenn Sie an anderer Stelle getestet haben, und entsperren Sie sie dann mit dem Code RTCAU10.

MyHeritage hat auch seine RootsTech-Angebote verlängert.

  • MyHeritage verzichtet auf die Freischaltgebühr von 29 USD, wenn Sie Ihr DNA-Kit zwischen jetzt und dem 7. März von einem anderen Anbieter übertragen. Hier können Sie kostenlos hochladen. Sie erhalten alle erweiterten Tools kostenlos.
  • Das MyHeritage DNA-Kit ist hier für 79 US-Dollar erhältlich.

Weder Ancestry noch 23andMe hatten Show-Verkäufe, aber Sie können zu ihren regulären Preisen einkaufen.

Alle ernsthaften Ahnenforscher werden bei allen 4 großen Anbietern testen oder auf diese übertragen und ihre Y-DNA und mitochondriale DNA bei FamilyTreeDNA testen.

RootsTech-Sitzungen

Wie Sie wissen, hat RootsTech dieses Jahr für das TED-Talk-Format gedreht. Ungefähr 20-minütige Sitzungen. Als alles gesagt und getan war, gab es fünf Kategorien von Sitzungen:

  • Kuratierte Sitzungen sind etwa 20-minütige Präsentationen, die von RootsTech kuratiert werden, was bedeutet, dass die Referenten einreichen mussten. Personen, deren Sitzungen akzeptiert wurden, wurden ermutigt, längere Sitzungen in eine Reihe von zwei oder drei 20-minütigen Sitzungen aufzuteilen.
  • Videos von Anbieterständen könnten in ihre virtuellen Stiefel geladen werden, ohne von RootsTech kuratiert zu werden, aber kuratierte Videos ihrer Mitarbeiter könnten auch in die Anbieterstände geladen werden.
  • Die Sitzungen des DNA-Lernzentrums fanden auf Einladung statt und wurden von Freiwilligen bereitgestellt. Sie dauern in der Regel zwischen 10-20 Minuten.
  • Tipps und Tricks werden ebenfalls von Freiwilligen erstellt und dauern zwischen 1 und 15 Minuten. Sie können von einem Unternehmen gesponsert werden und in einigen Fällen nutzten kleinere Anbieter und Dienstleister diese, um auf ihre Produkte und Dienstleistungen aufmerksam zu machen.
  • Einstündige Sitzungen sind in der Regel fortgeschritten und Themen, die nicht leicht in eine Reihe aufgeteilt werden können.

Schauen Sie sich diese erstaunliche Liste von 129 DNA- oder DNA-bezogenen Sitzungen an, die Sie im nächsten Jahr kostenlos ansehen können. Stellen Sie sicher, dass Sie diesen Artikel mit einem Lesezeichen versehen, damit Sie leicht zurückgreifen können.

Bitte beachten Sie, dass ich mit der Zusammenstellung dieser Liste für mich selbst begonnen und einige der Sitzungsnamen gekürzt habe. Dann wurde mir klar, dass du das auch brauchst, wenn ich das brauche.

Top 10 der meistgesehenen Sitzungen

Ich wusste nicht, ob ich diese Sitzungen nach Sprechernamen oder nach den meisten Ansichten auflisten sollte, also mache ich ein bisschen von beidem.

Die Top 10 der meistgesehenen Sessions (Stand heute):

Sprecher/Anbieter Sitzungstitel Typ Verknüpfung Ansichten
Libby Copeland Wie der DNA-Test zu Hause die Familiengeschichte neu definiert hat Kuratierte Sitzung https://youtu.be/LsOEuvEcI4A 13,554
Nicole Färber Organisieren Sie Ihre DNA-Übereinstimmungen in einem Diagramm Tipps und Tricks https://youtu.be/UugdM8ATTVo 6175
Roberta Estes DNA-Triangulation: Was, Warum und Wie 1 Stunde https://youtu.be/nIb1zpNQspY 6106
Tim Janzen Nachfahren von Ahnenlinien im 18. Jahrhundert mit DNA Teil 1 Kuratierte Sitzung https://youtu.be/bB7VJeCR6Bs 5866
Amy Williams Ahnenrekonstruktion: Warum, Wie, Werkzeuge Kuratierte Sitzung https://youtu.be/0D6lAIyY_Nk 5637
Drew Smith Bevor Sie die Grundlagen testen, Teil 1 Kuratierte Sitzung https://youtu.be/wKhMRLpefDI 5079
Nicole Färber So interpretieren Sie ein DNA-Cluster-Diagramm Tipps und Tricks https://youtu.be/FI4DaWGX8bQ 4982
Nicole Färber So bewerten Sie eine ThruLines-Hypothese Tipps und Tricks https://youtu.be/ao2K6wBip7w 4823
Kimberly Brown Warum stimme ich nicht mit meinen Match’-Matches überein? DNA-Lernzentrum https://youtu.be/A8k31nRzKpc 4593
Rhett Dabling, Diahan Southard Ergebnisse der DNA-Ethnizität verstehen Kuratierte Sitzung https://youtu.be/oEt7iQBPfyM 4287

Libby Copeland muss absolut begeistert sein. Mir ist aufgefallen, dass ihre Sitzung über das Wochenende an einem sehr prominenten Ort auf der RootsTech-Website vorgestellt wurde.

Sitzungen nach Sprecher

Die folgende Liste enthält die englischsprachigen Sitzungen nach Sprechern. Ich entschuldige mich dafür, dass ich nicht erkennen kann, in welchen nicht-englischen Sitzungen es um DNA geht.

Lassen Sie sich nicht von einer geringeren Anzahl von Aufrufen entmutigen. Ich habe schon einige davon gesehen und sie sind großartig. Ich vermute, dass Sitzungen von bekannteren Referenten oder solchen, deren Sitzungen in den erstklassigen Immobilienbereichen aufgeführt waren, mehr Ansichten haben, aber was Sie brauchen, kann in einer anderen Sitzung nur auf Sie warten. Sie müssen nicht auswählen und auswählen und sie sind alle an einem Ort für Sie da.

Sprecher/Anbieter Sitzungstitel Typ Verknüpfung Ansichten
Alison Wilde SCREEN-Methode: Ein DNA-Match-Notizen-System, das wirklich hilft DNA-Lernzentrum https://youtu.be/WaNnh_v1rwE 791
Bernstein braun Genealogist-on-Demand: Die Hilfe, die Sie brauchen, mit einem Budget, das Sie sich leisten können Kuratierte Sitzung https://youtu.be/9KjlD6GxiYs 256
Ammon Knaupp Muster der genetischen Vererbung DNA-Lernzentrum https://youtu.be/Opr7-uUad3o 824
Amy Williams Ahnenrekonstruktion: Warum, Wie, Werkzeuge Kuratierte Sitzung https://youtu.be/0D6lAIyY_Nk 5637
Amy Williams Rekonstruktion der Eltern-DNA und Analyse von Verwandten bei HAPI-DNA, Teil 1 Kuratierte Sitzung https://youtu.be/MZ9L6uPkKbo 1021
Amy Williams Rekonstruktion der Eltern-DNA und Analyse von Verwandten bei HAPI-DNA, Teil 2 Kuratierte Sitzung https://youtu.be/jZBVVvJmnaU 536
Abstammung DNA-Übereinstimmungen Kuratierte Sitzung https://youtu.be/uk8EKXLQYzs 743
Abstammung Durchgangsleitungen Kuratierte Sitzung https://youtu.be/RAwimOgNgUE 1240
Abstammung Ancestry DNA Communities: Bringen Sie neue Entdeckungen in Ihre Familienforschung Kuratierte Sitzung https://youtu.be/depeGW7QUzU 422
André Kearns Hilfe für Afroamerikaner beim Aufspüren von Vorfahren von Sklavenhaltern mithilfe von DNA Kuratierte Sitzung https://youtu.be/mlnSU5UM-nQ 2211
Barb Groth Ich habe dich gefunden: Methoden, um versteckte Familienmitglieder zu finden Kuratierte Sitzung https://youtu.be/J93hxOe_KC8 1285
Beth Taylor DNA- und Genealogie-Grundlagen DNA-Lernzentrum https://youtu.be/-LKgkIqFhL4 967
Beth Taylor Was mache ich mit Cousin-Matches? DNA-Lernzentrum https://youtu.be/LyGT9B6Mh00 1349
Beth Taylor Mit DNA unbekannte Verwandte finden DNA-Lernzentrum https://youtu.be/WGJ8IfuTETY 2166
David Ouimette Ich bin adoptiert – Wie verwende ich DNA, um meine Eltern zu finden? Kuratierte Sitzung https://youtu.be/-jpKgKMLg_M 365
Debbie Kennett Geheimnisse und Überraschungen: Geheimnisse der Familiengeschichte durch DNA aufdecken Kuratierte Sitzung https://youtu.be/nDnrIWKmIuA 2899
Debbie Kennett Genetische Genealogie trifft CSI Kuratierte Sitzung https://youtu.be/sc-Y-RtpEAw 589
Diahan Southard Was ist ein Centimorgan? Tipps und Tricks https://youtu.be/uQcfhPU5QhI 2923
Diahan Southard Verwenden des freigegebenen cM-Projekts DNA-Lernzentrum https://youtu.be/b66zfgnzL0U 3172
Diahan Southard Ethnizitätsergebnisse verstehen DNA-Lernzentrum https://youtu.be/8nCMrf-yJq0 1587
Diahan Southard Probleme mit geteilten Centimorganen DNA-Lernzentrum https://youtu.be/k7j-1yWwGcY 2494
Diahan Southard 4 nächste Schritte für Ihre DNA Kuratierte Sitzung https://youtu.be/poRyCaTXvNg 3378
Diahan Southard Ihre DNA-Fragen beantwortet Kuratierte Sitzung https://youtu.be/uUlZh_VYt7k 3454
Diahan Southard Sie können die DNA machen – Wir können helfen Tipps und Tricks https://youtu.be/V5VwNzcVGNM 763
Diahan Southard Was ist ein DNA-Match? Tipps und Tricks https://youtu.be/Yt_GeffWhC0 314
Diahan Southard Diahans Tipps für DNA-Übereinstimmungen Tipps und Tricks https://youtu.be/WokgGVRjwvk 3348
Diahan Southard Diahan’s Tipps für Y DNA Tipps und Tricks https://youtu.be/QyH69tk-Yiw 620
Diahan Southard Diahans Tipps zu mtDNA-Tests Tipps und Tricks https://youtu.be/6d-FNY1gcmw 2142
Diahan Southard Diahan’s Tipps zu ethnischen Ergebnissen Tipps und Tricks https://youtu.be/nZFj3zCucXA 1597
Diahan Southard Diahans Tipps zum DNA-Test Tipps und Tricks https://youtu.be/t𔃂R8H8q0U 2043
Diahan Southard Diahans Tipps, wann Ihre Spiele nicht reagieren Tipps und Tricks https://youtu.be/LgHtM3nS60o 3009
Diahan Southard Drei nächste Schritte: Bekannte Übereinstimmungen verwenden Tipps und Tricks https://youtu.be/z1SVq8ME42A 118
Diahan Southard Drei nächste Schritte: MRCA/DNA und der Paper Trail Tipps und Tricks https://youtu.be/JB0cVyk-Y4Q 80
Diahan Southard Drei nächste Schritte: Beginnen Sie mit bekannten Übereinstimmungen Tipps und Tricks https://youtu.be/BSNhaQCNtAo 68
Diahan Southard Drei nächste Schritte: Zusätzliche Tools Tipps und Tricks https://youtu.be/PqNPBLQSBGY 140
Diahan Southard Drei nächste Schritte: Ancestry ThruLines Tipps und Tricks https://youtu.be/KWayyAO8p_c 335
Diahan Southard Drei nächste Schritte: MyHeritage Relativitätstheorie Tipps und Tricks https://youtu.be/Et2TVholbAE 80
Diahan Southard Drei nächste Schritte: Wen testen? Tipps und Tricks https://youtu.be/GyWOO1XDh6M 111
Diahan Southard Drei nächste Schritte: Genetik vs. Genealogie Tipps und Tricks https://youtu.be/Vf0DC5eW_vA 294
Diahan Southard Drei nächste Schritte: Centimorgan-Definition Tipps und Tricks https://youtu.be/nQF935V08AQ 201
Diahan Southard Drei nächste Schritte: Gemeinsame Spiele Tipps und Tricks https://youtu.be/AYcR_pB6xgA 233
Diahan Southard Drei nächste Schritte: Fallstudie – Einen MRCA finden Tipps und Tricks https://youtu.be/YnlA9goeF7w 256
Diahan Southard Drei nächste Schritte: Warum DNA verwenden Tipps und Tricks https://youtu.be/v-o4nhPn8ww 266
Diahan Southard Drei nächste Schritte: Bekannte Übereinstimmungen finden Tipps und Tricks https://youtu.be/n3N9CnAPr18 688
Diana Älteste Verwenden von DNA-Ethnizitätsschätzungen in Ihrer Forschung Tipps und Tricks https://youtu.be/aJgUK3TJqtA 1659
Diane Älteste Verwendung von DNA in einem Kundenforschungsprojekt, um ein Familienrätsel zu lösen 1 Stunde https://youtu.be/ysGYV6SXxR8 1261
Donna Rutherford DNA und die Siedler von Taranaki, Neuseeland Kuratierte Sitzung https://youtu.be/HQxFwie4774 214
Drew Smith Bevor Sie die Grundlagen testen, Teil 1 Kuratierte Sitzung https://youtu.be/wKhMRLpefDI 5079
Drew Smith Bevor Sie die Grundlagen testen, Teil 2 Kuratierte Sitzung https://youtu.be/Dopx04UHDpo 2769
Drew Smith Bevor Sie die Grundlagen testen, Teil 3 Kuratierte Sitzung https://youtu.be/XRd2IdtA-Ng 2360
Elena Fowler Whakawhanaungatanga mit DNA – Es ist kompliziert (Māori-Erbe) Kuratierte Sitzung https://youtu.be/6XTPMzVnUd8 470
Elena Fowler Whakawhanaungatanga mit DNA – FamilyTreeDNA (Māori-Erbe) Kuratierte Sitzung https://youtu.be/fM85tt5ad3A 269
Elena Fowler Whakawhanaungatanga mit DNA – Vorfahren (Māori-Erbe) Kuratierte Sitzung https://youtu.be/-byO6FOfaH0 191
Esmee Mortimer-Taylor Lebende DNA: Anathea Ring – Ihre Geschichte Tipps und Tricks https://youtu.be/MTE4UFKyLRs 189
Esmee Mortimer-Taylor Lebende DNA: Coretta Scott King Academy – DNA-Ergebnisse enthüllen Tipps und Tricks https://youtu.be/CK1EYcuhqmc 82
Fonte Felipe Ethnische Filter und DNA-Übereinstimmungen: Der Weg nach vorn, um Ihre Abstammung zu finden Kuratierte Sitzung https://youtu.be/mt2Rv2lpj7o 553
FTDNA – Janine Cloud Großes Y: Was ist das? Warum brauche ich es? Kuratierte Sitzung https://youtu.be/jiDcjWk4cVI 2013
FTDNA – Sherman McRae Verwendung von DNA, um in der Sklaverei verlorene Vorfahren zu finden Kuratierte Sitzung https://youtu.be/i3VKwpmttBI 738
Jerome Speere Schwer fassbare entfernte afrikanische Cousins: Mithilfe von DNA können sie gefunden werden Kuratierte Sitzung https://youtu.be/fAr-Z78f_SM 335
Karen Stanbary Ausschließen statt Einschließen: DNA und das GPS in Aktion 1 Stunde https://youtu.be/-WLhIHlSyLE 548
Katherine Borges DNA- und Abstammungsgesellschaften Tipps und Tricks https://youtu.be/TBYGyLHHAOI 451
Kimberly Brown Warum stimme ich nicht mit meinen Match’-Matches überein? DNA-Lernzentrum https://youtu.be/A8k31nRzKpc 4593
Kitty Munson Cooper Grundlagen der Erforschung unbekannter Abstammung mit DNA Teil 1 Kuratierte Sitzung https://youtu.be/2f3c7fJ74Ig 2931
Kitty Munson Cooper Grundlagen der Erforschung unbekannter Abstammung mit DNA Teil 2 Kuratierte Sitzung https://youtu.be/G7h-LJPCywA 1222
Lauren Vasylyev Cousins ​​​​durch DNA finden Kuratierte Sitzung https://youtu.be/UN7WocQzq78 1979
Lauren Vasylyev, Camille Andrus Vorfahren durch DNA finden Kuratierte Sitzung https://youtu.be/4rbYrRICzrQ 3919
Leah Larkin Endogamie entwirren Teil 1 Kuratierte Sitzung https://youtu.be/0jtVghokdbg 2291
Leah Larkin Endogamie entwirren Teil 2 Kuratierte Sitzung https://youtu.be/-rXLIZ0Ol-A 1441
Liba Casson-Budell Ein Licht auf die jüdische Genealogie werfen Kuratierte Sitzung https://youtu.be/pHyVz94024Y 162
Libby Copeland Wie der DNA-Test zu Hause die Familiengeschichte neu definiert hat Kuratierte Sitzung https://youtu.be/LsOEuvEcI4A 13,554
Linda Farrell Starten Sie Ihre südafrikanische Recherche Kuratierte Sitzung https://youtu.be/So7y9_PBRKc 339
Lebendige DNA Wie man einen lebenden DNA-Tupfer macht Tipps und Tricks https://youtu.be/QkbxhqCw7Mo 50
Lynn Broderick Ethische Überlegungen unter Verwendung von DNA-Ergebnissen Kuratierte Sitzung https://youtu.be/WMcRiDxPy2k 249
Mags Gaulden Bedeutung und Vorteile von Y-DNA-Tests DNA-Lernzentrum https://youtu.be/MVIiv0H7imI 1032
Maurice Gleeson Verwenden von Y-DNA, um Ihren Nachnamen zu recherchieren Kuratierte Sitzung https://youtu.be/Ir4NeFH_aJs 1140
Melanie McComb Georgetown Memory Project: Bewahrung der Geschichten des GU272 Kuratierte Sitzung https://youtu.be/Fv0gHzTHwPk 320
Michael Kennedy Was können Sie mit Ihrem DNA-Test machen? DNA-Lernzentrum https://youtu.be/rKOjvkqYBAM 616
Michelle Leonard Verständnis der X-Chromosom-DNA-Übereinstimmung Kuratierte Sitzung https://youtu.be/n784kt-Xnqg 775
Mein Erbe So analysieren Sie DNA-Übereinstimmungen auf MH Kuratierte Sitzung https://youtu.be/gHRvyQYrNds 1192
Mein Erbe DNA – eine Übersicht Kuratierte Sitzung https://youtu.be/AIRGjEOg_xo 389
Mein Erbe Erweiterte DNA-Tools Kuratierte Sitzung https://youtu.be/xfZUAjI5G_I 762
Mein Erbe So beginnen Sie mit Ihren DNA-Matches Tipps und Tricks https://youtu.be/rU_dq1vt6z4 1901
Mein Erbe So filtern und sortieren Sie Ihre DNA-Übereinstimmungen Tipps und Tricks https://youtu.be/aJ7dRwMTt90 1008
Nicole Färber So interpretieren Sie ein DNA-Cluster-Diagramm Tipps und Tricks https://youtu.be/FI4DaWGX8bQ 4982
Nicole Färber So bewerten Sie eine ThruLines-Hypothese Tipps und Tricks https://youtu.be/ao2K6wBip7w 4823
Nicole Färber Organisieren Sie Ihre DNA-Übereinstimmungen in einem Diagramm Tipps und Tricks https://youtu.be/UugdM8ATTVo 6175
Nicole Färber Forschung in den Südstaaten Kuratierte Sitzung https://youtu.be/Pouw_yPrVSg 871
Olivia Fordiani Grundlegende genetische Genealogie verstehen DNA-Lernzentrum https://youtu.be/-kbGOFiwH2s 810
Pamela Bailey Informationen gesucht: Wiedervereinigung einer durch Sklaverei getrennten amerikanischen Familie Tipps und Tricks https://youtu.be/DPCJ4K8_PZw 105
Patricia Coleman Erste Schritte mit DNA Painter DNA-Lernzentrum https://youtu.be/Yh_Bzj6Atck 1775
Patricia Coleman Hinzufügen von MyHeritage-Daten zu DNA Painter DNA-Lernzentrum https://youtu.be/rP9yoCGjkLc 458
Patricia Coleman Hinzufügen von 23andMe-Daten zu DNA Painter DNA-Lernzentrum https://youtu.be/pJBAwe6s0z0 365
Penny Walters DNA mit Papierspur mischen DNA-Lernzentrum https://youtu.be/PP4SjdKuiLQ 2693
Penny Walters Zusammenarbeit mit DNA-Übereinstimmungen, wenn Sie adoptiert sind DNA-Lernzentrum https://youtu.be/9ioeCS22HlQ 1222
Penny Walters Unterschiede in der Ethnizität zwischen meinen 6 Kindern DNA-Lernzentrum https://youtu.be/RsrXLcXRNfs 400
Penny Walters Unterschiede in den DNA-Ergebnissen zwischen meinen 6 Kindern DNA-Lernzentrum https://youtu.be/drnzW3FXScI 815
Penny Walters Ethische Dilemmata bei DNA-Tests DNA-Lernzentrum https://youtu.be/PRPoc0nB4Cs 437
Penny Walters Annahme – Hintergrundkontext Kuratierte Sitzung https://youtu.be/qC1_Ln8WCNg 1054
Penny Walters Annahme – Verwendung von DNA-Tests zur Erstellung eines Bio-Stammbaums Kuratierte Sitzung https://youtu.be/zwJ5QofaGTE 941
Penny Walters Annahme – Ethische Dilemmata und vielfältige Folgen der Suche nach Bio-Familien Kuratierte Sitzung https://youtu.be/ZLcHHTSfCIE 576
Penny Walters Ich will meine Mama: Altes und modernes Ägypten Kuratierte Sitzung https://youtu.be/_HRO50RtzFk 311
Rebecca Whitman Koford BCG: Kurze Schritt-für-Schritt-Tour durch die BCG-Website Tipps und Tricks https://youtu.be/YpV9bKG6sXk 317
Renate Yarborough Sanders DNA die Grundlagen verstehen DNA-Lernzentrum https://youtu.be/bX_flUQkBEA 2713
Renate Yarborough Sanders Testen oder nicht testen DNA-Lernzentrum https://youtu.be/58-qzvN4InU 1048
Rhett Dabling Die Heimat der Vorfahren durch DNA finden Kuratierte Sitzung https://youtu.be/k9zixg4uL1I 505
Rhett Dabling, Diahan Southard Ergebnisse der DNA-Ethnizität verstehen Kuratierte Sitzung https://youtu.be/oEt7iQBPfyM 4287
Richard Preis Biologische Familie finden Tipps und Tricks https://youtu.be/L9C-SGVRZLM 101
Robert Kehrer Werden sie meine DNA teilen (Einwilligung, Richtlinien usw.) DNA-Lernzentrum https://youtu.be/SUo-jpTaR1M 480
Robert Kehrer Was ist ein Centimorgan? DNA-Lernzentrum https://youtu.be/dopniLw8Fho 1194
Roberta Estes DNA-Triangulation: Was, Warum und Wie 1 Stunde https://youtu.be/nIb1zpNQspY 6106
Roberta Estes Vorfahren der Mutter DNA-Lernzentrum https://youtu.be/uUh6WrVjUdQ 3074
Robin Olsen Wirthlin Wie kann mir DNA helfen, meine Vorfahren zu finden? Kuratierte Sitzung https://youtu.be/ZINiyKsw0io 1331
Robin Olsen Wirthlin DNA Tools Glockenkurve Tipps und Tricks https://youtu.be/SYorGgzY8VQ 1207
Robin Olsen Wirthlin DNA-Prozessbäume führen Sie bei der Verwendung von DNA in der Familienforschung Tipps und Tricks https://youtu.be/vMOQA3dAm4k 1708
Shannon Combs-Bennett DNA-Grundlagen leicht gemacht DNA-Lernzentrum https://youtu.be/4JcLJ66b0l4 1560
Shannon Combs-Bennett DNA-Steinmauern DNA-Lernzentrum https://youtu.be/vtFkT_PSHV0 450
Shannon Combs-Bennett Grundlagen der genetischen Genealogie Teil 1 Kuratierte Sitzung https://youtu.be/xEMbirtlBZo 2263
Shannon Combs-Bennett Grundlagen der genetischen Genealogie Teil 2 Kuratierte Sitzung https://youtu.be/zWMPja1haHg 1424
Steven Micheleti, Joanna Mountain Genetische Folgen des transatlantischen Sklavenhandels Teil 1 Kuratierte Sitzung https://youtu.be/xP90WuJpD9Q 2284
Steven Micheleti, Joanna Mountain Genetische Folgen des transatlantischen Sklavenhandels Teil 2 Kuratierte Sitzung https://youtu.be/McMNDs5sDaY 742
Thom Reed Wie kann uns die Verbindung mit Vorfahren vervollständigen? Kuratierte Sitzung https://youtu.be/gCxr6W-tkoY 392
Tim Janzen Nachfahren von Ahnenlinien im 18. Jahrhundert mit DNA Teil 1 Kuratierte Sitzung https://youtu.be/bB7VJeCR6Bs 5866
Tim Janzen Nachfahren von Ahnenlinien im 18. Jahrhundert mit DNA Teil 2 Kuratierte Sitzung https://youtu.be/scOtMyFULGI 3008
Ugo Perego Stärken und Grenzen genetischer Tests für die Familienanamnese DNA-Lernzentrum https://youtu.be/XkBK1y-LVaE 480
Ugo Perego Eine persönliche genetische Reise DNA-Lernzentrum https://youtu.be/Lv9CSU50xCc 844
Ugo Perego Entdeckung der Ureinwohner Amerikas durch DNA Kuratierte Sitzung https://youtu.be/L1cs748ctx0 884
Ugo Perego Mitochondriale DNA: Unsere mütterlicherseits vererbte Familiengeschichte Kuratierte Sitzung https://youtu.be/Z5bPTUzewKU 599
Vivs Laliberte Einführung in die Y-DNA DNA-Lernzentrum https://youtu.be/rURyECV5j6U 752
Yetunde Moronke Abiola 6% Nigerianer: Auf der Suche nach meinem vermissten nigerianischen Vorfahren Kuratierte Sitzung https://youtu.be/YNQt60xKgyg 494

Ich erhalte einen kleinen Beitrag, wenn Sie in meinen Artikeln auf einige der Links zu Anbietern klicken. Dies erhöht NICHT den Preis, den Sie zahlen, sondern hilft mir, die Lichter anzulassen und diesen Informationsblog für alle kostenlos zu machen. Bitte klicken Sie auf die Links in den Artikeln oder zu den Anbietern unten, wenn Sie Produkte oder DNA-Tests kaufen.


Lösungsschlüssel Arbeitsblatt zur Stammbaumanalyse Antworten / Arbeitsblatt zur genetischen Tabelle Antwort | Druckbare Arbeitsblätter und .

Lösungsschlüssel Arbeitsblatt zur Stammbaumanalyse Antworten / Arbeitsblatt zur genetischen Tabelle Antwort | Druckbare Arbeitsblätter und . . Das absolut am besten geeignete Thema kann Ihr Leben wirklich rationalisieren, da es herausfordernde Lösungen und anspruchsvolle Stile zusammen mit maximiert. Das Erstellen eines Arbeitsblattdesigns kann Ihnen wirklich dabei helfen, viel Zeit zu sparen. Es wird gezeigt, wie man eine genaue Ahnentafel erstellt. Die Geschwindigkeit des Programms war den Verbrauchern im Allgemeinen wichtig, aber in der heutigen Arbeitswelt ist es nicht nur erwünscht, sondern auch zu erwarten. D kann nicht ausgeschlossen werden. Stammbäume überprüfen Artikel Stammbäume Khan Academy. Welche Mitglieder der oben genannten Familie sind von der Huntington-Krankheit betroffen? Mit dem Arbeitsblatt können die Schüler das Fach allgemein leichter verstehen. Die Verwendung von Arbeitsblättern bedeutet, dass die Schüler in der Lage sind, Fragen zu Themen zu beantworten, die sie gelernt haben. Spektrumdatenanalyse und Wahrscheinlichkeitsgrade 6 8 Statistik.

Wenn klar, hat er eine normale Blutgerinnung. Mikroelektronik-Schaltungsanalyse und -Design Donald. Wenn es verdunkelt ist, hat er Hämophilie Arbeitsblatt zur Stammbaumanalyse aus den Antworten auf das Arbeitsblatt des Stammbaums, Quelle:

Human Pedigree Worksheet Answer Key - kidsworksheetfun from kidsworksheetfun.com Verbraucher, aber in der heutigen Arbeitswelt wird es nicht nur gewünscht, sondern auch erwartet. Das Arbeitsblatt zur Stammbaumanalyse beantwortet die Frage, wie eine Stammbaumanalyse durchgeführt wird. Erstellen eines Stammbaum-Arbeitsblatts Antworten, Blutgruppen-Stammbaum-Arbeitsblatt, Stammbaum-Arbeitsblatt mit Antwortschlüssel, Stammbaum-Arbeitsblatt Sichelzellenanämie. Dieses Quiz und das dazugehörige Arbeitsblatt können Ihnen bei der Bewertung helfen. Einige der folgenden Arbeitsblätter sind Stammbaum-Arbeitsblätter mit Antwortschlüssel, die die Komponenten eines Stammbaums untersuchen: einfache Stammbäume analysieren und einen menschlichen Stammbaum mit mehreren interessanten Fragen mit Antworten interpretieren. Ahnentafel-Arbeitsblattschlüssel i ii 1 2 1 2 4 5 3 = Huntington-Krankheit 6 7 8 iii 1 2 3 4 5 1. Ahnentafel-Arbeitsblatt-Antwort Schlüsselbiologie-Kidz-Aktivitäten während der Ahnentafel-Analyse Antworten auf das Arbeitsblatt. Die Antworten auf das Arbeitsblatt zur Stammbaumanalyse, Teil a, zeigt.

Die Störung verursacht einen Mangel an Pigmenten in Haut und Haaren, was einen Albino mit weißem Haar sehr blass erscheinen lässt.

Ahnentafel-Analyse Arbeitsblatt aus Ahnentafel-Arbeitsblatt-Antworten, Quelle: .4 Ahnentafel-Diagramme interpretieren in einer kleinen Gruppe oder alleine arbeiten. Wenn es verdunkelt ist, hat er Hämophilie Das Arbeitsblatt zur Stammbaumanalyse beantwortet die Frage, wie eine Stammbaumanalyse durchgeführt wird. Die Verwendung von Arbeitsblättern bedeutet, dass die Schüler in der Lage sind, Fragen zu Themen zu beantworten, die sie gelernt haben. Einige der folgenden Arbeitsblätter sind Stammbaum-Arbeitsblätter mit Antwortschlüssel, die die Komponenten eines Stammbaums untersuchen: einfache Stammbäume analysieren und einen menschlichen Stammbaum mit mehreren interessanten Fragen mit Antworten interpretieren. Ahnentafel Arbeitsblatt Biologie, Ahnentafel Grundlagen Arbeitsblatt, Ahnentafel Arbeitsblatt, Ahnentafel Arbeitsblatt mit Antworten, Ahnentafel 33 beste Genetik Bilder auf Pinterest aus Ahnentafel Arbeitsblatt Antworten, Quelle: Mit dem Arbeitsblatt können Schüler das Fach allgemein leichter verstehen. Bei der Stammbaumanalyse ist es immer wichtig zu versuchen, umweltbedingte Ursachen von genetischen zu trennen. Mit der Beschleunigung der Technologien ist unsere Kultur zu einer einzigen geworden, in der wir sofortige Befriedigung erwarten. Wie viele Männchen gibt es?

In einem Stammbaum steht ein Quadrat für ein Männchen. .worksheet Answers Teil a ist die neueste Methode, um Glück in allen Facetten unseres Lebens zu definieren, einschließlich des Privatlebens und der Beziehungen am Arbeitsplatz. Wenn klar, hat er eine normale Blutgerinnung. Biologie 1 Praxistest Antwortschlüssel twitpic 1 5 Arbeitsblatt Antwortschlüssel Studylib Net Home Stipendienzuweisungen Zuweisung Essays Beste kundenspezifische Schreibdienste Kahoot Weltgeschichte Shorts 1 Antwortschlüssel Das Rennen um den Reichtum Geographie Notizen Formular 3 Kostenloser Download KCSe Revision. Einige der Arbeitsblätter für dieses Konzept sind Ahnentafelarbeit mit Antwortschlüssel, Ahnentafelarbeit mit Antwortschlüssel, Ahnentafelarbeit Antwortschlüssel pdf, Ahnentafelarbeit, Namensklasse Ahnentafelarbeit, Ahnentafel Übungsaufgaben und Antworten, Ahnentafelpraxis.Stammbaumanalyse der genetischen Geschichte der Familie und ihrer Störungen. Das Erstellen eines Arbeitsblattdesigns kann Ihnen wirklich dabei helfen, viel Zeit zu sparen.

8 beste Bilder zum Knacken Ihres genetischen Code-Arbeitsblatts von www.worksheeto.com Ein Stammbaum ist ein Diagramm der Vorfahren einer Person, das verwendet wird, um die Vererbung bestimmter Züge, insbesondere Krankheiten, zu analysieren. Wie viele Männchen gibt es? Wenn klar, hatte er eine normale Blutgerinnung. In einem Stammbaum steht ein Quadrat für ein Männchen. Wenn klar, hat er eine normale Blutgerinnung. Pauliks Website können Sie das Bewerbungsformular, Antwortbögen, Themen und Links zu den Antworten sowie die Beschreibung der Bandbewertung herunterladen, um Ihr Verständnis des Tests zu verbessern, wie Sie es vielleicht bereits wissen. D kann nicht ausgeschlossen werden.

.worksheet Answers Teil a ist die neueste Methode, um Glück in allen Facetten unseres Lebens zu definieren, einschließlich des Privatlebens und der Beziehungen am Arbeitsplatz.

Spektrumdatenanalyse und Wahrscheinlichkeitsgrade 6 8 Statistik. .worksheet Answers Teil a ist die neueste Methode, um Glück in allen Facetten unseres Lebens zu definieren, einschließlich des Privatlebens und der Beziehungen am Arbeitsplatz. Viele Motivatoren haben eine falsche Vorstellung von dem Material, das sie beim Treffen mit dem Publikum bereitstellen. Mit dem Arbeitsblatt können die Schüler das Fach allgemein leichter verstehen. Wenn es verdunkelt ist, hat er Hämophilie Musa 14. Mai 2018 Arbeitsblätter keine Kommentare. Wenn es verdunkelt ist, hat er Hämophilie. Ein Stammbaum ist ein Diagramm der Vorfahren einer Person, das verwendet wird, um die Vererbung bestimmter Züge, insbesondere Krankheiten, zu analysieren. In einem Stammbaum steht ein Quadrat für ein Männchen. Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ihnen basierend auf dem Galerietitel vorstellen werden. Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ahnentafel Arbeitsblatt PDF Antworten Quiz Arbeitsblatt Ahnentafel werden werden. Schlüssel zum Stammbaum-Arbeitsblatt i ii 1 2 1 2 4 5 3 = Huntington-Krankheit 6 7 8 iii 1 2 3 4 5 1. Es handelt sich um ein rezessives Merkmal, da die Generation ii die Krankheit nicht hat und die Generationen i und ii sie haben.

Stammbäume überprüfen Artikel Stammbäume Khan Academy. 84 Genetik Stammbaum Arbeitsblatt Antworten Louboutinsoldes org. Es ist ein rezessives Merkmal, da die Generation II die Krankheit nicht hat und die Generationen I und II sie haben. Identifizieren Sie die Genotypen der folgenden Personen anhand des oben angegebenen Stammbaums. Wenn klar, hat er eine normale Blutgerinnung. 32 Stammbaum Arbeitsblatt Antwortschlüssel. Die Verwendung von Arbeitsblättern bedeutet, dass die Schüler in der Lage sind, Fragen zu Themen zu beantworten, die sie gelernt haben. Stammbaumanalyse der genetischen Geschichte der Familie und ihrer Störungen. Mikroelektronik-Schaltungsanalyse und -Design Donald.

Erstellen eines Ahnentafel-Arbeitsblatts Antworten . von ecdn.teacherspayteachers.com Identifizieren Sie die Genotypen der folgenden Personen anhand des oben angegebenen Stammbaums. Spektrumdatenanalyse und Wahrscheinlichkeitsgrade 6 8 Statistik. Ahnentafel-Arbeitsblatt Antworten auf die wichtigsten Biologie-Kidz-Aktivitäten während der Ahnentafelanalyse-Arbeitsblatt-Antworten. Viele Motivatoren haben eine falsche Vorstellung von dem Material, das sie beim Treffen mit dem Publikum bereitstellen. Die Verwendung von Arbeitsblättern bedeutet, dass die Schüler in der Lage sind, Fragen zu Themen zu beantworten, die sie gelernt haben. Unsere digitale Bibliothek speichert an mehreren Orten, sodass Sie die. Wenn es verdunkelt ist, hat er Hämophilie

Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ihnen basierend auf dem Galerietitel vorstellen werden.

Wenn klar, hat er eine normale Blutgerinnung. Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ihnen basierend auf dem Galerietitel vorstellen werden. Stammbaumanalyse der genetischen Geschichte der Familie und ihrer Störungen. Ahnentafeln, autosomale Ahnentafel Arbeitsblatt Arbeitsblatt zum Ausdrucken, Ahnentafel Analyse, Ahnentafel Arbeitsblatt Arbeitsblatt zum Ausdrucken, Ahnentafel Mendelian Genetik. Mit dem Arbeitsblatt können die Schüler das Fach allgemein leichter verstehen. Wenn es verdunkelt ist, hat er Hämophilie Bei der Stammbaumanalyse ist es immer wichtig zu versuchen, umweltbedingte Ursachen von genetischen zu trennen. C ist auch theoretisch möglich, aber es ist nicht notwendig, diese Möglichkeit als Ursache anzuführen. Stammbaum männlich weiblich heterozygot zeigt Merkmal. Stammbaum-Arbeitsblatt mit Antwortschlüssel 11 beste Bilder von. In einem Stammbaum steht ein Quadrat für ein Männchen. Wie viele Männchen gibt es?

Ein typischer Stammbaum für eine Familie mit Stammbaumanalyse Arbeitsblatt Antwortschlüssel Stammbäume Stammbäume von Amöbenschwestern vor 3 Jahren 9.

Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ahnentafel Arbeitsblatt PDF Antworten Quiz Arbeitsblatt Ahnentafel werden werden.

Ahnentafel-Arbeitsblattschlüssel i ii 1 2 1 2 4 5 3 = Huntington-Krankheit 6 7 8 iii 1 2 3 4 5 1.

Wenn klar, hat er eine normale Blutgerinnung.

Es wird gezeigt, wie man eine genaue Ahnentafel erstellt.

Das Arbeitsblatt zur Stammbaumanalyse beantwortet die Frage, wie eine Stammbaumanalyse durchgeführt wird.

Einige der Arbeitsblätter für dieses Konzept sind Ahnentafelarbeit mit Antwortschlüssel, Ahnentafelarbeit mit Antwortschlüssel, Ahnentafelarbeit Antwortschlüssel pdf, Ahnentafelarbeit, Namensklasse Ahnentafelarbeit, Ahnentafel Übungsaufgaben und Antworten, Ahnentafelpraxis.

· Genetik Stammbaum Arbeitsblatt Antwortschlüssel oder Genetik Stammbaum Arbeitsblatt.

Ahnentafel-Arbeitsblattschlüssel i ii 1 2 1 2 4 5 3 = Huntington-Krankheit 6 7 8 iii 1 2 3 4 5 1.

84 Genetik Stammbaum Arbeitsblatt Antworten Louboutinsoldes org.

Antworten auf das Arbeitsblatt zur Stammbaumanalyse als Ableitung von großen Ideen beantworten Fragen.

Dieses Quiz und das dazugehörige Arbeitsblatt können Ihnen bei der Bewertung helfen.

Einige der Arbeitsblätter für dieses Konzept sind Ahnentafel-Arbeit mit Antwortschlüssel, Human-Stammbaum-Genetik-Arbeit Antwortschlüssel, Ahnentafel-Arbeits-Antwortschlüssel pdf, Ahnentafel-Arbeit, Namensklasse Ahnentafel-Arbeit, Ahnentafel.

Wenn klar, hatte er eine normale Blutgerinnung.

Die Antworten auf das Arbeitsblatt zur Stammbaumanalyse, Teil a, zeigt.

Pauliks Website können Sie das Bewerbungsformular, Antwortbögen, Themen und Links zu ihren Antworten sowie eine Beschreibung der Bandbewertung herunterladen, um Ihr Verständnis des Tests zu verbessern, wie Sie es vielleicht bereits wissen.

Es wird gezeigt, wie man eine genaue Ahnentafel erstellt.

.4 Ahnentafeln interpretieren arbeiten in einer kleinen Gruppe oder alleine zu.

Stammbaum-Arbeitsblatt mit Antwortschlüssel 11 beste Bilder von.

Wenn klar, hatte er eine normale Blutgerinnung.

Pauliks Website können Sie das Bewerbungsformular, Antwortbögen, Themen und Links zu den Antworten sowie die Beschreibung der Bandbewertung herunterladen, um Ihr Verständnis des Tests zu verbessern, wie Sie es vielleicht bereits wissen.

Ahnentafeln, autosomale Ahnentafel Arbeitsblatt Arbeitsblatt zum Ausdrucken, Ahnentafel Analyse, Ahnentafel Arbeitsblatt Arbeitsblatt zum Ausdrucken, Ahnentafel Mendelian Genetik.

Dieses Quiz und das dazugehörige Arbeitsblatt können Ihnen bei der Bewertung helfen.

Genetik Ahnentafel Arbeitsblatt Antwortschlüssel Genetik Ahnentafel Arbeitsblatt Antwortschlüssel und Ahnentafel Arbeitsblätter Antwortschlüssel sind einige der wichtigsten Dinge, die wir Ahnentafel Arbeitsblatt PDF Antworten Quiz Arbeitsblatt Ahnentafel werden werden.

Wenn es verdunkelt ist, hat er Hämophilie

C ist theoretisch auch möglich, aber es ist nicht notwendig, diese Möglichkeit als Ursache anzuführen.

Biologie 1 Praxistest Antwortschlüssel twitpic 1 5 Arbeitsblatt Antwortschlüssel Studylib Net Home Stipendienzuweisungen Zuweisung Essays Beste kundenspezifische Schreibdienste Kahoot Weltgeschichte Shorts 1 Antwortschlüssel Das Rennen um den Reichtum Geographie Notizen Formular 3 Kostenloser Download KCSe Revision.

Antworten auf das Arbeitsblatt zur Stammbaumanalyse als Ableitung von großen Ideen beantworten Fragen.


Ergebnisse

ReLERNN: Eine genaue Methode zur Schätzung der genomweiten Rekombinationslandschaft

Wir haben ReLERNN entwickelt, eine neue Deep-Learning-Methode zur genauen Vorhersage genomweiter Rekombinationsraten pro Base aus nur vier Chromosomen. Kurz gesagt bietet ReLERNN eine End-to-End-Inferenzpipeline zum Schätzen einer Rekombinationskarte aus einer Populationsstichprobe: Sie nimmt als Eingabe entweder eine Variant-Call-Format-Datei (VCF) oder, im Fall von ReLERNN für Pool-Seq-Daten, einen Vektor von Allelfrequenzen und genomischen Koordinaten. ReLERNN verwendet dann das Koaleszenz-Simulationsprogramm msprime (Kelleher et al. 2016), um Trainings-, Validierungs- und Testdatensätze entweder unter konstanter Populationsgröße oder einem abgeleiteten Populationsgrößenverlauf zu simulieren. Wichtig ist, dass diese Simulationen so parametrisiert sind, dass sie der Verteilung des Watterson-Schätzers entsprechen, θW, berechnet aus den empirischen Stichproben. ReLERNN trainiert einen bestimmten Typ von RNN, bekannt als gated recurrent unit (GRU Cho et al. 2014), um die Rekombinationsrate pro Base für diese Simulationen vorherzusagen, wobei nur die rohe Genotypmatrix und ein Vektor genomischer Koordinaten für jede Simulation verwendet werden Beispiel ( Abb. 1 und ergänzende Abb. S1 und S2 , Ergänzungsmaterial online). Es verwendet dann dieses trainierte Netzwerk, um genomweite Rekombinationsraten pro Base für empirische Proben unter Verwendung eines Schiebefenster-Ansatzes zu schätzen. ReLERNN kann optional 95 % KI um jede Vorhersage mit einem parametrischen Bootstrapping-Ansatz schätzen und verwendet die während des Bootstrappings generierten Vorhersagen, um inhärente Verzerrungen im Trainingsprozess zu korrigieren (siehe Materialien und Methoden ergänzende Abb. S3 , Ergänzungsmaterial online).

Ein Cartoon, der einen typischen Arbeitsablauf mit den vier Modulen von ReLERNN (schattierte Kästchen) für (EIN) einzeln sequenzierte Genome oder (B) gepoolte Sequenzen. ReLERNN kann optional (gestrichelte Linien) die Ausgabe von Stairwayplot, SMC++ und MSMC verwenden, um mit msprime eine demografische Geschichte zu simulieren. Trainingsinlays zeigen die verwendeten Netzwerkarchitekturen, wobei das GRU-Inlay in (B) zeigt die gated-Verbindungen innerhalb jeder versteckten Einheit. Hier, R, z, hT, und h t ˜ sind das Reset-Gate, das Update-Gate, die Aktivierung bzw. die Kandidatenaktivierung (Cho et al. 2014). Die Genotypmatrix kodiert Allele als Referenz (–1), Alternative (1) oder aufgefüllte/fehlende Daten (0 nicht gezeigt). Variantenpositionen werden entlang des reellen Zahlenstrahls (0–1) kodiert.

Ein Cartoon, der einen typischen Arbeitsablauf mit den vier Modulen von ReLERNN (schattierte Kästchen) für (EIN) einzeln sequenzierte Genome oder (B) gepoolte Sequenzen. ReLERNN kann optional (gestrichelte Linien) die Ausgabe von Stairwayplot, SMC++ und MSMC verwenden, um mit msprime eine demografische Geschichte zu simulieren. Trainingsinlays zeigen die verwendeten Netzwerkarchitekturen, wobei das GRU-Inlay in (B) zeigt die gated-Verbindungen innerhalb jeder versteckten Einheit. Hier, R, z, hT, und h t ˜ sind das Reset-Gate, das Update-Gate, die Aktivierung bzw. die Kandidatenaktivierung (Cho et al. 2014). Die Genotypmatrix kodiert Allele als Referenz (–1), Alternative (1) oder aufgefüllte/fehlende Daten (0 nicht gezeigt). Variantenpositionen werden entlang des reellen Zahlenstrahls (0–1) kodiert.

Ein wesentliches Merkmal der Netzwerkarchitektur von ReLERNN ist die bidirektionale GRU-Schicht ( Abb. 1 und ergänzende Abb. S1 , Supplementary Material online), die es uns ermöglicht, genomische Sequenz-Alignments als Zeitreihe zu modellieren. Obwohl Feed-Forward-Netzwerke als Eingabe einen vollständigen Datenblock für jedes Beispiel verwenden, unterteilen wiederkehrende Schichten jede Genotypausrichtung in Zeitschritte, die diskreten genomischen Koordinaten entsprechen, und iterieren sequentiell über die Zeitschritte. Bei jedem Zeitschritt modulieren die GRUs den Informationsfluss, indem sie Reset- und Update-Gates verwenden, die steuern, wie die Aktivierung aktualisiert wird ( Cho et al. 2014 Chung et al. 2014). Dieser Prozess ermöglicht es dem Gradientenabstiegsalgorithmus, der als Backpropagation durch die Zeit bekannt ist, Parameter über Zeitschritte hinweg zu teilen sowie Rückschlüsse auf der Grundlage der Anordnung von SNPs zu ziehen, d. h. ein räumliches Gedächtnis allelischer Assoziationen entlang des Chromosoms zu haben. Das bidirektionale Attribut der GRU-Schicht bedeutet einfach, dass jedes Beispiel dupliziert und umgekehrt wird, sodass die Sequenzdaten aus beiden Richtungen analysiert und dann durch Verkettung zusammengeführt werden. Wir präsentieren eine generalisierte GRU zur Analyse genomischer Sequenzdaten sowie einen detaillierteren Blick auf die von ReLERNN verwendeten Netzwerkarchitekturparameter in ergänzender Abbildung S1, Supplementary Material online.

Leistung auf simulierten Chromosomen

Um unsere Methode zu bewerten, führten wir Koaleszenzsimulationen mit msprime (Kelleher et al. 2016) durch und generierten vollständige Chromosomenproben mithilfe einer feinskaligen genetischen Karte, die aus Kreuzungen von . geschätzt wurde D. melanogaster (Comeron et al. 2012). Anschließend haben wir ReLERNN verwendet, um die Rekombinationslandschaft für diese simulierten Beispiele abzuschätzen. ReLERNN ist in der Lage, die Landschaft der Rekombinationsraten pro Base mit hoher Genauigkeit über einen weiten Bereich realistischer Parameterwerte, Annahmen und Stichprobengrößen vorherzusagen ( ⁠ R 2 ≥ 0,82 ⁠ mittlerer absoluter Fehler [MAE] ≤ 1,28 × 10 − 8 ). Wichtig ist, dass die Genauigkeit von ReLERNN nur geringfügig verringert wird, wenn Vorhersagen basierend auf 20 Stichproben ( ⁠ R 2 = 0,93 ⁠ MAE = 3,72 × 10 − 9 ⁠ Abb. 2A) mit denen basierend auf vier Stichproben ( ⁠ R 2 = 0,82 ⁠ MAE .) verglichen werden = 6,66 × 10 − 9 ⁠ ergänzende Abb. S4 , Ergänzungsmaterial online). Wir zeigen auch, dass ReLERNN bei phasengesteuerten und unphasengesteuerten Genotypen gleich gut abschneidet (W = 68.5 P = 0,17 Mann–Whitney U Test ergänzend Abb. S5 , Online-Ergänzungsmaterial), was darauf hindeutet, dass jegliche Auswirkungen von Rechenphasenfehlern durch Behandlung der Eingaben als nicht phasenverschobene Varianten abgemildert werden könnten.

(EIN) Vorhersagen der Rekombinationsrate für ein simuliertes Drosophila Chromosom (schwarze Linie) mit ReLERNN für individuell sequenzierte Genome (rote Linie). Die Rekombinationslandschaft wurde simuliert für n = 20 Chromosomen unter konstanter Populationsgröße unter Verwendung von msprime (Kelleher et al. 2016), mit Crossover-Raten pro Base aus D. melanogaster Chromosom 2L (Comeron et al. 2012). Graue Bänder repräsentieren 95 % CI. R 2 wird für das allgemeine lineare Modell der vorhergesagten Raten auf den wahren Raten berichtet und der mittlere absolute Fehler wurde über alle 100-kb-Fenster berechnet. (B) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) unter Verwendung von ReLERNN für Pool-Seq-Daten. Pools simuliert aus der gleichen Rekombinationslandschaft wie oben, mit n = 20 und (C) n = 50 Chromosomen über einen Bereich simulierter Lesetiefen (⁠ 0,5 × bis 5 × Inf steht für unendliche simulierte Sequenzierungstiefe). Sowohl die Bootstrap-korrigierten Vorhersagen (rot) als auch die nicht Bootstrap-korrigierten (NBSC weiß) Vorhersagen werden angezeigt.

(EIN) Vorhersagen der Rekombinationsrate für ein simuliertes Drosophila Chromosom (schwarze Linie) mit ReLERNN für individuell sequenzierte Genome (rote Linie). Die Rekombinationslandschaft wurde simuliert für n = 20 Chromosomen unter konstanter Populationsgröße unter Verwendung von msprime (Kelleher et al. 2016), mit Crossover-Raten pro Base aus D. melanogaster Chromosom 2L (Comeron et al. 2012). Graue Bänder repräsentieren 95 % CI. R 2 wird für das allgemeine lineare Modell der vorhergesagten Raten auf den wahren Raten berichtet und der mittlere absolute Fehler wurde über alle 100-kb-Fenster berechnet. (B) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) unter Verwendung von ReLERNN für Pool-Seq-Daten. Pools simuliert aus der gleichen Rekombinationslandschaft wie oben, mit n = 20 und (C) n = 50 Chromosomen über einen Bereich simulierter Lesetiefen (⁠ 0,5 × bis 5 × Inf steht für unendliche simulierte Sequenzierungstiefe). Sowohl die Bootstrap-korrigierten Vorhersagen (rot) als auch die nicht Bootstrap-korrigierten (NBSC weiß) Vorhersagen werden angezeigt.

Da ReLERNN bei nicht phasengesteuerten Genotypen außerordentlich gut funktionierte, spekulierten wir, dass es in der Lage sein könnte, wichtige Informationen über die Rekombinationsraten allein aus einem Vektor von Allelfrequenzen zu gewinnen. Daher haben wir uns vorgenommen, ReLERNN zu erweitern, um mit Pool-Seq-Daten zu arbeiten, bei denen die einzigen Eingaben ein Vektor von Allelfrequenzen und ihren entsprechenden genomischen Koordinaten sind. Überraschenderweise zeigt ReLERNN eine bescheidene Genauigkeit bei simulierten Pool-Seq-Daten, trotz simulierter Proben- und Lesetiefen von nur n = 50 und Abdeckung = 50 × ( ⁠ R 2 = 0,54 ⁠ MAE = 1,59 × 10 − 8 ⁠ ergänzende Abb. S6 , Ergänzungsmaterial online). Erhöhen der Lesetiefe auf ein nominelles 5-faches der Probentiefe (z. B. n = 50 und Abdeckung = 250 × ⁠ ) ergaben eine wesentlich höhere Genauigkeit ( ⁠ R 2 = 0,69 ⁠ MAE = 1,20 × 10 − 8 ⁠ ergänzende Abb. S7 , Ergänzungsmaterial online). Als allgemeiner Trend zeigen wir, dass der Vorhersagefehler durch Erhöhung der Anzahl der im Pool abgetasteten Chromosomen (d. h. Erhöhung der Allelfrequenzauflösung) und durch Erhöhung der Sequenzierungstiefe (d. h. Verringerung des Abtastfehlers) reduziert wird (Abb. 2B). Obwohl es derzeit Software zum Schätzen von LD in Pool-Seq-Daten gibt (Feder et al. 2012), ist ReLERNN unseres Wissens die erste Software, die Rekombinationsraten unter Verwendung dieser Daten direkt schätzt.

Obwohl ReLERNN die Genauigkeit bei kleinen Probengrößen beibehält, zeigt es eine etwas größere Sensitivität sowohl für die angenommene genomweite durchschnittliche Mutationsrate μ ¯ ⁠ als auch für den angenommenen Maximalwert für die Rekombination. ρmax. Um den Grad der Sensitivität gegenüber diesen Annahmen zu beurteilen, führten wir ReLERNN auf simulierten Chromosomen durch, wobei angenommen wurde, dass μ ¯ sowohl 50 % größer als auch 50 % kleiner als die simulierte Mutationsrate war. μwahr. In beiden Szenarien sagt ReLERNN Übergangsraten voraus, die stark mit den wahren Raten korreliert sind ( R 2 > 0,91 ⁠ ). In beiden Szenarien ist die MAE jedoch überhöht, aber immer noch bescheiden, und die absoluten Rekombinationsraten sind untervorhergesagt ( ⁠ R 2 = 0,91 ⁠ MAE = 1,23 × 10 − 8 ⁠ ergänzende Abb. S8 , Ergänzendes Material online) und leicht übervorhergesagt ( ⁠ R 2 = 0,94 ⁠ MAE = 1,28 × 10 − 8 ⁠ ergänzende Abb. S9 , Ergänzungsmaterial online) unter der Annahme, dass μ ¯ kleiner oder größer als . ist μwahr, bzw. Außerdem unterschätzen ρmax führt dazu, dass ReLERNN Rekombinationsraten unterschätzt, die ungefähr proportional zum Ausmaß der Unterschätzung sind ( ergänzende Abb. S10 und S11 , Ergänzendes Material online), während eine Überschätzung ρmax verursacht nur einen geringen Genauigkeitsverlust ( ⁠ R 2 = 0,90 ⁠ MAE = 4,07 × 10 − 9 ⁠ ergänzende Abb. S12 , Ergänzungsmaterial online). Zusammengenommen legen diese Ergebnisse nahe, dass ReLERNN tatsächlich Informationen über das Verhältnis von Crossovers zu Mutationen lernt, und obwohl ReLERNN bei der Vorhersage relativer Rekombinationsraten innerhalb eines Genoms sehr robust gegenüber falschen Annahmen ist, ist beim Vergleich absoluter Raten zwischen Organismen mit großen Unterschiede in den Schätzungen der Mutationsrate pro Base oder für Arten.Eine zusätzliche Einschränkung von ReLERNN ist seine Unfähigkeit, Hotspots mit schmaler Rekombinationsrate (hier definiert als 10 -kb genomische Regionen mit r ≥ 50 × dem genomweiten Durchschnitt) vollständig aufzulösen. Wir simulierten Hotspots unterschiedlicher Länge [Länge ∈ < 2 kb , 4 kb , 6 kb , 8 kb , 10 kb >, r Hintergrund = 2.5 e − 9 , r Hotspot = 1.25 e − 7 ] und fanden heraus, dass Fehler an Hotspots negativ waren korreliert mit der Hotspot-Länge ( ergänzende Abb. S13 , Supplementary Material online), was darauf hindeutet, dass das Signal für Übergänge an Hotspots von der Hintergrundrate innerhalb des Fokusfensters überlagert wird, insbesondere bei sehr schmalen Hotspots relativ zum Fokusfenster. Diese Einschränkung könnte von besonderer Bedeutung sein, wenn versucht wird, Hotspots in menschlichen Daten aufzulösen, deren Längen oft zwischen 1 und 2 kb liegen ( Jeffreys et al. 2001 Jeffreys und May 2004).

ReLERNN schneidet im Vergleich zu konkurrierenden Methoden günstig ab, insbesondere bei kleinen Stichprobengrößen und bei Modellfehlern

Um die Genauigkeit von ReLERNN im Vergleich zu bestehenden Methoden zu beurteilen, haben wir einen vergleichenden Ansatz gewählt, bei dem wir Vorhersagen über den gleichen Satz simulierter Testchromosomen mit Methoden gemacht haben, die sich in ihren Ansätzen stark unterscheiden. Konkret haben wir uns entschieden, ReLERNN mit zwei Arten von maschinellen Lernmethoden zu vergleichen – einer Boosted-Regression-Methode, FastEPRR (Gao et al. 2016) und einem CNN, das kürzlich in Flagel et al. (2019) – und sowohl LDhat ( McVean et al. 2002) als auch LDhelmet ( Chan et al. 2012), zwei häufig zitierte Approximation-Likelihood-Methoden. Wir haben unabhängig 10 5 Chromosomen mit msprime simuliert (Kelleher et al. 2016) [Parameter: Stichprobe _ Größe ∈ < 4 , 8 , 16 , 32 , 64 >, Rekombination _ Rate = U ( 0.0 , 6.25 e − 8 ), Mutation _ Rate = U ( 1,875 e − 8, 3,125 e − 8 ), Länge = 3 e 5 ]. Die Hälfte davon wurde unter demographischem Gleichgewicht simuliert und die andere Hälfte wurde unter einem realistischen demographischen Modell simuliert (basierend auf der Expansion des europäischen Menschen außerhalb Afrikas, siehe Materialien und Methoden). Wir zeigen, dass ReLERNN alle anderen Methoden übertrifft und einen signifikant reduzierten absoluten Fehler ( ⁠ | r vorhergesagt − r wahr | ⁠ ) sowohl unter dem demographischen Modell als auch unter Gleichgewichtsannahmen ( ⁠ T ≤ − 31 ⁠ P < 10 − 16 ⁠ post hoc Welch's zweiproben T-Tests für alle Vergleiche ergänzende Feigen. S14 und S15 , Online-Ergänzungsmaterial). ReLERNN wies auch bei einer Reihe von Stichprobengrößen eine geringere Verzerrung auf als wahrscheinlichkeitsbasierte Methoden ( Abb. 3), obwohl alle Methoden im Allgemeinen bei der größten getesteten Stichprobengröße gut abschnitten (n = 64).

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für jede Methode über 5.000 simulierte Chromosomen (1.000 für FastEPRR). Unabhängige Simulationen wurden unter einem Modell der Populationsgrößenexpansion oder (B) demografisches Gleichgewicht. Abgetastete Chromosomen geben die Anzahl unabhängiger Sequenzen an, die von jeder msprime (Kelleher et al. 2016) Koaleszenzsimulation abgetastet wurden. LDhelmet konnte nicht mit verwendet werden n = 64 Chromosomen und FastEPRR konnte nicht mit verwendet werden n = 4.

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für jede Methode über 5.000 simulierte Chromosomen (1.000 für FastEPRR). Unabhängige Simulationen wurden unter einem Modell der Populationsgrößenexpansion oder (B) demografisches Gleichgewicht. Abgetastete Chromosomen geben die Anzahl unabhängiger Sequenzen an, die von jeder msprime (Kelleher et al. 2016) Koaleszenzsimulation abgetastet wurden. LDhelmet konnte nicht mit verwendet werden n = 64 Chromosomen und FastEPRR konnte nicht mit verwendet werden n = 4.

Wir versuchten auch, die Robustheit von ReLERNN gegenüber Fehlspezifikationen des demografischen Modells zu bewerten, wobei verschiedene generative Modelle zur Simulation der Trainings- und Testsätze verwendet werden – zum Beispiel Training auf Annahmen des demografischen Gleichgewichts, wenn die Testdaten durch einen Bevölkerungsengpass generiert wurden. Methoden, die gegenüber dieser Art von Fehlspezifikation robust sind, sind von entscheidender Bedeutung, da die wahre demografische Vorgeschichte einer Stichprobe oft unbekannt ist und Methoden zur Ableitung der Bevölkerungsgrößenhistorie nicht übereinstimmen oder unzuverlässig sein können (siehe ergänzende Abb. S21 , Online-Ergänzungsmaterial). Darüber hinaus verändern Veränderungen der Populationsgröße die Landschaft der LD im gesamten Genom (Slatkin 1994 Rogers 2014) und haben daher das Potenzial, die Genauigkeit zu verringern oder verzerrte Schätzungen der Rekombinationsrate zu erzeugen.

Zu diesem Zweck trainierten wir ReLERNN an unter Gleichgewicht erzeugten Beispielen und machten Vorhersagen zu 5.000 Chromosomen, die durch das oben angegebene humane demographische Modell generiert wurden (und führten auch das reziproke Experiment Abb. 4 durch). Wir verglichen ReLERNN mit CNN, LDhat und LDhelmet, wobei alle Methoden ähnlich falsch spezifiziert waren (siehe Materialien und Methoden). Wir haben festgestellt, dass ReLERNN diese Methoden unter fast allen Bedingungen übertrifft und einen signifikant geringeren absoluten Fehler in beiden Richtungen der demografischen Modellfehlspezifikation aufweist ( ⁠ T ≤ − 26 ⁠ P WTT < 10 − 16 für alle Vergleiche, mit Ausnahme des Vergleichs mit LD-Helm unter Verwendung von 16 Chromosomen ergänzende Abb. S16 und S17, ergänzendes Material online). Wir zeigen, dass der Fehler, der direkt auf eine Modellfehlspezifikation zurückzuführen ist (die wir als marginalen Fehler bezeichnen, siehe Materialien und Methoden), bei ReLERNN im Vergleich zu anderen Methoden gelegentlich höher ist, obwohl ReLERNN den niedrigsten absoluten Fehler unter den Methoden aufwies. Als Paradebeispiel dafür fanden wir, dass Vorhersagen von LDhelmet durch unser Fehlspezifikationsregime überhaupt nicht beeinflusst wurden, aber diese Vorhersagen waren im Durchschnitt immer noch weniger genau als die von einem falsch spezifizierten ReLERNN. Interessanterweise ist der Grenzfehler signifikant größer, wenn ReLERNN auf Gleichgewichtssimulationen trainiert und auf demographischen Simulationen getestet wurde als unter der reziproken Fehlspezifikation (T = 26,3 P WTT < 10 − 16 ⁠ ergänzende Abb. S18 , Online-Ergänzungsmaterial). Obwohl dies wahr ist, ist es wichtig zu beachten, dass der mittlere Grenzfehler für ReLERNN in beiden Richtungen der Fehlspezifikation und über alle Stichprobengrößen hinweg nie 3,90 × 10 − 9 ⁠ überstieg, was darauf hindeutet, dass die zusätzlichen Informationen, die aus einem informativen demografischen Modell gewonnen werden, begrenzt sind .

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für jede Methode über 5.000 simulierte Chromosomen nach Modell-Fehlspezifikation. Für CNN und ReLERNN wurden Vorhersagen durch Training auf Gleichgewichtssimulationen gemacht, während Sequenzen getestet wurden, die unter einem Modell der Populationsgrößenexpansion oder (B) Training zu demografischen Simulationen während des Testens von Sequenzen, die im Gleichgewicht simuliert werden. Für LDhat und LDhelmet wurden die Lookup-Tabellen unter Verwendung von Parameterwerten generiert, die aus Simulationen geschätzt wurden, bei denen das Modell auf die gleiche Weise falsch spezifiziert wurde, wie oben für CNN und ReLERNN beschrieben. Abgetastete Chromosomen geben die Anzahl unabhängiger Sequenzen an, die von jeder msprime (Kelleher et al. 2016) Koaleszenzsimulation abgetastet wurden. LDhelmet konnte nicht mit verwendet werden n = 64 Chromosomen und das demografische Modell konnte mit FastEPRR nicht absichtlich falsch spezifiziert werden.

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für jede Methode über 5.000 simulierte Chromosomen nach Modell-Fehlspezifikation. Für CNN und ReLERNN wurden Vorhersagen durch Training auf Gleichgewichtssimulationen gemacht, während Sequenzen getestet wurden, die unter einem Modell der Populationsgrößenexpansion oder (B) Training zu demografischen Simulationen während des Testens von Sequenzen, die im Gleichgewicht simuliert werden. Für LDhat und LDhelmet wurden die Lookup-Tabellen unter Verwendung von Parameterwerten generiert, die aus Simulationen geschätzt wurden, bei denen das Modell auf die gleiche Weise falsch spezifiziert wurde, wie oben für CNN und ReLERNN beschrieben. Abgetastete Chromosomen geben die Anzahl unabhängiger Sequenzen an, die von jeder msprime (Kelleher et al. 2016) Koaleszenzsimulation abgetastet wurden. LDhelmet konnte nicht mit verwendet werden n = 64 Chromosomen und das demografische Modell konnte mit FastEPRR nicht absichtlich falsch spezifiziert werden.

Neben Modell-Fehlspezifikationen können auch Unterschiede im Verhältnis von homologen Genkonversionsereignissen zu Crossovers die Inferenz von Rekombinationsraten verzerren, da Konversionstrakte LD innerhalb des Vorhersagefensters abbauen (Przeworski und Wall 2001 Gay et al. 2007). Wir behandelten den Effekt der Genkonversion als eine weitere Form der Modellfehlspezifikation, indem wir an Beispielen trainierten, die keine Genkonversion hatten, und an Beispielen testeten, die eine Genkonversion beinhalteten. Da ReLERNN msprime für alle Trainingssimulationen verwendet und msprime derzeit keine Genkonversion simulieren kann, haben wir alle Testsatzsimulationen mit ms generiert ( Hudson 2002). Wir stellten fest, dass die Einbeziehung der Genkonversion in unsere Simulationen unsere Vorhersagen verzerrt hat, was zu einer Überschätzung der wahren Rekombinationsrate führte ( ergänzende Abb. S19 , Ergänzendes Material online). Darüber hinaus nahm die Größe dieses Bias mit dem Verhältnis von Genkonversionsereignissen zu Crossovers zu, r GC r CO ⁠ . Erwartungsgemäß beobachteten wir auch ein ähnliches Verzerrungsmuster für LDhelmet, obwohl das Ausmaß der Verzerrung für LDhelmet geringer war als das von ReLERNN für r GC r CO > 2 (T > 4,37 P WTT < 1,32 × 10 − 5 ⁠ ergänzende Abb. S19 , Online-Ergänzungsmaterial). Da Fehler in Genotyp-Calls eine Genkonversion nachahmen können – zum Beispiel wird eine heterozygote Probe als homozygot bezeichnet – kann die Filterung von SNP-Calls von geringer Qualität, entweder durch Entfernen des einzelnen Genotyps oder durch Maskieren von Stellen, das Potenzial haben, durch Genkonversion induzierte Verzerrungen zu mildern . Fehlende Genotypen und unzugängliche Standorte haben jedoch das Potenzial, ihre eigenen Verzerrungen einzuführen, was einen Bereich hervorhebt, in dem Deep-Learning-Methoden einen einzigartigen Vorteil gegenüber herkömmlichen Tools haben können.

ReLERNN behält hohe Genauigkeit bei simulierten genomischen Datensätzen geringer Qualität

Deep-Learning-Tools haben das Potenzial, bei genomischen Datensätzen von geringer Qualität, z. Qualitätswerte sind verdächtig. Dies liegt zum Teil daran, dass solche Attribute der genomischen Qualität leicht während des Trainings integriert werden können und Deep-Learning-Methoden trotz dieser Einschränkungen verallgemeinern können. Um das Potenzial von ReLERNN als Gewinn für Forscher, die mit minderwertigen Daten arbeiten – zum Beispiel diejenigen, die Nicht-Modellorganismen untersuchen – auszuschöpfen, haben wir 1-Mb-Chromosomen unter einer randomisierten, feinskaligen Rekombinationslandschaft simuliert und dann zunehmende Anteile von beiden maskiert Genotypen und Standorte. Anschließend trainierten wir ReLERNN sowohl mit fehlenden Genotypen als auch mit Genom-Unzugänglichkeit und generierten Vorhersagen über die simulierten Chromosomen.

Wir zeigen, dass ReLERNN bei Datensätzen mit fehlenden Genotypen eine hohe Genauigkeit und einen geringen Bias aufweist, selbst wenn der Anteil der fehlenden Daten auf die Hälfte aller Genotypen ansteigt ( Abb. 5). Darüber hinaus fanden wir, dass ReLERNN einen geringeren Bias und einen signifikant niedrigeren absoluten Fehler aufwies als LDhelmet bei 50% fehlenden Genotypen für beide n = 4 und n = 20 ( ⁠ T ≤ − 2,8 ⁠ PWTT < 0,007 für beide Vergleiche). Hier definieren wir fehlende Genotypen als jeden Genotypaufruf, der auf ein „.“ gesetzt ist. im VCF, obwohl theoretisch auch eine einfache Qualitätsschwelle zur Identifizierung fehlender Genotypen implementiert werden könnte. Darüber hinaus haben wir ReLERNN mit zunehmender Unzugänglichkeit des Genoms getestet (bis zu 75 % aller Standorte nicht zugänglich) und ein Szenario simuliert, in dem die überwiegende Mehrheit der Standorte nicht genau kartiert werden kann – zum Beispiel in Genomregionen mit geringer Komplexität oder für Taxa ohne Referenz Versammlungen. Hier bezieht sich die Unzugänglichkeit des Genoms auf jede Stelle, die ein Fenster in der Zugänglichkeitsmaske überlappt, wobei das gesamte Genotyp-Array an dieser Stelle verworfen wird. Auch hier zeigte ReLERNN im Vergleich zu LDhelmet auf allen Ebenen der Genomzugänglichkeit eine reduzierte Fehlerverzerrung (Ergänzende Abb. S20, Ergänzendes Material online). Allerdings unterschieden sich die absoluten Fehlerniveaus nach der Korrektur für mehrere Tests nicht signifikant zwischen den Methoden ( T ≤ − 2,1 ⁠ P WTT ≥ 0,043 für alle Vergleiche). Zusammengenommen legen diese Ergebnisse nahe, dass ReLERNN von besonderem Interesse für Forscher sein könnte, die Nichtmodellorganismen untersuchen oder keinen Zugang zu hochwertigen Referenzbaugruppen haben.

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für LDhelmet und ReLERNN, wenn verschiedene Ebenen fehlender Genotypen für Simulationen mit . präsentiert werden n = 4 und (B) n = 20 Chromosomen. (C) Feinskalige Ratenvorhersagen, die von ReLERNN für eine 1-Mb-Rekombinationslandschaft (graue Linie) mit unterschiedlichen Levels an fehlenden Genotypen simuliert wurden, für n = 4 und (D) n = 20 Chromosomen.

(EIN) Verteilung des Rohfehlers ( r vorhergesagt − r wahr ⁠ ) für LDhelmet und ReLERNN, wenn verschiedene Ebenen fehlender Genotypen für Simulationen mit . präsentiert werden n = 4 und (B) n = 20 Chromosomen. (C) Feinskalige Ratenvorhersagen von ReLERNN für eine 1-Mb-Rekombinationslandschaft (graue Linie), simuliert mit unterschiedlichen Niveaus fehlender Genotypen, für n = 4 und (D) n = 20 Chromosomen.

Rekombinationslandschaften sind zwischen den afrikanischen Bevölkerungen weitgehend übereinstimmend D. melanogaster

Mit unserer Methode charakterisierten wir die genomweiten Rekombinationslandschaften von drei Populationen afrikanischer D. melanogaster (Proben aus Kamerun, Ruanda und Sambia). Jede Population wurde aus der Sequenzierung von zehn haploiden Embryonen abgeleitet (ausführlich in Pool et al. 2012 Lack et al. 2015), daher stellen diese Daten eine hervorragende Möglichkeit dar, die hohe Genauigkeit von ReLERNN bei kleinen Stichprobengrößen zu nutzen. Die von ReLERNN ausgewählten Längen der genomischen Fenster waren zwischen den Populationen ungefähr gleich und reichten von 38 kb für die Chromosomen 2R, 3L und 3R in Sambia bis zu 51 kb für das X-Chromosom in Kamerun. Wir zeigen, dass Rekombinationslandschaften im feinen Maßstab zwischen allen drei Populationen von stark korreliert sind D. melanogaster (genomweiter Mittelwert paarweise Spearmans ρ = 0,76 ⁠ P < 10 − 16 ⁠ 100-kb-Fenster Abb. 6). Der genomweite mittlere paarweise Bestimmungskoeffizient zwischen den Populationen war etwas niedriger, R 2 = 0,63 ( P < 10 − 16 ⁠ 100-kb-Fenster), was darauf hindeutet, dass es wichtige populationsspezifische Unterschiede in den feinskaligen Treibern von Allel geben könnte Verband. Diese Unterschiede können auch zu Unterschieden innerhalb der Chromosomen in der Rekombinationsrate zwischen Populationen beitragen. Tatsächlich gehen wir davon aus, dass die mittleren Rekombinationsraten zwischen den Populationen für alle Chromosomen mit Ausnahme von Chromosom 3L signifikant unterschiedlich sind ( ⁠ P ≤ 3,78 × 10 − 4 ⁠ unidirektionale Varianzanalyse). Paarweise Post-hoc-Vergleiche deuten darauf hin, dass dieser Unterschied hauptsächlich auf eine erhöhte Rekombinationsrate in Sambia zurückzuführen ist, die auf allen Chromosomen identifiziert wurde ( P ≤ 8,21 × 10 – 4 ⁠ Tukeys HSD-Tests) mit Ausnahme von 3L ( ⁠ P HSD ≥ 0,15 ⁠ ). ReLERNN prognostiziert die Rekombinationsrate in simulierten Testsätzen mit hoher Genauigkeit für alle drei Populationen ( ⁠ R 2 ≥ 0,93 ⁠ P < 10 − 16 ⁠ ergänzende Abb. S23 , Ergänzendes Material online), was darauf hindeutet, dass wir über ausreichende Unterscheidungskraft verfügen feinskalige Unterschiede in den Rekombinationsraten pro Base im gesamten Genom.

(EIN) Genomweite Rekombinationslandschaften für Drosophila melanogaster Populationen aus Kamerun (blaugrüne Linien), Ruanda (violette Linien) und Sambia (orangefarbene Linien). Graue Kästchen kennzeichnen die Inversionsgrenzen, von denen in diesen Stichproben eine Segregation vorhergesagt wird (Corbett-Detig und Hartl 2012 Pool et al. 2012). Rote Dreiecke markieren die oberen 1% der globalen Ausreißerfenster für die Rekombinationsrate. Blaue, violette und orangefarbene Dreiecke markieren die oberen 1% der populationsspezifischen Ausreißerfenster für die Rekombinationsrate, wobei die Dreiecksfarbe die Ausreißerpopulation angibt (siehe Materialien und Methoden). (B) Pro-Chromosom-Rekombinationsraten für jede Population. Spearmans ρ und R 2 werden als Mittelwert paarweiser Schätzungen zwischen Populationen für jedes Chromosom angegeben. **P < 0,01 und ***P < 0,001 basieren auf Tukeys HSD-Tests für alle paarweisen Vergleiche.

(EIN) Genomweite Rekombinationslandschaften für Drosophila melanogaster Populationen aus Kamerun (blaugrüne Linien), Ruanda (violette Linien) und Sambia (orangefarbene Linien). Graue Kästchen kennzeichnen die Inversionsgrenzen, die in diesen Stichproben als segregierend vorhergesagt werden (Corbett-Detig und Hartl 2012 Pool et al. 2012). Rote Dreiecke markieren die oberen 1% der globalen Ausreißerfenster für die Rekombinationsrate. Blaue, violette und orangefarbene Dreiecke markieren die oberen 1% der populationsspezifischen Ausreißerfenster für die Rekombinationsrate, wobei die Dreiecksfarbe die Ausreißerpopulation angibt (siehe Materialien und Methoden). (B) Pro-Chromosom-Rekombinationsraten für jede Population. Spearmans ρ und R 2 werden als Mittelwert paarweiser Schätzungen zwischen Populationen für jedes Chromosom angegeben. **P < 0,01 und ***P < 0,001 basieren auf Tukeys HSD-Tests für alle paarweisen Vergleiche.

Beim Vergleich unserer Schätzungen der Rekombinationsrate mit denen aus experimentellen Kreuzungen von nordamerikanischen D. melanogaster (berichtet in Comeron et al. 2012), stellen wir fest, dass die über alle drei Populationen gemittelten Bestimmtheitskoeffizienten R 2 = 0,46, 0,70, 0,47, 0,08, 0,73 für die Chromosomen 2L, 2R, 3L, 3R bzw. X betrugen ( ergänzende Abb. S24 , Ergänzendes Material online 1-MB-Fenster). Diese Ergebnisse unterscheiden sich von denen, die Chan et al. (2012), die 22 . verglichen D. melanogaster aus derselben ruandischen Population mit der FlyBase-Karte abgetastet und gefunden R 2 = 0,55, 0,63, 0,45, 0,42, 0,41 für die gleichen Chromosomen. Die geringfügigen Unterschiede, die wir zwischen den Methoden für die Chromosomen 2L, 2R, 3L und das X-Chromosom beobachtet haben, sind wahrscheinlich darauf zurückzuführen, dass wir Schätzungen von zwei verschiedenen Methoden mit verschiedenen afrikanischen Fliegen mit einer anderen experimentell abgeleiteten Karte vergleichen. Die größeren Unterschiede, die zwischen den Methoden für Chromosom 3R gefunden wurden, scheinen jedoch weniger wahrscheinlich auf methodische Unterschiede zurückzuführen zu sein. Wichtig, afrikanisch D. melanogaster ist bekannt dafür, große polymorphe Inversionen oft mit beträchtlicher Häufigkeit zu beherbergen (Lemeunier und Aulard 1992 Aulard et al. 2002). Zum Beispiel die Inversion In(3R)K trennt sich in unserer kamerunischen Bevölkerung bei P = 0,9. Diese Unterschiede in den Inversionsfrequenzen tragen möglicherweise zu der außergewöhnlich schwachen Korrelation bei, die mit unserer Methode für Chromosom 3R beobachtet wurde.

Ein wichtiger Grund für populationsspezifische Unterschiede in Rekombinationslandschaften könnten populationsspezifische Unterschiede in der Häufigkeit von Chromosomeninversionen sein, da erwartet wird, dass die Rekombination zwischen Standard- und Inversionsanordnungen stark unterdrückt wird. Um einen Effekt von Inversionsfrequenz-Inferenzen von ReLERNN zu testen, haben wir haploide Genome aus Sambia neu abgetastet, um künstliche Populationsproben mit der kosmopolitischen Inversion zu erstellen In(2L)t Segregation bei unterschiedlichen Frequenzen, p < 0,0 , 0,2 , 0,6 , 1,0 > . In Sambia, In(2L)t entstand vor kurzem ( Corbett-Detig und Hartl 2012) und trennt sich bei P = 0,22 (Lack et al. 2015), was darauf hindeutet, dass die Rekombination innerhalb der Inversionsbruchpunkte bei Individuen mit der invertierten Anordnung im Vergleich zu denen mit der Standardanordnung stark unterdrückt sein kann. Aus diesen Gründen sagen wir voraus, dass die abgeleitete Rekombinationsrate abnehmen sollte, wenn die niederfrequente invertierte Anordnung im Satz der abgetasteten Chromosomen zunehmend überrepräsentiert wird (d. h. da mehr Proben die invertierten Anordnungen mit hoher LD enthalten). Wie vorhergesagt fanden wir einen starken Effekt der Abtastfrequenz von In(2L)t über die geschätzten Rekombinationsraten für Chromosom 2L in Sambia (ergänzende Abb. S27, ergänzendes Material online), was zeigt, dass ReLERNN empfindlich auf die Häufigkeit kürzlich aufgetretener Inversionen reagiert.

Um populationsspezifische Unterschiede in Rekombinationslandschaften weiter zu untersuchen, haben wir einen statistischen Ausreißer-Ansatz gewählt, bei dem wir zwei Arten von Rekombinationsraten-Ausreißern definieren – globale Ausreißer und populationsspezifische Ausreißer (siehe Materialien und Methoden). Globale Ausreißer zeichnen sich durch Fenster mit außergewöhnlich hoher Varianz der Rekombinationsraten zwischen allen drei Populationen aus ( Abb. 6 rote Dreiecke), während populationsspezifische Ausreißer diejenigen Fenster sind, bei denen die Rekombinationsrate in einer Population stark von den Raten in der andere zwei Populationen (Abb. 6 Populationsfarbene Dreiecke). Wir stellen fest, dass populationsspezifische Ausreißer, aber keine globalen Ausreißer, innerhalb von Inversionen signifikant angereichert werden (P = 0,005 Randomisierungstest abb. 6 graue Kästchen). Darüber hinaus bleibt diese Anreicherung signifikant, wenn die Inversionsgrenzen um bis zu 250 kb erweitert werden ( P rand ≤ 0.004 ⁠ ). Das Erweitern der Inversionsgrenzen über 250 kb hinaus oder das Beschränken der Überlappung auf Fenster, die nur die Haltepunkte umgeben (250 kb, 500 kb, 1 Mb, 2 Mb), untergräbt dieses Muster (⁠ P rand ≥ 0,055 für alle Vergleiche), was darauf hindeutet, dass die Rolle der Inversionen bei der Erzeugung populationsspezifischer Unterschiede in den Rekombinationsraten ist zumindest für diese Populationen komplex.

Die Selektion ist ein weiterer wichtiger Faktor, der die Schlussfolgerung von Rekombinationsraten verwirren kann. Zum Beispiel erzeugen selektive Sweeps lokalisierte Muster hoher LD auf beiden Seiten der Sweep-Stelle (Kim und Nielsen 2004, Schrider et al. 2015), sodass Regionen, die selektive Sweeps flankieren, Regionen mit reduzierter Rekombination imitieren können. Insofern wird erwartet, dass populationsspezifische selektive Sweeps zu populationsspezifischen Unterschieden in den Schätzungen der Rekombinationsrate beitragen. Wir haben diploS/HIC (Kern und Schrider 2018) verwendet, um harte und weiche selektive Sweeps in unserem afrikanischen . zu identifizieren D. melanogaster Populationen, und wir testeten auf einen Überschuss an Rekombinationsraten-Ausreißern, die sich mit als Sweeps klassifizierten Fenstern überlappten. Insgesamt stufte diploS/HIC 27,4 %, 28,1 % und 26,8 % aller genomischen Witwen als selektive Sweeps (entweder „hart“ oder „weich“) für Kamerun, Ruanda bzw. Sambia ein, wenn man 5 kb . betrachtet nicht überlappende Fenster. Die damit verbundenen False Discovery Rates (FDR) für Calling-Sweeps in diesen Populationen waren beachtlich: 33,9 %, 33,1 % bzw. 34,7% (Ergänzende Abb. S26, Ergänzendes Material online). Als Sweep klassifizierte Fenster hatten erwartungsgemäß signifikant niedrigere Rekombinationsraten im Vergleich zu neutralen Fenstern in allen drei Populationen ( ⁠ P WTT ≤ 10 − 16 für alle Vergleiche ergänzende Abb. S25 , Ergänzendes Material online). Wir fanden jedoch, dass weder globale noch populationsspezifische Ausreißer für selektive Sweeps angereichert wurden (⁠ P rand ≥ 0,246 für beide Vergleiche), was darauf hindeutet, dass Rekombinationsraten-Ausreißer, wenn sie als eine Klasse behandelt werden, wahrscheinlich nicht von Sweeps in diesen Populationen getrieben werden . Bei getrennter Behandlung (d. h. unabhängige Permutationstests für jedes Ausreißerfenster der Rekombinationsrate) identifizierten wir sieben Ausreißer, die für Sweeps am Schwellenwert P ≤ 0,05 angereichert waren, was einer erwarteten FDR von 77% entspricht. Angesichts unserer FDR für Call-Sweeps in diesen Populationen ist unser Maß für die Überlappung der Anreicherung mit Ausreißern der Rekombinationsrate jedoch wahrscheinlich konservativ. Zwei dieser Ausreißerfenster können potenzielle echte positive Werte darstellen, ein Ausreißer in Kamerun enthält fünf von sechs nicht überlappenden 5-kb-Fenstern, die als „harte“ Sweeps klassifiziert sind, das zweite aus Ruanda hat 10 von 12 Fenstern, die als „harte“ Sweeps klassifiziert sind (PRand = 0,0 für beide Vergleiche). Diese beiden Rekombinationsraten-Ausreißerfenster sind potenziell reif für zukünftige Studien zu selektiven Sweeps in diesen Populationen und legen nahe, dass die Selektion zumindest in einigen Fällen zu beobachteten Unterschieden in den Schätzungen der Rekombinationsraten zwischen Drosophila Bevölkerungen.


Ergebnisse

Um realistische Stammbaumdaten zu simulieren, wurden SNPs aus HapMap ausgewählt, die 100 MB auf beiden Seiten eines lose verbundenen Paares von Standorten umfassen. Es gibt insgesamt 40 SNPs, mit 20 eng verbundenen SNPs auf jeder Seite eines starken Rekombinationsbruchpunkts mit θ = 0,25. Die Haplotypen für diese SNPs wurden zufällig aus HapMap ausgewählt. Stammbaum-Haplotyp- und Genotyp-Daten wurden für jedes Kind simuliert, indem einheitlich eines der elterlichen Allele für den ersten Locus ausgewählt wurde, und nachfolgende Loci wurden mit Wahrscheinlichkeit auf demselben elterlichen Haplotyp selektiert θ J für jeden Ort J. Die Vererbung wurde für 500 Simulationsreplikate simuliert.

Die Simulation ergab vollständig typisierte Ahnentafeln. Für jeden Stammbaum haben wir die Genotyp- und Haplotyp-Informationen für eine steigende Anzahl von nicht typisierten Individuen entfernt. Für jede Instanz einer bestimmten Anzahl untypisierter Individuen wurden zwei Werte für die geschätzte Anzahl von Rekombinationen zwischen dem zentralen Loci-Paar berechnet: die Haplotyp- und Genotyp-Genauigkeit. Die Genauigkeit wurde als Funktion der berechnet l1 Abstand zwischen der deterministischen Zahl der Rekombinationen und der berechneten Verteilung. Genauer gesagt war die Genauigkeit 2 -ich≥0|x ich- ein ich |, wo x ich war die geschätzte Wahrscheinlichkeit für ich Rekombinationen und ein ich war der deterministische Indikator dafür, ob es ich Rekombinationen in den auf dem Stammbaum simulierten Daten.

In allen Fällen beobachteten wir einen Trend, bei dem die beste Genauigkeit mit Haplotypdaten erzielt wurde, bei denen jeder im Stammbaum haplotypisiert war. Abbildung 3 zeigt beispielsweise einen Stammbaum mit fünf Individuen und zwei Halbgeschwistern. Da die drei Gründer nicht typisiert waren, ergaben die Haplotypdaten eine ähnliche Genauigkeit wie die Genotypdaten. Stellen Sie sich einen Stammbaum mit drei Generationen vor, der zwei Eltern, ihre beiden Kinder, einen Schwiegereltern und ein Enkelkind für insgesamt sechs Personen hat, von denen drei Gründer sind. Dieser Stammbaum weist einen ähnlichen Genauigkeitstrend auf, wenn die Zahl der untypisierten Gründer steigt, Abbildung 4. Wenn die Zahl der untypisierten Individuen zunimmt, scheinen die Genauigkeiten der Genotyp- und Haplotyp-Schätzungen zu konvergieren.

Vorhersage von Rekombinationen für Halbgeschwister. Dies ist die durchschnittliche Genauigkeit für Vorhersagen aus einem Stammbaum mit zwei Halbgeschwistern und drei Eltern. Es wurden 500 Simulationswiederholungen durchgeführt, und die durchschnittliche Genauigkeit der Schätzungen aus den Haplotypdaten ist denen aus den Genotypdaten überlegen. Mit zunehmender Zahl untypisierter Gründer sinkt jedoch in beiden Fällen die Genauigkeit der Schätzungen aus Haplotypdaten im Vergleich zur Genauigkeit aus Genotypdaten. Die Genauigkeiten der Genotyp- und Haplotyp-Schätzungen scheinen sich anzunähern.

Vorhersage von Rekombinationen für drei Generationen. Diese Abbildung zeigt Genauigkeitsergebnisse aus einem Stammbaum mit sechs Individuen und drei Generationen. Auch hier wurden fünfhundert Simulationswiederholungen durchgeführt, und die durchschnittliche Genauigkeit der Schätzungen aus den Haplotypdaten ist denen aus den Genotypdaten überlegen. Auch hier sinkt die Genauigkeit der Schätzungen aus Haplotyp-Daten im Verhältnis zur Genauigkeit aus Genotyp-Daten, wenn die Zahl der nicht typisierten Gründer steigt. Die Genauigkeiten der Genotyp- und Haplotyp-Schätzungen scheinen sich anzunähern.


Elektronisches Zusatzmaterial

13062_2011_277_MOESM1_ESM.PDF

Zusätzliche Datei 1: Genloci, die unter Verwendung der 4 Methoden der Substitutionsanalyse der Rekombination (p-Wert < 0,05) als intragene homologe Rekombination identifiziert wurden. (PDF 129 KB)

Zusätzliche Datei 2: Genloci unter positiver Selektion, abgeleitet aus dem Gesamttest (Test 1). (PDF 104 KB)

Zusatzdatei 3: Genloci unter positiver Selektion basierend auf dem branchenspezifischen Test (Test 2). (PDF 112 KB)

13062_2011_277_MOESM4_ESM.PDF

Zusätzliche Datei 4: Von ClonalFrame abgeleitete Inter-Clade-Ereignisse, gruppiert nach der betroffenen Clade und der Ursprungsklade. (PDF 98 KB)


Schau das Video: Molekulargenetik 3 - Mitose, Meiose, Crossing over - Anwendungsaufgaben für ein super BioAbi (Kann 2022).


Bemerkungen:

  1. Darry

    die exklusive Überlegungen

  2. Goltisho

    Die Schande!

  3. Shayne

    Es ist eine Schande, dass ich jetzt nicht sprechen kann - sehr beschäftigt. Aber Osvobozhus - schreibe notwendigerweise, was ich denke.

  4. Raff

    Und warum ist das der einzige Weg? Ich denke, warum nicht diese Bewertung klären.

  5. Mazutaxe

    Ich kann vorschlagen, auf eine Website mit einer großen Menge an Informationen zu einem Thema zu kommen, das Sie interessiert.



Eine Nachricht schreiben