Information

Ableiten der Genhäufigkeit innerhalb einer Art über die Zeit

Ableiten der Genhäufigkeit innerhalb einer Art über die Zeit


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich habe Karlsson et al. (2014) und ich kam darauf:

Eine ausgewählte Variante, die in den letzten ~250.000 Jahren schnell an Häufigkeit zunimmt, kann als ungewöhnliche Verringerung der genetischen Vielfalt nachgewiesen werden.

Mir wurde klar, dass ich nicht weiß, wie ich im Laufe der Zeit auf eine bestimmte Allelfrequenz schließen kann innerhalb einer bestimmten Art.

Ich habe versucht, einige Keywords zu googeln, wurde aber von anderen Konzepten überflutet. Könnten Sie mich bitte zu einer geeigneten Dokumentation/Kewords verweisen?


Es gibt zwei Teile Ihres Beitrags, die ich ansprechen möchte, der erste ist das Zitat (weil ich sicherstellen möchte, dass Sie ihn gut verstehen), und der zweite betrifft allgemeine Inferenzmethoden zur Schätzung der genetischen Zusammensetzung von Vorfahrenpopulationen.

Das Zitat: Selektive Sweeps

Eine ausgewählte Variante, die in den letzten ~250.000 Jahren schnell an Häufigkeit zunimmt, kann als ungewöhnliche Verringerung der genetischen Vielfalt nachgewiesen werden.

Wenn ein Allel dafür ausgewählt wird, breitet es sich relativ schnell in der Population aus, relativ zum Beispiel relativ zur Verbreitung neutraler Allele. Wenn ein Allel in der Population fixiert wird, ist die Diversität in diesem Gen null; es gibt keine ständige genetische Variation im Gen. Selektion reduziert oft die genetische Variation, aber siehe auch diesen Beitrag.

Die Selektion reduziert jedoch nicht nur die genetische Vielfalt am ausgewählten Locus, sondern auch an den Loci in der Nähe des Gens, die verknüpft sind. Der Verlust der genetischen Vielfalt an verknüpften Loci erfolgt durch einen Prozess namens a Selektiver Sweep. Dies ist (etwas schlecht) in der Webversion Ihres verlinkten Papiers definiert:

Selektive Sweeps; Verringerung der genetischen Variation durch positive Selektion an bestimmten Loci.

Grundsätzlich tritt ein selektiver Sweep auf, wenn eine starke Selektion dazu führt, dass sich ein Allel und die Loci, mit denen es stark verbunden ist, in einer Population ausbreitet. Die genetische Vielfalt geht von den verknüpften Loci mit einer Rate verloren, die durch die Stärke der Selektion und den Grad der Verknüpfung bestimmt wird (wobei eine engere Verknüpfung und eine stärkere Selektion die Verlustrate erhöhen). Dieses Papier (siehe Abschnitt 7 für selektive Sweeps) bietet eine gute Diskussion der Faktoren, die die genetische Variation in natürlichen Populationen beeinflussen, und stützt sich auf das Beispiel des Y-Chromosoms:

Ein oder mehrere selektive Sweeps haben das Y-Chromosom mit geringer oder keiner Variabilität hinterlassen

Rückschluss auf die Populationen der Vorfahren

Sie könnten zu dem Zeitpunkt, an dem Sie interessiert sind, DNA der Population entnehmen. Dies ist jedoch sehr schwierig. DNA baut sich im Laufe der Zeit ab, daher ist es wichtig, ein Verständnis von . zu haben wie DNA baut sich im Laufe der Zeit ab, wenn Sie Rückschlüsse auf die Population ziehen möchten. (Ich habe vor einiger Zeit einen Vortrag von einem Forscher gesehen, kann mich nicht an den Namen erinnern, der Proben aus Gräbern entnommen hat. Ich weiß nicht, wie genau ich mich daran erinnere, aber ein Großteil der DNA, die sie sammeln, sind Bakterien. Nur ein winziger Bruchteil von Die DNA, die sie aus der Probenahme menschlicher Knochen in Gräbern erhielten, die nur wenige hundert Jahre alt waren, war tatsächlich menschlich.. Es ist oft schwierig, Quellen für DNA-Proben zu finden, die ein) von ausreichender Qualität und B) mit genügend Individuen, um einen guten Rückschluss auf die Ahnenpopulation zu ermöglichen; eine kleine Stichprobe ist anfällig für Stichprobenverzerrungen.*

Es gibt noch einen anderen Ansatz, der heute häufig verwendet wird. Wenn Sie daran interessiert sind, mehr zu finden, sollten Sie nach Koaleszenztheorie und -methoden suchen. Dies leitet auf der Grundlage der aktuellen (oder relativ neueren) genetischen Zusammensetzung von Populationen und unter Verwendung der populationsgenetischen Theorie zurück. Es ist nicht wirklich ein Versuch, die zu schätzen spezifische Allelfrequenz, eher als Versuch, Populationsgröße, Migrationsraten und Rekombinationsraten abzuleiten. Es leitet ab, wann der letzte gemeinsame Vorfahre (MRCA) war. Dieser Artikel gibt einen Überblick über Koaleszenzmethoden für phylogenetische Bäume und dies ist eine Einführungsvorlesung zum Thema Koaleszenz. Die Koaleszenztheorie muss viele Überlegungen anstellen; Sind einige Mutationen häufiger als andere (siehe Molekulare Uhr)? Wie wirkt sich die Selektion auf die genetische Variation aus (z. B. selektive Sweeps)? Variiert die Kopplung über das Genom hinweg? Unterscheiden sich Mutations-, Drift- und Selektionsraten im Genom? Sind verschiedene Teile des Genoms unterschiedlich von der Migration betroffen?

Beide Ansätze werfen ernsthafte Überlegungen auf, die derzeit an der Spitze der evolutionären Genetik stehen. Forschergruppen auf der ganzen Welt entwickeln Labormethoden, statistische Methoden und mathematische Modelle, um Schlussfolgerungen genauer zu machen. Momentan die einzige Möglichkeit, meiner Meinung nach, auf die Häufigkeit von spezifische Allele in Ahnenpopulationen ist es, alte DNA-Methoden zu verwenden; Koalescent kann verwendet werden, um genetische Parameter der Population abzuleiten, aber in Bezug auf spezifische Allele müssen einfach so viele Faktoren berücksichtigt werden, von denen (im Moment, aber sicherlich weniger in Zukunft) wir einfach kein gründliches Verständnis haben. Mit anderen Worten, die Annahmen, die für die Koaleszenz gemacht werden müssen, um spezifische Allelfrequenzen der Vorfahren abschätzen zu können, werden selten erfüllt. Solange dies jedoch richtig diskutiert wird, gibt es kein Problem mit der verwendeten Methode, und ich bin sicher, dass die Zukunft für solche Methoden rosig ist.


*Zur Sampling-Bias: Stellen Sie sich vor, Sie möchten die Häufigkeit der Zahl zwei auf einem sechsseitigen Würfel berechnen (wir wissen, dass die wahre Häufigkeit 0,167 beträgt). Man würfelt viermal und der Würfel zeigt einmal die Seite mit zwei Punkten. Ihre Schätzung der Bevölkerungshäufigkeit beträgt 0,25. Dein Freund würfelt den gleichen Würfel 4000 mal. Sie sehen die beiden Punkte 652 Mal, das sind 0,163, viel repräsentativer für die wahre Bevölkerungshäufigkeit. Die Moral der Geschichte, kleine Stichproben können irreführende Einschätzungen der Wahrheit geben.


Es gibt wirklich zwei Möglichkeiten, auf vergangene Genetiken zu schließen.

  1. Probieren Sie die Vergangenheit aus.

Funktioniert nur wirklich, wenn Sie gut erhaltene, nicht kontaminierte archäologische Proben haben, funktioniert aber überraschend gut, wenn man bedenkt. Die Genauigkeit und Vollständigkeit nimmt ziemlich schnell ab, wenn Sie in der Zeit zurückgehen, aber Tausende von Jahren bis Hunderttausenden von Jahren sind ungefähr möglich. Sie werden nicht viele Proben haben, daher ist es schwer, etwas über die Populationsgenetik zu sagen. Tun Sie dies nicht. Es funktioniert nicht sehr gut und es ist sehr schwer.

  1. Molekulare Uhren.

Gleichsinnige Mutationen, die nichts beeinflussen, sammeln sich im Laufe der Zeit in den Genen an, wenn sie weitergegeben werden. Gene, die einen entfernten gemeinsamen Vorfahren haben, unterscheiden sich stärker als Gene, die nur eine oder zwei Generationen auseinander liegen. Im Wesentlichen funktioniert die Phylogenetik als Ganzes, aber Sie können Altersunterschiede zwischen benachbarten Genen verwenden, um die Selektion auf diese Weise zu erkennen. Wenn Gen A bei jedem Individuum in einer Population fast identisch ist, aber Gen B Tausende von ziemlich unterschiedlichen Variationen aufweist, ist es klar, dass Gen A etwas Wichtiges tut und dafür stark selektiert wurde. Zählen Sie nicht nur die Anzahl der Allelarten für Gen A, sondern berechnen Sie die durchschnittliche Verwandtschaft zwischen allen gefundenen Allelen. Wenn die Verwandtschaft für Gen A viel geringer ist als für andere Gene, wird auf Gen A selektiert. Dies meint der Text mit „Reduzierung der genetischen Vielfalt“, wodurch die durchschnittliche Verwandtschaft verringert wird.

Sie können ohne eine Zeitmaschine keine Allelfrequenzen zu beliebigen Zeiten in der Vergangenheit berechnen (selbst bei alten Stichproben können Sie nicht wirklich sicher sein, dass Sie eine genaue Stichprobe der historischen Population erhalten), aber die Phylogenetik kann einen Hinweis darauf geben, was passiert ist durch die Erkennung der Signaturen der Evolution.


Genomweite Analyse eines Langzeit-Evolutionsexperiments mit Drosophila

Experimentelle Evolutionssysteme ermöglichen die genomische Untersuchung der Anpassung, und dies wurde bisher hauptsächlich in asexuellen Systemen mit kleinen Genomen wie Bakterien und Hefen durchgeführt. Hier präsentieren wir Gesamtgenom-Resequenzierungsdaten von Drosophila melanogaster-Populationen, die über 600 Generationen der Laborselektion für eine beschleunigte Entwicklung erfahren haben. Fliegen in diesen ausgewählten Populationen entwickeln sich vom Ei zum Erwachsenen ∼ 20 % schneller als Fliegen von Vorfahren-Kontrollpopulationen und haben eine Reihe anderer korrelierter Phänotypen entwickelt. Auf der Grundlage von 688.520 hochqualitativen Einzelnukleotidpolymorphismen mit mittlerer Frequenz identifizieren wir mehrere Dutzend genomische Regionen, die eine starke Allelfrequenzdifferenzierung zwischen einer gepoolten Probe von fünf Replikatpopulationen, die für eine beschleunigte Entwicklung ausgewählt wurden, und gepoolten Kontrollen aufweisen. Auf der Grundlage von Resequenzierungsdaten einer einzelnen Replikatpopulation mit beschleunigter Entwicklung sowie von Einzelnukleotidpolymorphismusdaten von einzelnen Fliegen aus jeder Replikatpopulation leiten wir eine geringe Allelhäufigkeitsdifferenzierung zwischen Replikatpopulationen innerhalb einer Selektionsbehandlung ab. Die Signaturen der Selektion unterscheiden sich qualitativ von dem, was bei asexuellen Arten in unseren sexuellen Populationen beobachtet wurde, Anpassung ist nicht mit "klassischen" Sweeps verbunden, bei denen neu auftretende, bedingungslos vorteilhafte Mutationen fixiert werden. Sparsamere Erklärungen sind „unvollständige“ Sweep-Modelle, bei denen Mutationen nicht genug Zeit hatten, um sie zu beheben, und „weiche“ Sweep-Modelle, bei denen die Selektion auf bereits existierende, häufige genetische Varianten einwirkt. Wir schlussfolgern, dass zumindest für lebensgeschichtliche Merkmale wie die Entwicklungszeit bedingungslos vorteilhafte Allele selten auftreten, mit geringen Netto-Fitnessgewinnen verbunden sind oder sich nicht fixieren lassen, weil sich die Selektionskoeffizienten im Laufe der Zeit ändern.


Zugangsoptionen

Erhalten Sie vollen Zugriff auf Zeitschriften für 1 Jahr

Alle Preise sind Nettopreise.
Die Mehrwertsteuer wird später an der Kasse hinzugefügt.
Die Steuerberechnung wird während des Bezahlvorgangs abgeschlossen.

Erhalten Sie zeitlich begrenzten oder vollständigen Artikelzugriff auf ReadCube.

Alle Preise sind Nettopreise.


Einführung

Die Haupttreiber des globalen Biodiversitätswandels wurden identifiziert (Millennium Ecosystem Assessment 2005), ihre Auswirkungen variieren jedoch räumlich, zeitlich und taxonomisch. Treiber können auch interagieren, um synergistische oder gegensätzliche Effekte zu erzeugen (Travis 2003 Brook, Sodhi & Bradshaw 2008 Schweiger et al. 2010 ), aber es gibt nur wenige empirische Beispiele, insbesondere für Insekten, die den Großteil der terrestrischen Biodiversität ausmachen (Collen et al. 2012). Nicht quantifizierte Veränderungen und ein daraus resultierender Mangel an evidenzbasierter Erhaltung stellen drängende biologische und strategische Managementherausforderungen dar.

Hier verwenden wir einen umfangreichen Datensatz von Artenvorkommensaufzeichnungen, um langfristige Veränderungen in einem artenreichen Insektentaxon (Lepidoptera: Makromotten) in Großbritannien (GB) zu untersuchen. Groß angelegte, umfassende Bewertungen von Veränderungen der Biodiversität in artenreichen Insektentaxa sind selten (Thomas 2005 Mattila et al. 2008 , 2009 Jeppsson et al. 2010). Motten stellen eine der größten Gruppen pflanzenfressender Insekten dar, bilden wichtige Verbindungen in Nahrungsnetzen, fügen ihren Pflanzenwirten Schaden (sowie Bestäubung) zu und stellen eine wichtige Nahrungsquelle für insektenfressende Tiere in vielen Ökosystemen dar (Strong, Lawton & Southwood 1984). .

Wir berechnen langfristige Veränderungen der Häufigkeit des Vorkommens von 673 Lepidoptera-Arten in GB und bewerten die Trends in Bezug auf die prognostizierten Empfindlichkeiten der Arten gegenüber jüngsten Klima- und Habitatveränderungen. Die Veränderung von Lebensräumen, insbesondere die Intensivierung der Landwirtschaft, gilt als die wichtigste Ursache für den jüngsten Artenrückgang in GB und anderen westeuropäischen Ländern (Warren & Key 1991 Robinson & Sutherland 2002 Kleijn et al. 2009). Parallel dazu führt der Klimawandel zu Veränderungen im geografischen Verbreitungsgebiet, der Abundanz, der Phänologie und den biotischen Interaktionen von Lepidoptera-Arten (Parmesan 2006). Der Klimawandel bietet einen sich ändernden Kontext für die Auswirkungen der Habitatveränderung, der die Reaktionen der Arten je nach ökologischen Merkmalen und biogeografischer Situation entweder verstärkt oder verbessert.

Gradienten der Landnutzung, des Klimas und der Artenverteilung lassen sich bequem kombinieren, um unterschiedliche (oft gegensätzliche) Vorhersagen von Veränderungen des Artenvorkommens in GB zu ermöglichen. Das nördliche GB behält einen höheren Anteil naturnaher Lebensräume als das südliche GB, wo der Grad der Landumwandlung in intensive Landwirtschaft und Urbanisierung höher war (Morton et al. 2011). Daher ist zu erwarten, dass Mottenarten, die nicht stark durch das Klima eingeschränkt sind und in GB weit verbreitet sind, im Süden zurückgehen, während sie im Norden als Reaktion auf Landnutzungsänderungen relativ stabil bleiben. Andererseits erreichen viele Insektenarten (einschließlich vieler Makromotten) die nordwestliche klimatische Grenze ihres europäischen Verbreitungsgebiets im südlichen GB. Diese Arten sollten vom Klimawandel profitieren, was zu der gegenteiligen Vorhersage führt – sie sollten möglicherweise zunehmen, wenn sich das Klima erwärmt hat (Hickling et al. 2006). Im Gegensatz dazu ist zu erwarten, dass arktisch-alpine Arten, die auf nördliche und montane Gebiete in GB beschränkt sind, als Reaktion auf die regionale Erwärmung zurückgehen. Indem wir warm-angepasste, kälteangepasste und relativ klimaunempfindliche (innerhalb GB) Arten über einen breiten Gradienten der Landnutzungsintensität betrachten, versuchen wir, die Auswirkungen von Landnutzungs- und Klimaänderungen auf GB-Motten auseinander zu ziehen.

Landnutzungsänderungen beinhalten eine veränderte Bewirtschaftung (z. B. erhöhter Düngereinsatz) sowie die Umstellung von einem Landnutzungstyp auf einen anderen. Wir haben diese Effekte berücksichtigt, indem wir die Veränderungen des Auftretens von Motten, die monophag sind, auf Larvenwirtspflanzen analysiert haben, die unterschiedliche Umweltanforderungen haben. Trait-basierte Analysen von Pflanzentrends wurden mit Treibern des Wandels in Verbindung gebracht (Carey et al. 2008 ), unter Verwendung von Ellenberg-Indikatorwerten, um die realisierten Nischen von Pflanzen entlang von Umweltgradienten zu charakterisieren, wie sie sich beispielsweise auf die Bodenchemie und die Lichtverfügbarkeit beziehen (Ellenberg 1979). Unter Berücksichtigung der Ellenberg-Indikatorwerte von Mottenlarvenwirten können wir daher Zusammenhänge zwischen den Triebkräften des botanischen Wandels und Veränderungen der Häufigkeit des Auftretens von Motten untersuchen.

Hier testen wir drei Hypothesen: (i) Makromottenarten werden eine große Vielfalt von Veränderungen zeigen, wenn sie auf verschiedene Faktoren reagieren, aber insgesamt zurückgegangen sind, was breitere Biodiversitätstrends widerspiegelt. (ii) Es wird erwartet, dass die Reaktionen von Arten mit unterschiedlicher geografischer Verbreitung (südlich, nördlich, weit verbreitet) unterschiedlich sind, da die Auswirkungen von Klima und Landnutzung zwischen diesen Artenkategorien unterschiedlich sein können. (iii) Die Trends des Mottenvorkommens werden mit Wirtspflanzenattributen (Ellenberg-Indikatorwerte) in Verbindung gebracht, insbesondere werden Motten, die Pflanzenarten verwenden, die rückläufig sind, wie solche, die mit niedrigen Stickstoff-Bodenbedingungen verbunden sind, ebenfalls zurückgehen.

Wir fanden Unterstützung für jede Hypothese, die es uns ermöglichte, die langfristige Veränderung der Artenvielfalt der Motten zu bewerten. Diese Ergebnisse werden die zukünftige Forschung zu den Triebkräften des Wandels der biologischen Vielfalt leiten und das ökologische Management informieren, um Arten vor negativen Auswirkungen zu schützen.


Alpha-1-Antitrypsin (α1AT)-Mangel

Epidemiologie

Die Allelfrequenzen von α1AT-Genmutationen variieren beträchtlich auf der ganzen Welt und zwischen den Studienpopulationen. Unter Verwendung globaler Bevölkerungsstudien zur Kartierung der mutmaßlichen α1AT-Gene haben Forscher vorgeschlagen, dass die Z-Mutation vor etwa 2000 Jahren in Skandinavien entstand und sich schließlich von Nordeuropa aus verbreitete, als Menschen aus diesem Gebiet in andere Teile der Welt wanderten. Daher werden die höchsten Häufigkeiten des mutierten Gens bei Nordeuropäern oder bei Personen europäischer Abstammung beobachtet. In Schweden wird die Häufigkeit des Z-Allels (PI*Z) auf 0,026 geschätzt, wobei 4–5% der Bevölkerung die Mutation trägt und 1:1600 Lebendgeburten für diesen Mangel homozygot sind. Die Häufigkeit des PI*Z-Gens ist in den Vereinigten Staaten bei Personen europäischer Abstammung etwas niedriger und wird auf zwischen 0,01 und 0,02 geschätzt, bei einer Trägerrate von etwa 3%. Etwa 80.000 bis 100.000 Menschen in den Vereinigten Staaten sind PI ZZ-Homozygoten mit beträchtlichem Krankheitspotenzial. Das Z-Allel ist überwiegend auf Kaukasier beschränkt und bei Personen asiatischer oder afrikanischer Abstammung selten, es sei denn, es gibt eine ethnische Vermischung in der Bevölkerung. PI*S ist eine häufigere Mangelmutation als PI*Z mit einer Genfrequenz zwischen 0,02 und 0,03 bei US-amerikanischen Kaukasiern. Diese genotypische Variante ist jedoch nicht mit einer so starken Verringerung der zirkulierenden α1AT-Spiegel wie das PI*Z-Allel verbunden und macht daher das Individuum nicht anfällig für Krankheiten, es sei denn, sie wird mit einem Z-Allel mitvererbt. Von größerer Besorgnis ist das Erkrankungsrisiko bei den 1:1000 bis 1:1500 kaukasischen Individuen, die einen PI SZ-Phänotyp exprimieren. Obwohl die Angelegenheit umstritten ist, kann jeder, der ein einzelnes Z-Allel trägt, aufgrund der intrazellulären Akkumulation des abnormal gefalteten Proteins ein gewisses, noch nicht definiertes Risiko haben, unabhängig von den zirkulierenden α1AT-Spiegeln eine Lebererkrankung zu entwickeln.


Verwenden der Hardy-Weinberg-Gleichung

Die Hardy-Weinberg-Gleichung kann verwendet werden, um Genhäufigkeiten (unter Hardy-Weinberg-Bedingungen) aus jeder ihrer Komponenten zu berechnen.

Beispiel 1:

In einer hypothetischen Zebramuschel (Dreissena polymorpha) Population haben die meisten Individuen dunkle, zebragestreifte Schalen (unten links). Allerdings treten bei 1 von 10.000 Individuen solide helle Schalen (unten rechts, verursacht durch ein homozygot-rezessives Gen, aa) auf.

Problem:

Berechnen Sie Genhäufigkeiten und Anzahlen von dominanten Homozygoten (AA, links) und rezessiven Homozygoten (AA, rechts) in einer Population von 10.000 Individuen.

Lösung:

  1. Frequenz von aa = q 2 = 1/10.000 = 0,0001, also q = 0,01
  2. Anzahl von aa = 0,0001 x 10.000 = 1 Individuum
  3. p + q = 1, also p = 0,99
  4. Frequenz von AA = p 2 = 0,9801
  5. Anzahl der AA = 0,9801 x 10.000 = 9.801 Individuen
  6. Für zusätzliche Kredite: Häufigkeit von Aa = 2pq = 2 x 0,9801 x 0,01 = 0,0198 oder 198 Personen

Beispiel 2:

Die Coquina-Muschel (Donax Variabilis) ist stark **polychrom** (mit Schalen in vielen verschiedenen Farben. In einer Population von 2.000 Muscheln sind 1.920 einfarbig, während der Rest strahlende Farbbänder aufweist. Einfarbig tritt bei homozygot dominant (BB) und heterozygot (Bb) auf) Farbstreifen treten nur bei homozygot rezessiven Individuen auf (bb).

Problem:

Berechnen Sie Genhäufigkeiten und Anzahlen von BB und Bb.

Lösung:

  1. 1.920 sind solide (BB und Bb), also 80 gebändert sind rezessiv (bb)
  2. Frequenz von bb = q2 = 80/2000 = 0,04, also q = 0,20
  3. p + q = 1, also p = 0,80
  4. Anzahl der BB: p2 = 0,64, also BB in einer Population von 2.000 = 0,64 x 2.000 = 1.280 Individuen
  5. Anzahl Bb: 2pq [Häufigkeit von Bb] = 2 x 0,2 x 0,8 = 0,32, also Bb = 0,32 x 2.000 = 640 Individuen

Ergebnisse

Wir analysierten zunächst den Datensatz von Barghi et al. (33), eine Evolve-and-Resequence-Studie mit 10 Replikatpopulationen, die einer Hochtemperatur-Laborumgebung ausgesetzt waren, sich über 60 Generationen entwickelt und alle 10 Generationen sequenziert wurde. Unter Verwendung der sieben Zeitpunkte und 10 Replikatpopulationen haben wir die genomweite 6 × 6 temporale Kovarianzmatrix Q für jedes der 10 Replikate geschätzt. Jede Zeile dieser Matrizen repräsentiert die zeitliche Kovarianz Cov(Δ10PS10PT) zwischen der Allelfrequenzänderung (in 10-Generationen-Intervallen, bezeichnet als Δ10PT) einer anfänglichen Referenzgeneration s (der Matrixzeile) und eines späteren Zeitpunkts t (der Matrixspalte). Wir haben diese Matrizen um Verzerrungen korrigiert, die aufgrund von Stichprobenrauschen entstanden sind, und die Einträge für Heterozygotie normalisiert (SI-Anhang, Abschnitte S1.2 und S1.4). Es wird erwartet, dass diese Kovarianzen null sind, wenn nur die Drift wirkt, da nur eine erbliche Variation der Fitness eine Kovarianz zwischen Allelfrequenzänderungen in einer geschlossenen Population erzeugen kann (37). Bei der Mittelung über die 10 replizierten zeitlichen Kovarianzmatrizen finden wir zeitliche Kovarianzen, die statistisch signifikant sind (95% Block-Bootstrap-CIs enthalten keine Null), was mit einer verknüpften Selektion übereinstimmt, die genomweite Allelfrequenzänderungen über sehr kurze Zeiträume stört. Die Kovarianzen zwischen allen benachbarten Zeitintervallen sind positiv und fallen dann gegen Null ab, wenn wir weiter entfernte Zeitintervalle betrachten (Abb. 1 .).EIN), wie erwartet, wenn die Richtungsselektion die Frequenztrajektorien der verknüpften Varianten beeinflusst, bis schließlich das Kopplungsungleichgewicht (LD) und die damit verbundene additive genetische Varianz für Fitnessverfälle (die auftreten könnten, wenn eine Population ein neues Optimum erreicht und die Richtungsselektion schwächer wird) (37). Die zeitlichen Kovarianzen pro Replikat sind stärker verrauscht, aber dieses allgemeine Muster gilt (SI-Anhang, Abb. S23).

(EIN) Zeitliche Kovarianz, gemittelt über alle 10 Replikat-Populationen, über die Zeit von Barghi et al. (33) Studium. Jede Linie zeigt die zeitliche Kovarianz C ov ( p s , Δ p t ) von einer Referenzgeneration s bis zu einem späteren Zeitpunkt t, die entlang der x Achse entspricht jede Zeile einer Zeile des Dreiecks der zeitlichen Kovarianzmatrix mit der gleichen Farbe (Rechts). Die Bereiche um jeden Punkt sind 95 % Block-Bootstrap-CIs. (B) Eine untere Grenze für den Anteil der Gesamtvarianz der Allelfrequenzänderung, erklärt durch verknüpfte Selektion, G(t) , da sie sich über die Zeit t entlang der ändert x Achse. Die schwarze Linie ist der über die Replikate gemittelte G ( t ) mit dem 95 % Block-Bootstrap-CI. Die anderen Linien sind die G(t) für jedes einzelne Replikat, wobei die Farben angeben, welche Teilmenge der zeitlichen Kovarianzmatrix in Rechts geht in die Berechnung von G(t) ein.

Da unsere Kovarianzen Durchschnittswerte über Loci sind, könnte die Kovarianzschätzung durch einige Ausreißerregionen stark beeinflusst werden. Um zu testen, ob große Ausreißerregionen das genomweite Signal steuern, sehen wir in Barghi et al. (33) Daten berechnen wir die Kovarianzen in 100-kb-Fenstern entlang des Genoms (wir bezeichnen diese durchgängig als gefensterte Kovarianzen) und nehmen die mittlere gefensterte Kovarianz (und die getrimmte mittlere gefensterte Kovarianz) als Maß für die genomweite Kovarianz robuste bis großeffektive Loci. Diese robusten Schätzungen (SI-Anhang, Tabelle S1 und Abb. S24) bestätigen die Muster, die wir unter Verwendung der mittleren Kovarianz sehen, und belegen, dass genomische temporale Kovarianzen aufgrund des Einflusses der Selektion, die über viele genomische Regionen hinweg wirkt, ungleich Null sind.

Während das Vorliegen positiver zeitlicher Kovarianzen mit der Selektion vereinbar ist, die die Allelfrequenzen im Laufe der Zeit beeinflusst, ist dieses Maß nicht leicht zu interpretieren. Wir können ein intuitiveres Maß aus den zeitlichen Kovarianzen berechnen, um den Einfluss der Selektion auf die Änderung der Allelfrequenz zu quantifizieren: das Verhältnis der Gesamtkovarianz der Allelfrequenzänderung zur Gesamtvarianz der Allelfrequenzänderung. Wir bezeichnen die Änderung der Allelfrequenz als Δ p t = p t + 1 − p t , wobei p t die Allelfrequenz in der Generation t ist. Da die Gesamtvariation der Allelfrequenzänderung in Varianz- und Kovarianzkomponenten unterteilt werden kann, gilt Var ( pt − p 0 ) = ∑ i = 0 t − 1 Var ( Δ pi ) + ∑ i = 0 t − 1 ∑ j ≠ it − 1 C ov ( pi , Δ pj ) (wir korrigieren Verzerrungen aufgrund der Sequenzierungstiefe) und die Kovarianzen sind null, wenn die Drift allein wirkt. Dies ist eine untere Grenze dafür, wie viel der Varianz der Allelfrequenzänderung durch verknüpfte Auswahl (37). Wir nennen dieses Maß G ( t ) , definiert als G ( t ) = ∑ i = 0 t − 1 ∑ j ≠ i t − 1 C ov ( Δ p i , Δ p j ) Var ( p t − p 0 ) . [1] Dies schätzt den Einfluss der Selektion auf die Änderung der Allelfrequenz zwischen der ersten Generation 0 und einer späteren Generation t ab, die variiert werden kann, um zu sehen, wie diese Menge im Laufe der Zeit wächst. Wenn die Summe der Kovarianzen positiv ist, kann dieses Maß intuitiv als Untergrenze des relativen Anteils der Allelfrequenzänderung verstanden werden, die normalerweise als „Drift“ aufgrund der Selektion angesehen wird. Darüber hinaus kann G ( t ) als eine kurzfristige Schätzung der Verringerung der neutralen Diversität aufgrund der verknüpften Selektion (oder entsprechend der Verringerung der neutralen effektiven Populationsgröße, die erforderlich ist, um die verknüpfte Selektion zu berücksichtigen) verstanden werden (SI-Anhang, Abschnitt S7). Da die von Barghi et al. (33) Das Experiment wird alle 10 Generationen sequenziert, der Zähler verwendet die geschätzten Kovarianzen zwischen 10-Generationen-Blöcken der Allelfrequenzänderung, so dass die starken, nicht beobachtbaren Kovarianzen zwischen benachbarten Generationen nicht zum Zähler von G (t) beitragen. Wären diese Kovarianzen auf kürzeren Zeitskalen messbar gewesen, wäre ihr kumulativer Effekt wahrscheinlich noch höher gewesen (SI-Anhang, Abschnitte S2 und S8.4 enthalten mehr Details). Darüber hinaus erhöht die Selektion die Varianz der Allelfrequenzänderung pro Generation, jedoch kann dieser Effekt nicht leicht von einer Drift unterschieden werden. Aus diesen beiden Gründen ist unser Maß G ( t ) ziemlich konservativ (wir zeigen dies durch Simulationen in SI-Anhang, Abschnitt S8.4). Dennoch finden wir ein bemerkenswert starkes Signal. Mehr als 20 % der gesamten genomweiten Allelfrequenzänderung über 60 Generationen sind das Ergebnis der Selektion (Abb. 1B). Dieser selektionsbedingte Varianzanteil baut sich in Abb. 1 mit der Zeit aufB da sich die Auswirkungen der verknüpften Selektion im Gegensatz zur genetischen Drift über die Generationen verstärken. Unsere g(T) beginnt sich auf ein konstantes Niveau zu stabilisieren, da die Kovarianzen früherer Generationen abgefallen sind und daher nicht mehr so ​​stark beitragen (Abb. 1).

Zusätzlich suchten wir in Bergland et al. (35), eine Studie, die gesammelte Drosophila melanogaster durch Frühlings-Herbst-Saisonpaare über 3 Jahre. Wenn es ein starkes Muster genomweiter fluktuierender Selektion gäbe, könnten wir ein Muster positiver Kovarianzen zwischen ähnlichen saisonalen Veränderungen (z Herbst–Frühling in zwei aufeinander folgenden Jahren). Wir finden jedoch kein solches Signal über Jahre hinweg, und bei der Reproduktion ihrer ursprünglichen Analyse stellen wir fest, dass ihre Anzahl statistisch signifikanter saisonaler Polymorphismen im Vergleich zu einer empirischen Nullverteilung, die durch Permutieren saisonaler Labels erzeugt wurde, nicht angereichert ist (wir diskutieren dies ausführlicher in SI-Anhang, Abschnitt S6).

Das Replikatdesign von Barghi et al. (33) ermöglicht es uns, eine weitere Kovarianz zu quantifizieren: die Kovarianz der Allelfrequenzänderung zwischen Replikatpopulationen, die einem konvergenten Selektionsdruck ausgesetzt sind. Diese Kovarianzen zwischen den Replikaten werden auf die gleiche Weise wie zeitliche Kovarianzen erzeugt: Allele, die mit einem bestimmten Fitnesshintergrund verbunden sind, werden bei ähnlichen Selektionsdrücken erwartet, dass sie Allelfrequenzänderungen in der gleichen Richtung aufweisen. Wenn zeitliche Kovarianzen widerspiegeln, dass Allele, die mit vererbbaren Fitnesshintergründen assoziiert sind, Häufigkeitsänderungen zwischen Generationen vorhersagen, spiegeln Replikat-Kovarianzen wider, dass vererbbare Fitnesshintergründe, die jedem Replikat gemeinsam sind, Häufigkeitsänderungen zwischen Replikaten vorhersagen (unter dem gleichen Selektionsdruck) eine direkte Eins-zu-eins-Korrespondenz zwischen zeitlichen und replizierten Kovarianzen, da letztere durch einen gemeinsamen Selektionsdruck und den stochastischen genetischen Hintergrund über replizierte Populationen getrieben werden. Wir messen dies durch eine Statistik ähnlich einer Korrelation, die wir konvergente Korrelation nennen: das Verhältnis der durchschnittlichen Kovarianz zwischen den Replikaten über alle Paare zur durchschnittlichen SD über alle Paare von Replikaten: cor ( Δ ps , Δ pt ) = EA ≠ BC ov ( ps , A , pt , B ) EA ≠ B Var ( Δ ps , A ) Var ( Δ pt , B ) , [2] wobei A und B hier zwei Replikate sind, und für Barghi et al . (33) Daten verwenden wir Δ10PT.

Wir haben die konvergente Korrelation für alle Zeilen der replizierten Kovarianzmatrizen berechnet. Wie zeitliche Kovarianzen visualisieren wir diese über die Zeit (Abb. 2 EIN, Links), wobei jede Linie die konvergente Korrelation einer bestimmten Referenzgeneration s darstellt, wie sie mit t variiert (dargestellt auf dem x Achse). Mit anderen Worten, jede der farbigen Linien entspricht der gleichfarbigen Zeile der Konvergenzkorrelationsmatrix (Fig. 2 EIN, Rechts). Wir stellen fest, dass diese konvergenten Korrelationskoeffizienten relativ schwach sind und innerhalb von 20 Generationen sehr schnell von einem Anfangswert von etwa 0,1 (95% Block-Bootstrap-KIs [0,094, 0,11]) auf etwa 0,01 (95%-KIs [0,0087, 0,015]) abfallen. Dies deutet darauf hin, dass, obwohl ein wesentlicher Bruchteil der anfänglichen Reaktion auf die Replikate verteilt wird, dieser von einem schnellen Abfall gefolgt wird, ein Ergebnis, das mit dem primären Befund des ursprünglichen Ergebnisses von Barghi et al. (33) Studie: dass alternative Loci zu einer längerfristigen Anpassung über die verschiedenen Replikate hinweg beitragen.

(EIN) Die Konvergenzkorrelationen, gemittelt über Barghi et al. (33) replizieren Paare im Laufe der Zeit. Jede Linie stellt die Konvergenzkorrelation c o r (Δ p s , Δ p t ) von einer beginnenden Referenzgeneration s bis zu einem späteren Zeitpunkt t dar, die entlang der x Achse entspricht jede Zeile einer Zeile der zeitlichen Konvergenzkorrelationsmatrix, die auf dargestellt ist Rechts (wobei die diagonalen Elemente die Konvergenzkorrelationen zwischen denselben Zeitpunkten über Replikatpopulationen hinweg darstellen). Wir stellen fest, dass die konvergente Korrelation für den letzten Zeitpunkt ein Ausreißer ist, bei dem wir uns über die Ursache nicht sicher sind (z. B. scheint sie nicht von einem einzigen Replikatpaar angetrieben zu werden). (B) Die Konvergenzkorrelationen zwischen einzelnen Replikatpaaren in den Daten von Kelly und Hughes (38) (beachten Sie, dass die CIs aufgetragen, aber klein sind ja-Achsenskala). (C) Die Konvergenzkorrelationen zwischen einzelnen Replikatpaaren in den Daten von Castro et al. (39) für die beiden Selektionslinien (LS1 und LS2) und die Kontrolle (Strg) sind graue CIs diejenigen, die den vollständigen Datensatz verwenden, und blaue CIs schließen Chromosom 5 (chr5) und chr10 aus, die die beiden Regionen Castro et al. (39) festgestellt, dass sie Signale der parallelen Auswahl zwischen LS1 und LS2 aufweisen. Durch Simulationen haben wir festgestellt, dass die Unterschiede in den Konvergenzkorrelations-CI-Breiten zwischen diesen Drosophila Studien und die Longshanks-Studie sind auf die unterschiedlichen Bevölkerungsgrößen zurückzuführen.

Ein Vorteil von Zwischen-Replikat-Kovarianzen besteht darin, dass diese im Gegensatz zu zeitlichen Kovarianzen mit nur zwei aufeinander folgenden Zeitpunkten und einem replizierten Studiendesign berechnet werden können. Dies ermöglichte es uns, den Einfluss der verknüpften Selektion bei der Förderung konvergenter Muster der Allelfrequenzänderung über Replikatpopulationen in zwei anderen Studien zu bewerten. Zuerst haben wir das Selektionsexperiment von Kelly und Hughes (38) erneut analysiert, bei dem drei replizierte Wildpopulationen von Drosophila simulans seit 14 Generationen an eine neuartige Laborumgebung anpassen. Da jedes Replikat dem gleichen Selektionsdruck ausgesetzt war und eine gemeinsame LD wie die ursprüngliche natürliche Gründungspopulation hatte, erwarteten wir, dass jede der drei Replikatpopulationen positive Konvergenzkorrelationen aufweist. Wir finden, dass alle drei konvergenten Korrelationskoeffizienten zwischen Replikatpaaren signifikant sind (Abb. 2B) und durchschnittlich 0,36 ( 95 % CI [ 0,31 , 0,40 ] ) . Zusätzlich können wir analog zu unserem G(t) den Anteil der Gesamtvarianz der Allelfrequenzänderung aus dem konvergenten Selektionsdruck berechnen, wobei der Zähler die konvergente Kovarianz und der Nenner die Gesamtvarianz ist (SI-Anhang, Abschnitt S4). Wir stellen fest, dass 37% der Gesamtvarianz auf gemeinsame Allelfrequenzänderungen zurückzuführen sind, die durch Selektion verursacht werden (95% CI [29%, 41%]). Diese sind der Konvergenzkorrelation ähnlich, da die Varianz über die Replikate relativ konstant ist.

Als nächstes analysierten wir das Longshanks-Selektionsexperiment, das bei Mäusen auf eine längere Tibialänge im Verhältnis zur Körpergröße selektierte, was zu einer Reaktion auf die Selektion von etwa 5 SDs über 20 Generationen führte (39, 40). Diese Studie umfasst zwei unabhängige Auswahllinien, Longshanks 1 (LS1) und Longshanks 2 (LS2), und eine nicht ausgewählte Kontrolllinie (Strg), in der die Eltern zufällig ausgewählt wurden. Consequently, this selection experiment offers a useful control to test our convergence correlations: we expect to see significant positive convergence correlations in the comparison between the two Longshanks selection lines but not between each of the control and Longshanks line pairs. We find that this is the case (gray CIs in Fig. 2C), with convergence correlations between each of the Longshanks lines and the control not being statistically different from zero, while the convergence correlation between the two Longshanks lines is strong (0.18) and statistically significant (CIs [0.07, 0.25]).

One finding in the Longshanks study was that two major-effect loci showed parallel frequency shifts between the two selection lines. We were curious to what extent our genome-wide covariances were being driven by these two outlier large-effect loci, so we excluded them from the analysis. Since we do not know the extent to which LD around these large-effect loci affects neighboring loci, we took the conservative precaution of excluding the entire chromosomes these loci reside on (chromosomes 5 and 10) and recalculating the temporal covariances. We find that excluding these large-effect loci has little impact on the CIs (blue CIs in Fig. 2C), indicating that these across-replicate covariances are indeed driven by a large number of loci. This is consistent with a signal of selection on a polygenic trait driving genome-wide change, although we note that large-effect loci can contribute to the indirect change at unlinked loci (41, 42).

The presence of an unselected control line provides an alternative way to partition the effects of linked selection and genetic drift: we can compare the total variance in allele frequency change of the control line (which excludes the effect of artificial selection on allele frequencies) with the total variance in frequency change of the Longshanks selection lines. This allows us to estimate the increase in variance in allele frequency change due to selection, which we can further partition into the effects of selection shared between selection lines and those unique to a selection line by estimating the shared effect through the observed covariance between replicates (Materialen und Methoden und SI-Anhang, section S4 have more details). We estimate at least 32% (95% CI [ 21 % , 48 % ] ) of the variance in allele frequency change is driven by the effects of selection, of which 14% (95% CI [ 3 % , 33 % ] ) is estimated to be unique to a selection line, and 17% (95% CI [ 9 % , 23 % ] ) is the effect of shared selection between the two Longshanks selection lines.

We observed that in the longest study we analyzed (33), some genome-wide temporal covariances become negative at future time points (the first two rows in Fig. 1 EIN, Links). This shows that alleles that were on average going up initially are later going down in frequency (i.e., that the average direction of selection experienced by alleles has flipped). This might reflect either a change in the environment or the genetic background, due to epistatic relationships among alleles altered by frequency changes (which can occur during an optima shift ref. 43) or recombination breaking up selective alleles. Such reversals in selection dynamics could be occurring at other time points, but the signal of a change in the direction of selection at particular loci may be washed out when we calculate our genome-wide average temporal covariances. To address this limitation, we calculated the distribution of the temporal covariances over 100-kb windowed covariances (Fig. 3 shows these distributions pooling across all replicates, and SI-Anhang, Fig. S26 shows individuals replicates). The covariance estimate of each genomic window will be noisy, due to sampling and genetic drift, and the neutral distribution of the covariance is complicated due to LD, which can occur over long physical distances in evolve-and-resequence and selection studies (44, 45). To address this, we have developed a permutation-based procedure that constructs an empirical neutral null distribution by randomly flipping the sign of the allele frequency changes in each genomic window (i.e., a single random sign flip is applied to all loci in a window). This destroys the systematic covariances created by linked selection and creates a sampling distribution of the covariances spuriously created by neutral genetic drift while preserving the complex dependencies between adjacent loci created by LD. This empirical neutral null distribution is conservative in the sense that the variances of the covariances are wider than expected under drift alone, as selection not only creates covariance between time intervals but also, inflates the magnitude of allele frequency change within a time interval. We see (Fig. 3 EIN und B) that there is an empirical excess of windows with positive covariances between close time points compared with the null distribution (a heavier right tail) and that this then shifts to an excess of windows with negative covariances between more distant time points (a heavier left tail).

(EIN und B) The distribution of temporal covariances calculated in 100-kb genomic windows from the Barghi et al. (33) study plotted alongside an empirical neutral null distribution created by recalculating the windowed covariances on 1,000 sign permutations of allele frequency changes within tiles. The number of histogram bins is 88, chosen by cross-validation (SI-Anhang, Fig. S25). In EIN, windowed covariances C o v ( Δ p t , Δ p t + k ) are separated by k = 2 × 10 generations, and in EIN, the covariances are separated by k = 4 × 10 generations each k is an off diagonal from the variance diagonal of the temporal covariance matrix (cartoon of upper triangle of covariance matrix in EIN und B, where the first diagonal is the variance, and the dark gray indicates which off diagonal of the covariance matrix is plotted in the histograms). (C) The lower and upper tail probabilities of the observed windowed covariances, at 20 and 80% quintiles of the empirical neutral null distribution, for varying time between allele frequency changes (i.e., which off diagonal k). The CIs are 95 % block bootstrap CIs, and the light gray dashed line indicates the 20% tail probability expected under the neutral null. Similar figures for different values of k are in SI-Anhang, Fig. S27.

We quantified the degree to which the left and right tails are inflated compared with the null distribution as a function of time and see excesses in both tails in Fig. 3C. This finding is also robust to sign-permuting allele frequency changes on a chromosome level, the longest extent that gametic LD can extend (SI-Anhang, Fig. S29). We see a striking pattern that the windowed covariances not only decay toward zero but in fact, become negative through time, consistent with many regions in the genome having had a reversed fitness effect at later time points.

Finally, we used forward-in-time simulations to explore the conditions under which temporal and convergent correlations arise. We show a subset of our results for a model of stabilizing selection on a phenotype where directional selection is induced by a sudden shift in the optimum phenotype of varying magnitudes (Fig. 4EIN). We find that positive temporal covariances are produced by such selection (Fig. 4B) and that these positive temporal covariances can compound together to generate a large proportion of allele frequency change being due to selection [i.e., large G ( t ) ] over the relatively short time periods similar to our analyzed selection datasets span (Fig. 4C). The magnitude of G ( t ) increases with the strength of selection (i.e., the variance in fitness) such that stronger selection generates larger proportions of allele frequency change. We find a similar picture of stronger convergent selection pressures generating larger convergence correlations (Fig. 4D SI-Anhang, Fig. S12 shows how other factors impact convergence correlations).

Forward-in-time simulations demonstrate how temporal covariance, G ( t ) trajectories, and convergence correlations arise during optima shifts of two different magnitudes, under GSS. (EIN) Trait means across 30 replicates before and after optima shifts (solid lines) for two different magnitudes (indicated by color). The new optimal trait values are indicated by the purple and yellow dashed lines. (B) Mean temporal covariance C o v ( Δ p 5 , Δ p t ) across 30 simulation replicates, where t varies along the x axis (points), with a loess-smoothed average (solid lines). (C) G ( t ) trajectories through time for 30 replicate simulations across two optima shifts. The solid lines are loess-smoothed averages. (D) The convergence correlations between two populations (each 1,000 diploids) split from a common population that underwent an optima shift in either the same direction (converge) or opposite directions (diverge) at generation 5. In B–D, directional selection begins at generation 5, when the optima shifts this is indicated by the vertical dashed red lines (SI-Anhang, section S8.2 has details on these simulations).

Averaging across replicates, these simulation results show G ( t ) is relatively insensitive to the number of loci underlying the trait. However, if only a small number of loci influence the trait, the G ( t ) trajectories are typically much more stochastic across replicates. This reaffirms that the genome-wide linked selection response we see in the Barghi et al. (33) data is highly polygenic (compare Fig. 1B mit SI-Anhang, Abb. S6). Furthermore, using our simulations we find that sampling only every 10 generations does indeed mean that our estimates of G ( t ) are an underestimate of the proportional effect of linked selection as they cannot include the covariance between closely spaced generations (SI-Anhang, Fig. S14).

Additionally, we explored other modes of selection with simulations. We find that the long-term dynamics of the covariances under directional truncation selection, which generates substantial epistasis, are richer than we see under Gaussian stabilizing selection (GSS) and multiplicative selection (SI-Anhang, Fig. S18). We also conducted simulations of purifying selection alone (i.e., background selection) and find that this can also generate positive temporal covariances (SI-Anhang, Fig. S16) and under some circumstances, can even generate convergence correlations (SI-Anhang, Fig. S17). Thus, it is unlikely that the signatures of linked selection we see are entirely the result of the novel selection pressure the populations are exposed to, and some of this signature may be ongoing purifying selection. Only in the case of the Longshanks experiment does the presence of a control line allow us to conclude that selection that is almost entirely due to the novel selection pressure.

While none of our experiments have selected the populations in divergent directions, in our simulations we find that such selection can generate negative convergent correlations (Fig. 4D). This suggests that selection experiments combining multiple replicates, control lines, as well as divergent selection pressures might be quite informative in disentangling the contribution of particular selection pressures from genome-wide allele frequency changes.


Difference Between Natural Selection and Genetic Drift

Both natural selection and genetic drift lead to evolution process by varying the gene frequency of a population over time. Both these processes are involved in evolution and are not mutually exclusive. However, natural selection is the only process, which selects the best adaptive organism to the environment, and genetic drift reduces the genetic variation.

These variations in genes or alleles are inheritable and genetic variation can be resulted by mutation, gene flow and sex.

Natürliche Auslese

Natural selection is a hypothesis proposed by Darwin, where most adaptive organisms are selected by the environment gradually. Natural selection occurs when individuals are genetically varied, that variation makes some individuals better than others, and those superior traits are heritable.

This process occurs through mutations, which occurs in individuals randomly due to various reasons. Because of these mutations, individual may have the advantage beyond the environmental challenges. Individual with this mutation may have better adaptation to the environment than others. For an example, the superior trait will help to escape from predators running faster than other individuals. They can reproduce more than other individuals and trait will pass to the second generation and the evolving of new species happens. The frequency of the new trait will increase in the genome and this process is called natural selection or survival of the fittest organisms.

Genetische Drift

The variation in allele frequencies within a population due to random sampling is simply called genetic drift or Sewall Wright effect. Due to random sampling, subset of the population is not necessarily a representative of the population. It might be skewed to either direction. Smaller the population, the effect of random sampling causes genetic drift than a larger population. Some alleles become more common while they are being selected over and over again, and some may disappear from the small, isolated populations. This genetic drift or disappearance of the allele is unpredictable (Taylor et al, 1998).

The new generations may be diverge form of the parental population thus resulting either extinction of the population or making more adaptive species to the environment. However, in a large population, this effect can be considered as negligible. Genetic drift does not select the adaptive organism like natural selection.

What is the difference between Natural Selection and Genetic Drift?

• The major difference between natural selection and genetic drift is that the natural selection is a process where more adaptive species are selected in response to the environmental challenges, whereas genetic drift is a random selection.

• Natural selection occurs due to environmental challenges, whereas genetic drift does not occur due to environmental challenges.

• Natural selection ends up with selecting the more successive trait over the detrimental trait, whereas due to genetic drift important alleles may disappear completely.

• Natural selection increases the frequency of the trait more adaptive to the environment, whereas genetic drift rarely results in more adaptive species to the environment.

• Natural selection increases genetic variation, whereas genetic drift does not increase genetic variation compared to natural selection. Some times genetic drift causes some variants to be extinct completely.


Biological Evolution

In biology, the process of evolution is the change in a population's genetic structure over successive generations. Specifically, it is the change in allele frequency over time. The many sub-processes of evolution account for the diversity of life, such as genetic inheritance, which accounts for the continuity of traits, mutation, which accounts for novel traits, and natural selection, which accounts for the environmental filtering of traits.

There are four common mechanisms of evolution. The first mechanism is natural selection, a process in which there is differential survival and/or reproduction of organisms that differ in one or more inherited traits. A second mechanism is genetic drift, a process in which there are random changes to the proportions of two or more inherited traits within a population. A third mechanism is mutation, which is a permanent change in a DNA sequence. Finally, the fourth mechanism is gene flow, which is the incorporation of genes from one population into another.

Evolution may in the long term lead to speciation, whereby a single ancestral species splits into two or more different species. Speciation is visible in anatomical, genetic and other similarities between groups of organisms, geographical distribution of related species, the fossil record and the recorded genetic changes in living organisms over many generations. Speciation stretches back over 3.5 billion years during which life has existed on earth. It is thought to occur in multiple ways such as slowly, steadily and gradually over time or rapidly from one long static state to another.

The scientific study of evolution began in the mid-nineteenth century, when research into the fossil record and the diversity of living organisms convinced most scientists that species evolve.] The mechanism driving these changes remained unclear until the theory of natural selection was independently proposed by Charles Darwin and Alfred Wallace in 1858. In the early 20th century, Darwinian theories of evolution were combined with genetics, palaeontology and systematics, which culminated into a union of ideas known as the modern evolutionary synthesis. The synthesis became a major principle of biology as it provided a coherent and unifying explanation for the history and diversity of life on Earth.

Evolution is currently applied and studied in various areas within biology such as conservation biology, developmental biology, ecology, physiology, paleontology and medicine. Moreover, it has also made an impact on traditionally non-biological disciplines such as agriculture, anthropology, philosophy and psychology.

A scientific model, or theory, explaining this process is called a theory of evolution (ToE). The current widely-accepted theory of evolution is the modern evolutionary synthesis, also called the Neo-Darwinian theory. Sometimes, the theory of evolution is simply shortened to "evolution" (as in, "Evolution explains the diversity of life"). (Evolution Wiki, Wikipedia)

As with other truly revolutionary scientific hypotheses such as Aristarchus', Copernicus' and Galileo's heliocentric cosmology, Newton's universal theory of gravitation, Einstein's theory of relativity, Darwin's explanation of the origin and diversity of life on Earth through natural selection totally transformed our understanding of the natural world and our place in the universe. Indeed, the evolution and transformation of life on Earth through geological time simply cannot be understood except through Darwinian evolution, any more than the correct movement of the celestial bodies can be understood without reference to Galileo, Newton, etc. The extraordinary amount of data collected by the life sciences in the one and half centuries since Darwin published origin of the species, have allowed us to develop an integrated understanding of the evolution of life through various physical, chemical, and biological processes over millions of years. MAK110719

page last modified MAK111009, edited RFVS111214
Google search box courtesy of Ask Dave Taylor


Infer gene frequency within a species over time - Biology

The Modern Synthesis of Genetics and Evolution
Copyright © 1993-1997 by Laurence Moran
[Last Update: January 22, 1993]

any people do not understand current ideas about evolution. The following is a brief summary of the modern consensus among evolutionary biologists.

The idea that life on Earth has evolved was widely discussed in Europe in the late 1700's and the early part of the last century. 1859 lieferte Charles Darwin einen Mechanismus, nämlich die natürliche Selektion, der erklären könnte, wie die Evolution abläuft. Darwin's theory of natural selection helped to convince most people that life has evolved and this point has not been seriously challenged in the past one hundred and thirty years.

Es ist wichtig anzumerken, dass Darwins Buch "The Origin of Species by Means of Natural Selection" zwei Dinge bewirkte. Es fasste alle Beweise für die Idee zusammen, dass alle Organismen mit Modifikationen von einem gemeinsamen Vorfahren abstammen, und bildete damit ein starkes Argument für die Evolution. Darüber hinaus befürwortete Darwin die natürliche Selektion als Mechanismus der Evolution. Biologen hinterfragen nicht mehr, ob Evolution stattgefunden hat oder stattfindet. That part of Darwin's book is now considered to be so overwhelmingly demonstrated that is is often referred to as the FACT of evolution. However, the MECHANISM of evolution is still debated.

We have learned much since Darwin's time and it is no longer appropriate to claim that evolutionary biologists believe that Darwin's theory of Natural Selection is the best theory of the mechanism of evolution. I can understand why this point may not be appreciated by the average non-scientist because natural selection is easy to understand at a superficial level. It has been widely promoted in the popular press and the image of "survival of the fittest" is too powerful and too convenient.

During the first part of this century the incorporation of genetics and population biology into studies of evolution led to a Neo-Darwinian theory of evolution that recognized the importance of mutation and variation within a population. Natural selection then became a process that altered the frequency of genes in a population and this defined evolution. This point of view held sway for many decades but more recently the classic Neo-Darwinian view has been replaced by a new concept which includes several other mechanisms in addition to natural selection. Current ideas on evolution are usually referred to as the Modern Synthesis which is described by Futuyma

  1. It recognizes several mechanisms of evolution in addition to natural selection. Eine davon, zufällige genetische Drift, kann ebenso wichtig sein wie die natürliche Selektion.
  2. It recognizes that characteristics are inherited as discrete entities called genes. Die Variation innerhalb einer Population ist auf das Vorhandensein mehrerer Allele eines Gens zurückzuführen.
  3. It postulates that speciation is (usually) due to the gradual accumulation of small genetic changes. Dies entspricht der Aussage, dass Makroevolution einfach viel Mikroevolution ist.

The major controversy among evolutionists today concerns the validity of point #3 (above). The are many who believe that the fossil record at any one site does not show gradual change but instead long periods of stasis followed by rapid speciation. This model is referred to as Punctuated Equilibrium and it is widely accepted as true, at least in some cases. The debate is over the relative contributions of gradual versus punctuated change, the average size of the punctuations, and the mechanism. To a large extent the debate is over the use of terms and definitions, not over fundamentals. No new mechanisms of evolution are needed to explain the model.

Some scientists continue to refer to modern thought in evolution as Neo-Darwinian. In some cases these scientists do not understand that the field has changed but in other cases they are referring to what I have called the Modern Synthesis, only they have retained the old name.