Information

F-Statistiken in der Populationsgenetik verstehen

F-Statistiken in der Populationsgenetik verstehen


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich lese den klassischen Artikel von Weir und Cockerham aus dem Jahr 1984 über die Schätzung von $F_{ST}$. Am Anfang (erste Seite, rechte Spalte) definieren sie 3 Statistiken.

  • $F$ ist die Korrelation von Genen innerhalb von Individuen ("Inzucht")

  • $ heta$ ist die Korrelation von Genen verschiedener Individuen in derselben Population ("Koancestry")

  • $f$ ist die Korrelation von Genen innerhalb von Individuen innerhalb von Populationen.

Sie geben auch an, dass die 3 Statistiken zusammenhängen durch

$$f = (F- heta)(1- heta)$$

Ich verstehe diese 3 Statistiken nicht ganz und vor allem verstehe ich nicht, warum diese Beziehung gilt. Können Sie mir damit helfen?


Ich bin bei dem Thema etwas unsicher, aber ich denke, die wichtigste Information ist, dass sie Wrights (1951) hierarchische Variationsanalyse, "F-Statistik", "hierarchische Partitionierung der Variation" oder "Bevölkerung" neu parametrisieren Parameter", je nachdem, wen Sie fragen. Die Parameter entsprechen wie folgt (auf S.1358 unten): Fit=F, Fis=f, Fst=θ.

Die Beziehung ergibt sich unter bestimmten Annahmen. Entscheidend ist hier, wenn Fis (oder f) ein Maß für die Abweichung vom Hardy-Weinberg-Prinzip ist und alle Populationen identisch von HWP abweichen, dann gilt Fit = 1 – Hi/Ht. Daraus folgt, dass 1 – Fit = Hi/Ht. Wir können dies auch so umschreiben, dass Hi/Ht = (Hi/Hs)(Hs/Ht) ist.

Zusammen können Sie (vielleicht) sehen, dass 1-Fit = (1−Fis)(1−Fst). Ersetzend, 1-F = (1-f)(1-θ).

(Mir ist klar, dass dies keine vollständige Antwort ist, aber Sie können sie mit etwas Algebra neu anordnen, um die Weir & Cockerham-Gleichung zu erhalten, denke ich).

[Update 25. Oktober 2016]: Es ergibt sich schließlich f = (F-θ)/(1-θ). Ich denke, die gepostete Frage (oben) enthält einen Tippfehler - insbesondere einen fehlenden Divisionsoperator. Vielleicht hat jemand den Strich auf einer Schreibmaschine im Originalpapier übersehen?


Was nützt Populationsgenetik?

Die Thomas Hunt Morgan Medal der Genetic Society of America wird einem einzelnen GSA-Mitglied für sein Lebenswerk im Bereich der Genetik verliehen. Der Preisträger des Jahres 2015, Brian Charlesworth, ist seit über 40 Jahren führend in der theoretischen und empirischen Evolutionsgenetik und leistet wesentliche Beiträge zu unserem Verständnis davon, wie die Evolution auf die genetische Variation einwirkt. Einige der Bereiche, in denen Charlesworths Forschung am einflussreichsten war, sind die Evolution von Geschlechtschromosomen, transponierbare Elemente, schädliche Mutationen, sexuelle Fortpflanzung und Lebensgeschichte. Er entwickelte auch die einflussreiche Theorie der Hintergrundselektion, bei der die wiederholte Eliminierung schädlicher Mutationen die Variation an verknüpften Stellen reduziert, was eine allgemeine Erklärung für die Korrelation zwischen Rekombinationsrate und genetischer Variation liefert.

Ich bin der Genetics Society of America dankbar, dass sie mich mit der Thomas Hunt Morgan Medal ausgezeichnet hat und mich eingeladen hat, diesen Aufsatz beizutragen. Ich habe fast 50 Jahre damit verbracht, in der Populationsgenetik zu forschen. Dieser Zweig der Genetik nutzt das Wissen um die Vererbungsregeln, um vorherzusagen, wie sich die genetische Zusammensetzung einer Population unter den Kräften der Evolution verändert und vergleicht die Vorhersagen mit relevanten Daten. Mit zunehmendem Wissen darüber, wie Genome organisiert und funktionieren, hat sich auch die Bandbreite der Probleme vergrößert, mit denen Populationsgenetiker konfrontiert sind. Wir sind jedoch ein relativ kleiner Teil der Genetik-Gemeinschaft, und manchmal scheint es, dass unser Gebiet als weniger wichtig angesehen wird als die Zweige der Genetik, die sich mit den Eigenschaften von Zellen und einzelnen Organismen befassen.

Ich werde diese Gelegenheit nutzen, um zu erklären, warum ich glaube, dass die Populationsgenetik für ein breites Spektrum von Biologen nützlich ist. Die grundlegende Bedeutung der Populationsgenetik sind die grundlegenden Einblicke in die Mechanismen der Evolution, von denen einige alles andere als intuitiv offensichtlich sind. Viele dieser Erkenntnisse stammen aus der Arbeit der ersten Generation von Populationsgenetikern, insbesondere Fisher, Haldane und Wright. Ihre mathematischen Modelle zeigten, dass im Gegensatz zu dem, was die Mehrheit der Biologen in den 1920er Jahren glaubte, die natürliche Selektion, die auf der Mendelschen Variation beruht, evolutionäre Veränderungen mit ausreichender Geschwindigkeit verursachen kann, um historische Evolutionsmuster zu erklären. Dies führte zur modernen Synthese der Evolution (Provine 1971). Niemand kann behaupten, zu verstehen, wie die Evolution funktioniert, ohne ein grundlegendes Verständnis der klassischen Populationsgenetik zu haben, wer aber Gefahr läuft, Fehler zu machen, wie die Behauptung, dass schnelle evolutionäre Veränderungen am wahrscheinlichsten in kleinen Gründerpopulationen auftreten (Mayr 1954).

Mit zunehmendem Wissen darüber, wie Genome organisiert und funktionieren, hat sich auch die Bandbreite der Probleme vergrößert, mit denen Populationsgenetiker konfrontiert sind. Wir sind jedoch ein relativ kleiner Teil der Genetik-Gemeinschaft, und manchmal scheint es, dass unser Gebiet als weniger wichtig angesehen wird als die Zweige der Genetik, die sich mit den Eigenschaften von Zellen und einzelnen Organismen befassen.-B.C.

Die moderne Synthese wird 80 Jahre alt, daher wird dieses Argument wohl skeptische Molekulargenetiker nicht davon überzeugen, dass die Populationsgenetik dem modernen Biologen viel zu bieten hat. Ich gebe zwei Beispiele für die nützliche Rolle, die populationsgenetische Studien spielen können. Erstens war eine der bemerkenswertesten Entdeckungen der letzten 40 Jahre die Entdeckung, dass die Genome der meisten Arten Familien von transponierbaren Elementen (TEs) enthalten, die die Fähigkeit haben, neue Kopien zu erstellen, die an anderer Stelle im Genom inserieren (Shapiro 1983). Dies führte zu zwei Denkschulen darüber, warum sie im Genom vorhanden sind. Einer behauptete, dass TEs erhalten bleiben, weil sie dem Wirt Vorteile verleihen, indem sie adaptiv nützliche Mutationen erzeugen (Syvanen 1984), der andere glaubte, dass sie Parasiten sind, die durch ihre Fähigkeit zur Replikation innerhalb des Genoms trotz potenziell schädlicher Fitnesseffekte von TE-Insertionen aufrechterhalten werden (Doolittle und Sapienza 1980 Orgel und Crick 1980).

Die zweite Hypothese kann getestet werden, indem populationsgenetische Vorhersagen mit den Ergebnissen von TE-Erhebungen innerhalb von Populationen verglichen werden. In den frühen 1980er Jahren versuchten Chuck Langley, ich und mehrere Mitarbeiter genau dies zu tun, indem sie Populationen von Drosophila melanogaster (Charlesworth und Langley 1989). Die Modelle sagten voraus, dass die meisten Drosophila TEs sollten bei niedrigen Populationsfrequenzen an ihren Insertionsstellen gefunden werden. Das ist so, weil D. melanogaster Populationen haben große effektive Größen (ne). ne ist im Wesentlichen die Anzahl der Individuen, die genetisch zur nächsten Generation beitragen. Groß ne bedeutet, dass ein sehr kleiner Selektionsdruck schädliche Elemente bei niedrigen Frequenzen halten kann. Dies ist eine Folge einer der wichtigsten Erkenntnisse der klassischen Populationsgenetik – das Schicksal einer Variante in einer Population ist das Produkt von ne und die Stärke der Selektion (Fisher 1930 Kimura 1962). Wenn zum Beispiel ne 1000 ist, wird eine Mutation, die die Fitness im Vergleich zum Wildtyp um 0,001 reduziert, mit ziemlicher Sicherheit aus der Population eliminiert.

Mit den dann verfügbaren groben Werkzeugen (Restriktionskartierung klonierter Genomregionen und vor Ort Hybridisierung von markierten TE-Sonden an Polytän-Chromosomen) fanden wir, dass fast alle TEs tatsächlich in geringer Häufigkeit in der Population vorhanden sind (Charlesworth und Langley 1989). Die meisten Ausnahmen von dieser Regel wurden in genomischen Regionen gefunden, in denen wenig Crossing Over auftritt (Maside et al. 2005). Dies steht im Einklang mit Chucks Vorschlag, dass die Selektion gegen aneuploide Nachkommen, die durch Kreuzung zwischen homologen TEs an verschiedenen Stellen im Genom entstanden sind, einen wesentlichen Beitrag zur Entfernung von TEs aus der Population leistet (Langley et al. 1988). Es ist mittlerweile eine bekannte Erkenntnis, dass nicht-rekombinierende Genome oder genomische Regionen dazu neigen, voll von TEs und anderen Arten von sich wiederholenden Sequenzen zu sein, die populationsgenetischen Gründe dafür, diskutiert von Charlesworth et al. (1994), sind vielleicht nicht so bekannt.

Moderne genomische Methoden bieten viel leistungsfähigere Mittel zur Identifizierung von TE-Insertionen. Jüngste Bevölkerungsumfragen mit diesen Methoden haben die älteren Ergebnisse bestätigt: Die meisten TEs in Drosophila sind in geringer Häufigkeit vorhanden, und es gibt statistische Beweise für die Selektion gegen Insertionen (Barron et al. 2014). Dies steht im Einklang mit der Existenz ausgeklügelter molekularer Mechanismen zur Unterdrückung der TE-Aktivität, wie beispielsweise des Piwi-interacting RNA (piRNA)-Signalwegs von Tieren (Senti und Brennecke 2010). Es gäbe keinen Grund, solche Mechanismen zu entwickeln, wenn TEs harmlos wären. In einigen Fällen haben TEs hohe Frequenzen oder Fixation erreicht, und es gibt überzeugende Beweise dafür, dass zumindest einige dieser Ereignisse mit einer erhöhten Fitness verbunden sind, die durch die TE-Insertionen selbst verursacht wird (Barron et al. 2014). Diese Fälle widersprechen nicht der intragenomischen Parasitenhypothese für die Aufrechterhaltung von TEs Durch TEs induzierte günstige Mutationen sind zu selten, um die Eliminierung schädlicher Insertionen aufzuwiegen, es sei denn, neue Insertionen ersetzen ständig die verlorenen.

Von der Theorie des Alterns über die Degeneration der Y-Chromosomen bis hin zur Dynamik der transponierbaren Elemente ist unser Verständnis der genetischen Grundlage der Evolution aufgrund von Charlesworths vielen Beiträgen auf diesem Gebiet tiefer und reicher. —Charles Langley, University of California, Davis

Mein anderes Beispiel ist eine populationsgenetische Entdeckung über einen grundlegenden biologischen Prozess: das PRDM9-Protein, das an der Etablierung von Rekombinations-Hotspots beim Menschen beteiligt ist. Dies wurde durch die Revolution in der Populationsgenetik ermöglicht, die durch die Koaleszenztheorie (Hudson 1990) ausgelöst wurde, die ein mächtiges Werkzeug ist, um die statistischen Eigenschaften einer Stichprobe aus einer Population unter der Hypothese der selektiven Neutralität zu untersuchen. Die Grundidee ist einfach: Wenn wir zwei homologe, nicht rekombinierende haploide Genome (z.B., mitochondriale DNA) aus einer großen Population, besteht eine Wahrscheinlichkeit von 1/(2ne), dass sie vom gleichen Elterngenom der vorhergehenden Generation stammen d.h., sie verschmelzen (ne ist die effektive Populationsgröße für die fragliche Genomregion). Wenn sie in dieser Generation nicht zusammenwachsen, besteht eine Wahrscheinlichkeit von 1/(2ne), dass sie eine Generation weiter zurückliegen, und so weiter. Wenn n Genome werden beprobt, es gibt einen sich gabelnden Baum, der sie mit ihrem gemeinsamen Vorfahren verbindet. Die Größe und Form dieses Baumes sind höchst zufällig, sodass genetisch unabhängige Komponenten des Genoms unterschiedliche Bäume erfahren, auch wenn sie die gleichen teilen ne. Die Eigenschaften der Sequenzvariabilität in der Probe können modelliert werden, indem zufällig Mutationen auf den Baum geworfen werden (Hudson 1990).

Die Rekombination bewirkt, dass verschiedene Stellen im Genom unterschiedliche Bäume erfahren, aber eng verbundene Stellen haben viel mehr ähnliche Bäume als unabhängige Stellen. Auf der Ebene der Sequenzvariabilität führt eine enge Kopplung zu nicht zufälligen Assoziationen zwischen neutralen Varianten – Kopplungsungleichgewicht (LD). Das Ausmaß der LD zwischen neutralen Varianten an verschiedenen Standorten wird durch das Produkt von bestimmt ne und die Häufigkeit der Rekombination zwischen ihnen C (Ohta und Kimura 1971 McVean 2002). Richard Hudson schlug eine statistische Methode zur Schätzung vor neC aus Daten zu Varianten an mehreren Stellen im gesamten Genom (Hudson 2001), die in einem weit verbreiteten Computerprogramm implementiert wurden LDhat von Gil McVean und Kollegen (McVean et al. 2002). Anwendungen auf große Datensätze zur menschlichen Sequenzvariabilität zeigten, dass das Genom voller Rekombinations-Hot-Spots und -Cold-Spots ist, im Einklang mit früheren molekulargenetischen Studien bestimmter Loci (Myers et al. 2005). Die meisten Rekombinationen finden an Hotspots statt und nur sehr wenig dazwischen, was die Tatsache erklärt, dass es beim Menschen fast vollständige LD über Dutzende oder sogar Hunderte von Kilobasen gibt. Die Identifizierung einer großen Zahl von Hot Spots führte zur Entdeckung eines von einem Zinkfingerprotein gebundenen Sequenzmotivs, PRDM9, etwa zur gleichen Zeit wie Mausgenetiker auch entdeckten, dass PRDM9 die Rekombination fördert (McVean und Myers 2010 Baudat et al. 2014). Diese Entdeckungen haben zu vielen interessanten Beobachtungen geführt, wie zum Beispiel Assoziationen zwischen PRDM9-Varianten beim Menschen und individuellen Variationen der Rekombinationsraten, was zu einem laufenden Forschungsprogramm von großem wissenschaftlichem Interesse führte (Baudat et al. 2014).

Mit der ständig zunehmenden Nutzung genomischer Daten bin ich zuversichtlich, dass noch viele weitere fruchtbare Interaktionen zwischen Molekular- und Populationsgenetik stattfinden werden. Eine Botschaft zum Mitnehmen ist, dass mehr getan werden muss, um die Ausbildung in Populations-, Molekular- und Computeransätzen zu integrieren, um der nächsten Generation von Forschern das breite Spektrum an Wissen zu vermitteln, das sie benötigen.


Molekulare Systematik und Populationsgenetik biologischer Invasionen: für ein besseres Verständnis des Managements invasiver Arten

Dr. J. Le Roux, Exzellenzzentrum für Invasionsbiologie, Universität Stellenbosch, Gebäude für Naturwissenschaften, Matieland 7602, Südafrika. E-Mail: [email protected] Nach weiteren Artikeln dieses Autors suchen

Department of Tropical Plant and Soil Sciences, University of Hawaii at Manoa, Honolulu, Hawaii, USA

Department of Tropical Plant and Soil Sciences, University of Hawaii at Manoa, Honolulu, Hawaii, USA

Derzeitige Adresse: Center of Excellence for Invasion Biology, University of Stellenbosch, Natural Sciences Building, Matieland 7602, Südafrika

Dr. J. Le Roux, Exzellenzzentrum für Invasionsbiologie, Universität Stellenbosch, Gebäude für Naturwissenschaften, Matieland 7602, Südafrika. E-Mail: [email protected] Nach weiteren Artikeln dieses Autors suchen

Department of Tropical Plant and Soil Sciences, University of Hawaii at Manoa, Honolulu, Hawaii, USA

Institutionelle Anmeldung
Melden Sie sich bei der Wiley Online-Bibliothek an

Wenn Sie zuvor einen Zugang mit Ihrem persönlichen Konto erhalten haben, loggen Sie sich bitte ein.

Sofortzugriff kaufen
  • Sehen Sie sich das Artikel-PDF und alle dazugehörigen Ergänzungen und Abbildungen für einen Zeitraum von 48 Stunden an.
  • Artikel kann nicht gedruckt werden.
  • Artikel kann nicht heruntergeladen werden.
  • Artikel kann nicht neu verteilt werden.
  • Unbegrenzte Ansicht des Artikel-PDFs und der dazugehörigen Ergänzungen und Abbildungen.
  • Artikel kann nicht gedruckt werden.
  • Artikel kann nicht heruntergeladen werden.
  • Artikel kann nicht neu verteilt werden.
  • Unbegrenzte Ansicht des Artikel-/Kapitel-PDFs und der dazugehörigen Ergänzungen und Abbildungen.
  • Artikel/Kapitel können gedruckt werden.
  • Artikel/Kapitel können heruntergeladen werden.
  • Artikel/Kapitel kann nicht neu verteilt werden.

Abstrakt

Das Studium der Populationsgenetik invasiver Arten bietet Möglichkeiten, schnelle evolutionäre Prozesse bei der Arbeit zu untersuchen, und während die Ökologie biologischer Invasionen in der Vergangenheit große Aufmerksamkeit genossen hat, macht die Neuheit molekularer Techniken ihre Anwendung in der Invasionsökologie zu einem ziemlich neuen Ansatz. Trotzdem hat sich die Molekularbiologie bereits als mächtig erwiesen, um Aspekte abzuleiten, die nicht nur für Evolutionsbiologen, sondern auch für diejenigen, die sich mit dem Management invasiver Arten beschäftigen, relevant sind. Hier überprüfen wir die verschiedenen molekularen Marker, die routinemäßig in solchen Studien verwendet werden, und ihre Anwendung(en) bei der Beantwortung verschiedener Fragen in der Invasionsökologie. Anschließend überprüfen wir die aktuelle Literatur zu molekulargenetischen Studien, die darauf abzielen, das Management und das Verständnis invasiver Arten zu verbessern, indem taxonomische Probleme gelöst, geografische Quellen von Eindringlingen aufgeklärt, Hybridisierung und Introgression erkannt, Ausbreitung und Ausbreitung verfolgt und die Bedeutung der genetischen Vielfalt bei der Invasion bewertet werden Erfolg. Abschließend machen wir einige Vorschläge für zukünftige Forschungsbemühungen in der molekularen Ökologie biologischer Invasionen.


Doktorandenstellen in Populationsgenetik

Bitte melden Sie sich bei Life Science Network an, um alle Jobdetails zu sehen.
Wenn Sie bereits ein Life Science Network-, LinkedIn- oder Google-Konto haben:

Lesen Sie hier mehr über Jobs im Life Science Network.

Arbeitgeber

Arbeitsbeschreibung

Wien hat sich in den letzten Jahren zu einem der führenden Zentren der Populationsgenetik entwickelt. Die Vienna Graduate School of Population Genetics wurde gegründet, um Doktoranden die Möglichkeit zu geben, auf dieser exzellenten Expertise vor Ort aufzubauen.

Wir bitten um Bewerbungen von hochmotivierten und herausragenden Studierenden mit Liebe zur Evolutionsforschung und einem Hintergrund in einer der folgenden Disziplinen: Evolutionäre Genetik, Funktionelle Genetik, Theoretische oder experimentelle Populationsgenetik, Bioinformatik, Mathematik, Statistik.

  • Evolution aus de novo-Mutationen – Einfluss erhöhter Mutationsraten.
  • Evolution der geschlechtsspezifischen neuronalen Signalgebung.
  • Genomentwicklung bei Akeleien.
  • Rückschluss von Auswahlsignaturen aus Zeitreihendaten.
  • Langzeitdynamik lokaler Drosophila-Populationen.
  • Molekulargenetik der Epigenetik.
  • Ökologie der Samen.
  • Strukturelle Variation und Genom-Evolution.
  • Temperaturanpassung bei Drosophila: phänotypische Anpassung.
  • Die Quellen der Diversität, die adaptive Strahlung formen.
  • Polygene Anpassung verstehen.

Es werden nur vollständige Bewerbungen (Bewerbungsformular, Lebenslauf, Motivationsschreiben, Hochschulzeugnisse, Angabe der beiden Wunschthemen in einem pdf) berücksichtigt, die bis zum 16.05.2021 eingehen. Zwei Empfehlungsschreiben müssen direkt von den Gutachtern gesendet werden.

Je nach Projekt werden Doktortitel in Genetik, Mathematik oder Statistik verliehen. Doktorandinnen und Doktoranden erhalten ein monatliches Gehalt von derzeit 2.237,60 Euro brutto nach den Bestimmungen des Österreichischen Wissenschaftsfonds (FWF).


Bevölkerungsdynamik und Regulierung

Das logistische Modell des Bevölkerungswachstums ist zwar für viele natürliche Populationen gültig und ein nützliches Modell, aber es ist eine Vereinfachung der Bevölkerungsdynamik in der realen Welt. Das Modell beinhaltet, dass sich die Tragfähigkeit der Umgebung nicht ändert, was nicht der Fall ist. Die Tragfähigkeit variiert jährlich. Einige Sommer sind zum Beispiel heiß und trocken, während andere in vielen Gegenden kalt und nass sind, die Tragfähigkeit im Winter ist viel geringer als im Sommer. Auch Naturereignisse wie Erdbeben, Vulkanausbrüche und Brände können eine Umgebung und damit ihre Tragfähigkeit verändern. Darüber hinaus existieren Populationen normalerweise nicht isoliert. Sie teilen sich die Umwelt mit anderen Arten und konkurrieren mit ihnen um die gleichen Ressourcen (interspezifische Konkurrenz). Diese Faktoren sind auch wichtig, um zu verstehen, wie eine bestimmte Population wachsen wird.

Das Bevölkerungswachstum wird auf verschiedene Weise reguliert. Diese werden in dichteabhängige Faktoren eingeteilt, bei denen die Bevölkerungsdichte die Wachstumsrate und Sterblichkeit beeinflusst, und dichteunabhängige Faktoren, die unabhängig von der Bevölkerungsdichte eine Sterblichkeit in einer Bevölkerung verursachen. Vor allem Wildbiologen wollen beide Arten verstehen, weil ihnen dies hilft, Populationen zu managen und das Aussterben oder die Überbevölkerung zu verhindern.


Einblick in seltene und häufige Krankheiten aus natürlicher Auslese

Von Genen, die mit mendelschen oder komplexen Krankheiten in Verbindung stehen, wird erwartet, dass sie einem ungleichen Selektionsdruck unterliegen. Wir können daher Selektionssignaturen verwenden, um die Beteiligung von Genen an menschlichen Krankheiten vorherzusagen [11, 12, 32, 37, 115, 163]. Mendelsche Störungen sind typischerweise schwerwiegend, beeinträchtigen das Überleben und die Fortpflanzung und werden durch sehr penetrante, seltene schädliche Mutationen verursacht. Gene für die Mendelsche Krankheit sollten daher dem Mutations-Selektions-Balance-Modell entsprechen, mit einem Gleichgewicht zwischen der Mutationsrate und der Rate der Risikoallelentfernung durch reinigende Selektion [12]. Die Verwendung von Populationsgenetikmodellen ist weniger einfach, wenn es darum geht, die Gene vorherzusagen, die an einem komplexen Krankheitsrisiko beteiligt sind. Modelle der adaptiven Evolution, die auf positiver oder ausgleichender Selektion basieren, gelten für einige mendelsche Merkmale oder Störungen, insbesondere, aber nicht ausschließlich, diejenigen, die mit Malariaresistenz zusammenhängen (Übersicht in [76, 98]). Allerdings erschweren die komplexen Vererbungsmuster, die bei Volkskrankheiten beobachtet werden, einschließlich unvollständiger Penetranz, spätem Auftreten und Gen-Umwelt-Interaktionen, die Entschlüsselung des Zusammenhangs zwischen Krankheitsrisiko und Fitness [12].

Reinigende Selektion, seltene Varianten und schwere Störungen

Nach der Theorie der Populationsgenetik werden stark schädliche Mutationen durch reinigende Selektion schnell aus der Population entfernt, während leicht schädliche Mutationen im Allgemeinen vorhanden bleiben, wenn auch in geringer Häufigkeit, abhängig von Populationsgröße und Fitnesseffekten. Genomweite Studien unterstützen diese Vorhersagen zunehmend, da „essentielle“ Gene – als solche anhand von Assoziationen mit Mendelschen Erkrankungen oder experimentellen Nachweisen von Modellorganismen identifiziert – mit Hinweisen auf reinigende Selektion angereichert sind [32, 37, 115, 164]. Es hat sich auch gezeigt, dass die reinigende Selektion bei regulatorischen Variationen weit verbreitet ist und gegen Varianten mit großen Auswirkungen auf die Transkription, konservierte nichtkodierende Regionen des Genoms und Gene, die in regulatorischen und Protein-Protein-Interaktionsnetzwerken eine zentrale Rolle spielen, wirkt [8, 10, 165–171 ].

Mutationen im Zusammenhang mit Mendelschen Erkrankungen oder mit schädlichen Auswirkungen auf den Phänotyp des Organismus sind im Allgemeinen selten und zeigen eine familiäre Segregation, aber solche Mutationen können auch auf bestimmte Populationen beschränkt sein [11]. Diese Einschränkung kann in einigen Fällen auf einen selektiven Vorteil des Krankheitsrisikoallels (z. Kleine Populationsgrößen oder spezifische demografische Ereignisse können die Häufigkeit einiger Krankheitsrisiko-Allele zufällig erhöhen, da zu wenig Zeit für die Reinigung der Selektion verstrichen ist, um sie aus der Population zu entfernen, wie bei Französischkanadiern, aschkenasischen Juden oder Finnen beobachtet [11, 66, 67].

Nach diesen Prinzipien der Populationsgenetik kann die Suche nach Genen oder funktionellen Elementen, die sich unter stark reinigender Selektion entwickeln, verwendet werden, um die Gene mit großer Überlebensrelevanz zu identifizieren, deren Mutationen wahrscheinlich die Funktion beeinträchtigen und zu schweren klinischen Phänotypen führen. In diesem Zusammenhang scheinen die Immunantwort und die Abwehrfunktionen des Wirts die Hauptziele der reinigenden Selektion zu sein [37, 95, 102]. Zum Beispiel schätzte eine kürzlich durchgeführte Studie, die auf Sequenzen des gesamten Genoms aus dem 1000 Genomes Project basiert, den Grad, in dem die reinigende Selektion wirkte

1500 Gene der angeborenen Immunität. Es zeigte sich, dass sich die Gene dieser Klasse insgesamt unter einer global stärkeren reinigenden Selektion entwickelt haben als der Rest des Protein-kodierenden Genoms [95]. Diese Studie bewertete auch die Stärke selektiver Einschränkungen in den verschiedenen Modulen der angeborenen Immunität, ordnete diese Einschränkungen in einer Hierarchie von biologischer Relevanz und lieferte Informationen darüber, inwieweit die entsprechenden Gene essentiell oder redundant waren [95].

Die Populationsgenetik hat auch die Identifizierung von Immunsystemgenen und Signalwegen erleichtert, die wesentliche, nicht redundante Funktionen in der Wirtsabwehr erfüllen, deren Varianten mit schweren, lebensbedrohlichen Infektionskrankheiten assoziiert sind (Beispiele siehe [94, 95, 101 , 106] und für Übersichtsartikel [29, 103, 172, 173]). Dies wird gut veranschaulicht durch die Fälle von STAT1 und TRAF3 sie gehören zu den 1 % der Gene, die die stärksten Signale der reinigenden Selektion auf genomweiter Ebene zeigen [95], und Mutationen in diesen Genen wurden mit schweren viralen und bakteriellen Erkrankungen, der Mendelschen Anfälligkeit für mykobakterielle Erkrankungen und dem Herpes-simplex-Virus in Verbindung gebracht 1 Enzephalitis [174, 175]. Anhand des Paradigmas der Immunität und des Infektionsrisikos unterstreichen diese Studien den Wert der Populationsgenetik als Ergänzung zu klinischen und epidemiologischen genetischen Studien zur Bestimmung der biologischen Relevanz menschlicher Gene in natura und bei der Vorhersage ihrer Beteiligung an menschlichen Krankheiten [29, 103, 173, 176].

Genetische Anpassung, häufige Varianten und komplexe Krankheit

Der Zusammenhang zwischen Selektion und komplexem Krankheitsrisiko ist weniger klar als bei Mendelschen Störungen, aber Muster zeichnen sich ab. Gene, die mit einer komplexen Krankheit assoziiert sind, zeigen Anzeichen einer weniger durchdringenden reinigenden Selektion als Gene für die Mendelsche Krankheit [32, 173] und sind im Allgemeinen an Signalen einer positiven Selektion angereichert [23, 28, 32, 37, 110, 122, 169]. Es gibt auch zunehmend Hinweise darauf, dass genetische Anpassungen die Anfälligkeit für komplexe Krankheiten verändern können, und es ist unwahrscheinlich, dass die Populationsverteilung gemeinsamer Anfälligkeitsallele allein auf neutrale Prozesse zurückzuführen ist [12, 91, 177–179]. Zum Beispiel wird angenommen, dass die unterschiedliche Anfälligkeit für Bluthochdruck und Stoffwechselstörungen zwischen den Bevölkerungsgruppen auf die frühere Anpassung an unterschiedliche Umweltbelastungen zurückzuführen ist [91, 179, 180]. Eine andere Studie charakterisierte die Struktur des komplexen genetischen Risikos für 102 Krankheiten im Kontext der menschlichen Migration [178]. Bevölkerungsunterschiede im genetischen Risiko für Krankheiten wie Typ-2-Diabetes, biliäre Leberzirrhose, entzündliche Darmerkrankung, systemischer Lupus erythematodes und Vitiligo konnten nicht durch eine einfache genetische Drift erklärt werden, was eine Rolle für die vergangene genetische Anpassung belegt [178] . Ebenso fanden Grossman und Mitarbeiter Überschneidungen zwischen ihren positiv ausgewählten Kandidatenregionen und Genen, die mit Merkmalen oder Krankheiten in GWAS verbunden sind [28], einschließlich der Körpergröße, und mehreren Regionen, die mit Risiken für Infektions- und Autoimmunerkrankungen, einschließlich Tuberkulose und Lepra, verbunden sind.

Wie die reinigende Selektion ist die positive Selektion unter Genen, die mit Immunität und Wirtsabwehr in Verbindung stehen, weit verbreitet [24, 37, 95, 109, 112, 115, 181]. Bemerkenswerte Beispiele für immunitätsbezogene Gene, die sich adaptiv durch verschiedene Formen positiver oder ausgleichender Selektion entwickeln und von denen berichtet wird, dass sie mit komplexen Merkmalen oder Krankheiten in Verbindung stehen, sind:TLR1 und TLR5, die Selektionssignale aufweisen, die mit einer Abnahme der NF-kB-Signalgebung in Europa bzw. Afrika in Zusammenhang stehen [28, 94, 95] viele Gene, die in Afrika und Südostasien an der Malariaresistenz beteiligt sind [98, 100] Typ-III-Interferon Gene bei Europäern und Asiaten, im Zusammenhang mit einer höheren spontanen Virus-Clearance [101, 182] GROSS und IL21, die mit der Lassa-Fieber-Infektiosität und -Immunität bei Westafrikanern in Verbindung gebracht wurden [181] und Komponenten des NF-kB-Signalwegs und der Inflammasom-Aktivierung im Zusammenhang mit Cholera-Resistenz in einer Population aus dem Ganges-Delta [97]. Diese Fälle von Selektion im Zusammenhang mit Infektionskrankheiten und viele andere (siehe [29–31, 96, 103] für Übersichten und Referenzen darin) zeigen, dass der Druck, der durch Erreger von Infektionskrankheiten ausgeübt wird, unter den verschiedenen Bedrohungen, denen der Mensch ausgesetzt ist, von größter Bedeutung war [183] . Sie unterstreichen auch den Wert von populationsgenetischen Ansätzen bei der Aufklärung der Varianten und Mechanismen, die dem komplexen Krankheitsrisiko zugrunde liegen.

Änderungen der Selektivdrücke und vorteilhafte/schädliche Varianten

Die meisten der seltenen und verbreiteten Varianten, die in modernen Bevölkerungen mit der Anfälligkeit für Krankheiten assoziiert sind, sind durch neutrale Selektionsprozesse entstanden [184]. Es gibt jedoch zunehmend Hinweise darauf, dass allele, die zuvor adaptiv waren, nach Änderungen der Umweltvariablen oder des menschlichen Lebensstils „maladaptiv“ und mit einem Krankheitsrisiko verbunden werden können [12, 13, 29, 30, 105]. So resultiert beispielsweise die hohe Prävalenz von Typ-2-Diabetes und Adipositas in modernen Gesellschaften nach der populären Hypothese des „thrifty Genotype“ auf der Grundlage epidemiologischer Daten aus der Auswahl von Allelen, die mit einer effizienten Fett- und Kohlenhydratspeicherung in früheren Hungerzeiten verbunden waren. Eine Zunahme des Nahrungsreichtums und eine sitzende Lebensweise haben diese Allele schädlich gemacht [185]. Den stärksten Beweis dafür, dass eine frühere Selektion zu heutigen Fehlanpassungen und Krankheitsanfälligkeit führen kann, liefern infektiöse und entzündliche Erkrankungen [12, 29–31, 77, 105]. Nach der Hygiene-Hypothese hat die Abnahme der Vielfalt der Mikroben, denen wir ausgesetzt sind, infolge der Verbesserung der Hygiene und der Einführung von Antibiotika und Impfstoffen zu einem Ungleichgewicht der Immunantwort geführt, mit Allelen, die uns geholfen haben, Infektionen im in der Vergangenheit mit einem erhöhten Risiko für Entzündungen oder Autoimmunität assoziiert [105].

Populationsgenetische Studien haben die Hygienehypothese stark gestützt, indem sie gezeigt haben, dass genetische Varianten auch mit der Anfälligkeit für bestimmte Autoimmun-, Entzündungs- oder allergische Erkrankungen wie entzündliche Darmerkrankungen, Zöliakie, Typ-1-Diabetes, Multiple Sklerose und Psoriasis verbunden sind zeigen starke positive Selektionssignale [29, 30, 106, 186–188]. Beispielsweise wurde gezeigt, dass Gene, die Anfälligkeit für Entzündungskrankheiten verleihen, mit positiven Selektionssignalen angereichert sind, wobei die ausgewählten Loci ein stark vernetztes Protein-Protein-Interaktionsnetzwerk bilden, was darauf hindeutet, dass eine gemeinsame molekulare Funktion in der Vergangenheit adaptiv war, jetzt aber die Anfälligkeit für verschiedene entzündliche Erkrankungen [187]. Es wird angenommen, dass ein größerer Schutz gegen Krankheitserreger der wahrscheinlichste Grund für die frühere Selektion ist, aber es wurde vorgeschlagen, dass andere Merkmale, wie z. B. entzündungshemmende Erkrankungen in utero, Hautfarbe und hypoxische Reaktionen könnten für den früheren selektiven Vorteil von Varianten verantwortlich sein, was zu der höheren Häufigkeit von chronischen Krankheitsrisikoallelen in aktuellen Populationen beiträgt [30]. Weitere molekulare, klinische und epidemiologische Studien sind erforderlich, um diese Hypothese zu untermauern, aber diese Beobachtungen unterstreichen im Allgemeinen die evolutionären Kompromisse zwischen früherer Selektion und aktuellem Krankheitsrisiko im Zusammenhang mit Veränderungen der Umweltbelastung und des menschlichen Lebensstils.


4. Diskussion

Bewertung der genetischen Vielfalt und Populationsstruktur von g. Kola in Benin ist wichtig für das Management und die Erhaltung der Art. Diese Studie bietet die allererste molekulare Bewertung von g. Kola Diversität und Populationsstruktur durch einen genomweiten SNP-Datensatz. In dieser Studie wurden 12.585 informative DArTseq-SNP-Marker über 100 . identifiziert g. Kola Beitritte. Die PIC-Werte waren nützlich, um das Ausmaß der Polymorphismen zwischen den Akzessionen zu untersuchen. Der durchschnittliche PIC von 0,3 zeigt an, dass die Marker mäßig informativ sind. Der durchschnittliche PIC liegt auch nahe dem Wert, der für SNP-Marker erhalten wurde, die mit GBS in der Untersuchung der Reis-[29] und Weizen-[30]-Diversität identifiziert wurden. Eine frühere Studie über g. Kola in Nigeria mit RAPD-Markern einen PIC-Wert von 0,93 [31]. Die bi-allelische Natur von DArT-SNP-Markern, für die der Maximalwert für PIC 0,5 beträgt, im Vergleich zu multiallelischen RAPD-Markern mit dem maximalen PIC-Wert von 1 [32] kann den Unterschied in den PIC-Werten erklären, der in den beiden Markersystemen beobachtet wurde . Niedrige bis moderate Werte der beobachteten Heterozygotie (0,223–0,248) in den analysierten Populationen dieser Studie weisen auf einen hohen Heterozygotenmangel hin. Im Gegensatz dazu wurde eine sehr hohe Heterozygotie bei beobachtet g. Kola Beitritte aus Nigeria [31]. Die geringe Heterozygotie kann auf ein schwerwiegendes Engpassereignis während der Domestikation und Selektion zurückzuführen sein [33]. In Benin, g. Kola kommt nur in Hausgärten, Bauernhöfen und Brachen vor und kann daher einer freiwilligen oder unfreiwilligen Selektion unterzogen worden sein. Die Ergebnisse dieser Studie stimmen mit anderen Studien überein, die über eine Verringerung der genetischen Vielfalt bei domestizierten Pflanzen im Vergleich zu ihren wilden Vorfahren berichten [29, 34]. Heterozygote Defizite wurden bei vielen bedrohten Arten beobachtet, wie z Cycad balansae [35], Glyptostrobus pensilis [36], Pulsatilla patens [18]. Furthermore, the results of this study also reveal very high levels of inbreeding (FIST = 0.781–0.848). This could be attributed to self-pollination in g. Kola populations [18]. In der Tat, g. Kola is a dioecious species and the ability of g. Kola to mate with half sibs may have resulted in inbreeding among closely related individuals. Low genetic diversity and inbreeding depression have been observed in many studies on threatened species as a consequence of a decrease in population size. [18, 37]. This is likely the case in the studied populations of g. Kola in Benin, which confirms the recent report of the species' disappearance in the wild [2] with a limited number of accessions found in some populations.

Population differentiation is important for understanding the relative effect of evolutionary gene flow, mating system, selection, adaptation, and genetic drift on populations [38]. Pairwise genetic differentiation estimates (FNS) values is a measure of population substructure and is useful in examining the overall genetic differentiation/divergence among populations. The FNS values below 0.05 indicate low genetic differentiation, while values between 0.05–0.15, 0.15–0.25, and above 0.25 indicate moderate, high, and very high genetic differentiation respectively [39]. In the present study, pairwise FNS showed low but significant (p < 0.05) differentiation among the studied populations. It was also observed that genetic variation was mainly found within populations (97.86%). This could be due to the small distribution range of g. Kola in Benin and the short distances between the studied populations, which facilitate gene flow between populations. Zusätzlich, g. Kola populations in Benin are under heavy anthropogenic exploitation [2], and human activities significantly affect the dynamics of genetic differentiation [40]. Discriminant analysis of principal components (DAPC) and the UPGMA analyses partitioned the 100 g. Kola individuals into two principal genetic clusters. Hierarchical clustering analysis performed on g. Kola accessions in Nigeria also revealed two clusters [31]. However, in the present study, an admixture of almost all the populations was noted within the two clusters. The presence of admixture within the two genetic clusters implied the lack of any discernable population structure [41], thus further indicating that interbreeding or sharing of alleles has occurred between the populations. An admixture analysis was performed with the program admixture, which reduces the false-positive rates, corrects for bias toward spurious admixture, and allows identification of different mating systems in structured as well as unstructured populations [42]. A finding of K = 1 suggests the accessions in this study are actually part of the large, non-contiguous, single population with low genetic differentiation and high gene flow.


DMCA-Beschwerde

Wenn Sie der Meinung sind, dass über die Website verfügbare Inhalte (wie in unseren Nutzungsbedingungen definiert) eines oder mehrere Ihrer Urheberrechte verletzen, benachrichtigen Sie uns bitte durch eine schriftliche Mitteilung („Verletzungsmitteilung“) mit den unten beschriebenen Informationen an die benannten unten aufgeführten Agenten. Wenn Varsity Tutors als Reaktion auf eine Verletzungsmitteilung Maßnahmen ergreift, wird es nach Treu und Glauben versuchen, die Partei zu kontaktieren, die diesen Inhalt zur Verfügung gestellt hat, über die neueste E-Mail-Adresse, die Varsity Tutors gegebenenfalls von dieser Partei zur Verfügung gestellt hat.

Ihre Verletzungsmitteilung kann an die Partei, die den Inhalt zur Verfügung gestellt hat, oder an Dritte wie ChillingEffects.org weitergeleitet werden.

Bitte beachten Sie, dass Sie für Schäden (einschließlich Kosten und Anwaltsgebühren) haftbar sind, wenn Sie fälschlicherweise angeben, dass ein Produkt oder eine Aktivität Ihre Urheberrechte verletzt. Wenn Sie sich also nicht sicher sind, ob Inhalte, die sich auf der Website befinden oder auf die von ihr verlinkt wird, Ihr Urheberrecht verletzen, sollten Sie zuerst einen Anwalt kontaktieren.

Bitte befolgen Sie diese Schritte, um eine Anzeige zu erstatten:

Sie müssen Folgendes enthalten:

Eine physische oder elektronische Unterschrift des Urheberrechtsinhabers oder einer Person, die befugt ist, in seinem Namen zu handeln Eine Identifizierung des Urheberrechts, von dem behauptet wird, dass es verletzt wurde Eine Beschreibung der Art und des genauen Ortes des Inhalts, von dem Sie behaupten, dass er Ihr Urheberrecht verletzt, in ausreichend Details, damit Hochschullehrer diesen Inhalt finden und eindeutig identifizieren können. Zum Beispiel benötigen wir einen Link zu der spezifischen Frage (nicht nur den Namen der Frage), der den Inhalt und eine Beschreibung des spezifischen Teils der Frage enthält – ein Bild, a Link, Text usw. – Ihre Beschwerde bezieht sich auf Ihren Namen, Ihre Adresse, Telefonnummer und E-Mail-Adresse und eine Erklärung von Ihnen: (a) dass Sie in gutem Glauben der Ansicht sind, dass die Nutzung der Inhalte, von denen Sie behaupten, dass sie Ihr Urheberrecht verletzen, nicht gesetzlich oder vom Urheberrechtsinhaber oder dessen Vertreter autorisiert ist, (b) dass alle in Ihrer Verletzungsmitteilung enthaltenen Informationen korrekt sind und (c) unter Strafe des Meineids, dass Sie entweder der Urheberrechtsinhaber oder eine Person, die bevollmächtigt ist, in seinem Namen zu handeln.

Senden Sie Ihre Beschwerde an unseren benannten Vertreter unter:

Charles Cohn Varsity Tutors LLC
101 S. Hanley Road, Suite 300
St. Louis, MO 63105


Motivation

This is, most of all, not a book about R. This is also not a “Population Genetics in R” textbook. It is a book about how we do population genetic analyses, for which R is a tool that allows us to reach beyond the limitations of point-and-click interfaces. As a field, Population Genetics has a broad set of textbooks describing the underlying theory. As a student, I cut my teeth on the texts of Hartl (1981), Hartl & Clark (1997) and have used other great texts such as Hamilton (2011) and Hedrick (2009) in the classroom to teach the subject for the last decade. In late 2015, there are a host of texts available to the student of population genetics—amazon lists 150 different books under the search term “Population Genetics textbook”—why do another one? What I have found is that while the theory behind this discipline has been well developed, its application has been largely neglected.

As a new graduate student, fresh out of my first population genetics course, I felt armed with the understanding of how microevolutionary processes influence the distribution of alleles within and among populations. What I wasn’t prepared for was sitting in front of the computer, looking at a few thousand individuals assayed for several different loci and actually ‘doing’ population genetics. All of those textbooks provide me with what is expected and the theory behind it, though often fall short on teaching me how I could apply those inferences to data I actually collect. If you are a theoretical population geneticist, those texts and your ability to integrate mathematical equations will provide you a research lifetime of work. However, if you are practitioner who uses population genetic tools to answer conservation, management, or ecologically inspired questions, the evolutionary expectations of population genetic processes will most likely not be as important as directly estimating inbreeding, exploring ongoing connectivity, or determining genetic granularity of existing populations. This is where this textbook is focusing, a seemingly uninhabited niche in the knowledge ecosystem of graduate level population genetics.

This text was developed out of a graduate course in Population Genetics that I’ve been teaching at Virginia Commonwealth University since 2005. This texts uses R and many additional libraries available within the R ecosystem to illustrate how to perform specific types of analyses and what kind of biological inferences we can gain from them. In the process, we cover materials that are commonly needed in the application of population genetic analysis such as spatial autocorrelation, paternity analysis, and the use of permutation while at the same time highlighting logistical challenges commonly encountered in analyzing real data such as incomplete sampling, missing data, and rarefaction.


31: Population Genetics and Evolution

Laden Sie das Video von iTunes U oder dem Internetarchiv herunter.

Behandelten Themen: Population Genetics and Evolution

Lehrer: Prof. Martin Polz, Guest Lecturer

13: Molekularbiologie IV (ca.

17: Kohlenstoff- und Energiemetab.

18: Produktivität und Nahrungsnetze

19: Regulierung der Produktivität

20: Limitierende Faktoren und Bi.

27: Rekombinante DNA III (co.

31: Populationsgenetik und.

36: Ökologische Anwendungen

So, for today's lecture as you can see up there is molecular -- evolution, and ecology.

And what I mean by this, it's basically the study or what we try to figure out in molecular evolution and ecology is what genes or gene sequences can tell us about the evolution and ultimately also the ecology of organisms in the environment. And it's particularly relevant for thinking about microorganisms, prokaryotes and the environment.

And I hope I can actually convince you today of that.

This is interesting. The topics that I want to cover today is, first of all, I want to review a little bit what we know about life on Earth, sort of give an overview of the evolution of life on Earth. Then, I want to go into specific topic that's of particular relevance for the evolution of eukaryotes.

That's the endosymbiosis theory. And then I'll explain how we can use gene sequences to actually reconstruct events that have happened a very, very long time ago.

OK, so we'll look at what we call molecular phylogenies, with the use of gene sequences to reconstruct the evolutionary history of organisms on Earth. Derived from that, we'll look at what we call the tree of life. That's sort of the big picture overview of the evolutionary relationships of all organisms on the planet. And then finally, I'll introduce you to a topic called molecular ecology. Again, that's how we can use gene sequences to learn something about the diversity of microorganisms in the environment that lead us then, next time, when I come back on Monday, into this big topic of environmental genomics, how we can actually expand this analysis to learn much more about organisms in the environment. So, first of all, let's look at life on Earth. Does anybody know how old we think Earth is? Say again? Yeah, 4.5 to 4.6, I haven't my notes 4.6. So, Earth's thought to have originated about 4.6 billion years ago. When did the first solid rocks appear on earth? So, when was the surface kind of solidified? Weiß jemand? About 3.9 billion years ago, OK?

And when do we think life started to develop on the planet?

Irgendwelche Ideen? Raten Sie mal. Zwei? One? 3.5 billion years ago, OK? So, this is really remarkable.

We think it didn't, I mean, of course it took a long time because were talking about millions of years and hundreds of millions of years, but still, if you look at the big picture, it didn't actually take life that long to evolve on the planet. So, why do we think that is the case? What's the evidence for that? Well, we look into sedimentary rocks, so old rocks that arose from sediments, what you find around this time, you find that chemicals start to appear, organic molecules that really resemble organic molecules in modern life.

So, we have sort of chemical tracers, or chemical fossils.

So, tracers that indicate the presence of organisms. But what we also find is so-called micro-fossils, and I have a picture of that here where when you actually take rocks and actually slice them into very, very then slices, you can put them under specific microscopes.

And what you then find is that many rocks that are very, very old, have those kinds of inclusions in them.

And these things really resemble very much modern prokaryotic cells, modern bacterial cells, for example. And so, those micro-fossils are generally taken as an indication, also, that life is already present during those times. Now, when we take a quick sort of overlook of the evolution of life on the planet, again this graph here summarizes sort of the last 4. billion years or so when life originated. We see that there was a period of chemical evolution, and then somewhere here that region, it's, of course, not really well understood when that exactly happens, the origin of life is placed.

But I want to alert you to a couple of really, really critical steps here that are shown on this graph which we'll actually talk more about.

It is thought that life very early on is split into three major lineages: the bacteria, the archaea, in what is called here nuclear line. And I'll come back to that in a minute or so.

Then, a further major event which you may remember is oxygenic photosynthesis actually evolved -- -- which means that cyanobacteria evolved that started to produce oxygen as a byproduct of photosynthesis. And that really fundamentally changed the chemistry of the Earth. It actually became an oxidizing atmosphere. And what you see here is, once the oxygen concentration goes over a certain level, it allowed the development of an ozone shield. Now, what does that mean?

What was the critical significance of the presence of an ozone shield?

Does anybody know? What does it block out? Anybody remember that?

What's the big significance of the ozone hole over Antarctica for example? It allows UV radiation to heat the Earth's surface, and in fact if there were no ozone, the UV radiation would be so strong that there would be no life possible on land.

So, once the ozone shield actually developed, organisms could conquer, basically, the land's surface and settle on the land surface.

In this, then, is thought to be at least correlated with the development of endosymbiosis. And I'll explain what I mean by that. But it basically led to the origin of modern eukaryotes, so your ancestors essentially. But there was still a long time, obviously, until humans appeared. We have here the origin of animals and metazoans, and then the age of the dinosaurs is already a very small blip here on this graph. And humans don't even get featured on that because we are so recent. So, but what I want to show you here is that three major lineages evolved early on. These are the bacteria, archaea, and what we call a nuclear lineage. And the significance of those nuclear lineages is that it basically combined with bacteria to form the modern eukaryotic cell. So, the eukarya, or eukaryotes they're also called. And it was this combination that we called the endosymbiosis event. I want to explain this a little bit more, and then I'll show you finally why we actually know that those things are very likely to have occurred a long time ago.

Yes? It means the bacteria and the nuclear lineages combine to form a eukaryote, OK? And I'm actually going to explain this on the slide here. So, if you have any more questions after that, please let me know. So, again, this shows you this early evolution, this early split in two archaea, bacteria, and this sort of nuclear line. It is thought that this nuclear line, this was single celled organisms that increased in cell size, and then developed or partitioned the DNA into a nucleus, basically. So exactly how you find it in modern eukaryotic cells.

But then what happened is the cell took up a bacterial cell, and over time this bacterial cell became symbiont.

In fact it became the mitochondria. And so what this mitochondria now does in the moderate eukaryotic cell as you all know is it really took over the energy metabolism. So, the proto-eukaryotic cell took up a heterotrophic bacteria that form the mitochondria.

And this ultimately then gave rise to protozoa and to modern-day animals. But there was a secondary symbiotic event.

This cell, once it had taken up a heterotrophic bacterium, it took up an autotrophic bacterium, a cyanobacterium, an oxygenic photosynthesizer. And this actually that led to the development of modern algae and modern plants.

So what we can say is that mitochondria our ancient heterotrophic bacteria -- And the chloroplasts are ancient cyanobacteria, so, oxygenic, photosynthetic bacteria. And these obviously have coevolved to then form animals and finally your plants.

So now, obviously we are talking here about events that happened a very, very long time ago. And so, the big question is really how do we really know this? But this takes me to the third topic, which is that of molecular evolution. So, we can state the problem again, And that is very simply put, evolution is incredibly slow, OK? And therefore, its processes are not directly observable.

And we need to actually use inference techniques to reconstruct evolutionary processes. Now, what do we use when we want to reconstruct the evolutionary history of animals and plants usually?

Anybody? Fossilien. Exactly. So you take a shovel, essentially, and dig down into the different layers.

And there's different techniques that you can actually determine the age of different sedentary rocks. For example, and then you can construct, if you're lucky, you'll find enough fossils of a particular lineage. You can reconstruct the evolution of the lineage. I'm sure you all have seen the example of the horse, for example, where we have actually quite good evidence when ancient horses look like.

And we can reconstruct the sequence of events that led to the evolution of modern-day horses. Now, you can imagine, though, that when we talk about such ancient events like these there really is no fossil record. OK, so what people have figured out, then, is that that was really a stroke of genius that came about in the late 60s, that DNA molecules can act as evolutionary chronometers.

OK, now what do I mean by that?

I mean that you can take DNA sequences or gene sequences from different kinds of organisms. Based on those gene sequences you can reconstruct the relationships to each other. You can determine whether two organisms are closely related or whether they are only very distantly related. And the underlying mechanism of that, is that mutations happen with a certain probability all the time.

So, the idea is that as time passed on, DNA molecules will change.

So they will accumulate, actually, mutations, and so this will lead to, and that the idea is that the amount of change in a particular DNA sequence is proportional to the time of separate evolution of two different lineages or two different organisms.

So, the amount is more or less proportional -- -- to time since the last common ancestry.

So, let me explain how this is actually done.

What you really need in order to do this, is you need genes that are related to each other, OK? So, genes, they need to be universally distributed. That meets all organisms that you want to compare need to have this type of gene. And, those genes need to have conserved function.

In these genes, we can then compare to each other, and I will explain how this is actually done. Any questions so far?

OK, so the example that I actually want to bring is the 16S ribosomal RNA genes.

We oftentimes abbreviate this rRNA. Now, does anybody remember what the ribosomal RNAs are and do? What's the ribosome? Yes?

Right, and what does it do? Exactly, it's the location where messenger RNA is translated into protein.

Now, the ribosomal RNAs are an integral part of the ribosome.

They play both a catalytic role as well as a structural role in the ribosome. And so, fundamentally, because this is such a fundamental organelle, all living organisms possess it.

So, all organisms have it. So this allows us to use these genes to really compare all living organisms to each other.

OK, so this is a very important point.

I wanted to show you a, OK, if it wakes up. Na, bitte.

An example of these ribosomal RNA genes, now this is actually, what you see here is a secondary structure of the actual RNA, the ribosomal RNA. Now, these molecules have a secondary structure because they play a catalytic and structural role.

And so, the really amazing thing is when you look at the structure, the structure determines really the function of those molecules in different organisms. And then look at this.

We have here a bacterium, and here are an archaea. Now, if you think back to the first couple of slides, what I showed you is that those organisms have not shared a common evolutionary history for about four, or so, billion years, or 3 billion years, excuse me. But, if you just glance very quickly at the structures, you see that they look very similar to each other. So, there's an indication that the function is really very highly conserved of those molecules.

However, when you actually look at the sequences in detail, what you'll find is that there's different regions.

And I'd given some examples here denoted by A, B, C in those molecules. And these different regions of the molecules are really the key to its usefulness in figuring out the evolution and ecology of many organisms.

The region number A here, or denoted by A, a sequence stretches that are the same in all living organisms.

So they are universally conserved, which means that if you get a mutation in a gene in that particular region, you are dead. OK, that's why it's conserved essentially.

Then we have those regions B where the length is conserved, but the sequence is not. So, there are sequence change allowed, but the length needs to be conserved. And then there's the region C were neither length nor sequence is actually conserved, and where we get a lot of variation. So, let me write this down. We have three types of sequence stretches.

We have A, what I called the universally conserved sequences. We have B where length, but not sequence is conserved. And, we have C where neither length nor sequence is actually conserved.

And the first two stretches, the first two types of sequence stretches, are very important in figuring out the phylogeny or the evolutionary relationships amongst organisms. Whereas the sequence stretches number C because they vary so dramatically, are very important in identifying organisms.

And we'll talk more about this actually next time.

So what can we actually know do with those sequences?

Well, the first step is we need to generate an alignment.

OK, and this is actually shown here, where each row denotes a gene from a particular organism.

OK, so these are all abbreviated here.

These actually aren't ribosomal RNA genes, but other genes.

And that what you will see here is we can recognize those three different regions that I've pointed out before. You have the regions A which tell you which nucleotides line up with each other, so you use this sort of as an anchor because the sequences never vary amongst organisms. And that the sequence region B where you light up sequences that vary or stretches that vary in sequence but not in length. Now, why is this important?

It's important because you have in each column that nucleotides that have originated from a common ancestral nucleotide, and whose variation over time you can actually monitor.

Is everybody with that? Any questions? OK, great.

The second step, then, is the calculation of a similarity.

And this is shown here. Again, we have a very simplified alignment now of four different organisms. Here, we have the sequences that we want to compare. And what you'll see is that they're overall very similar, but there are different sort of nucleotides. And so, what we simply do is for each pair of sequence combinations, we calculate the sequence similarity value. So, what you see is that you have 12 nucleotides, and the first pair differs in three nucleotides. OK, so that tells us, or it's called actually a distance here, I'm sorry. Let me write this down here.

It's simply one minus the similarity, of course, but so basically a quarter of the nucleotides differ where it's between A and C, a third of the nucleotides difference on. OK, so you do this for each pair of sequences, excuse me. The third step, then, is to calculate the correction for multiple mutations affecting the same nucleotides.

Now, you can imagine that over time there's a probability that a particular nucleotide mutates, say, twice. So, in the first instance it may change from A to a G, , but then it changes to a C.

But when you look at the modern-day sequences, you don't know that this actually happened. And so there's ways to statistically estimate what the likelihood is that a sequence actually contains such multiple events.

OK, and this, we called, a corrective evolutionary distance then. And what you will note is that the corrected evolutionary distance is invariably larger than the actual observed one.

Now, what can we can do with those distances? We can constrain them into a best fit tree of relationships.

So, we can draw what we call is a best fit tree.

That's shown here. We have our four organisms, but when you look at those branches of the tree what you'll see is that they add up roughly to the correct evolutionary distance here.

So, between A and B we have 0. 3 and 0.08, which roughly gives you 0.3 here, OK, whereas between A and C the tree is constrain such that we have 0.31, and here 0. 5, and so overall you roughly get the distance here that we have calculated. And so what this means is that you ordered the organisms by their calculated evolutionary distance. And so you have now obtained, actually, a very intuitive picture of the relationship of organisms to each other where A and B are obviously the most closely related ones, and A and D are the most distantly related.

Is everybody with it? Any questions? OK, now, this best fit tree is what we call a phylogeny.

Now, excuse me, these techniques really revolutionized the study of evolutionary relationships, and one of the things that it allowed us to do is to construct universal phylogenetic trees or what we can also call the tree of life. And I will show you this on the next slide, and that I want to make a few general statements about this.

So first of all, when you analyze all known organisms, and obviously that would be a big task, but representative of all known organisms, what you'll find is that, indeed, we have three major lineages: the bacteria, the archaea, and the eukarya. OK, so we have what we call three domains of life: the archaea, bacteria, and the eukarya.

So, this really is the evidence that life really split very, very early on into those three lineages that I showed you before.

Interestingly, two of those major domains here are prokaryotic, OK? So, two of the domains are prokaryotes. Moreover, if you actually look at the types of organisms that are on here, you'll notice that even on the eukaryotic side of the tree, most of the organisms here are actually microbial. So, the single celled organisms: and that means that most of the life on the planet is microbial.

The vast diversity of organisms on the planet are microorganisms.

So, we can say that most life is microbial.

And when you, then, look at analysis of mitochondria, and chloroplasts which all have their own genetic machinery, and therefore also their own ribosomes you'll see that the mitochondrion, OK, and the chloroplasts both tree within the bacteria. So, we really have an amazing confirmation of this endosymbiont theory which actually developed in the absence of gene sequences by some Russian scientists in the early 20th century. So, we have that mitochondria and chloroplasts tree within bacteria, and this really supports the endosymbiont theory. So really, you could say eukaryotes are really just walking, and swimming, and flying incubators for bacteria, right? So, just hosts for microorganisms.

OK, so basically you can, what you should take home from this is the three domains of life. Two are prokaryotic, and even more so most of the diversity that we find is actually microbial, and then finally the endosymbiont theory is actually confirmed by those phylogenies. Now, what I want to cover in the remaining time, is how we can actually use now those sequences to learn something about organisms in the environment.

That's the topic of molecular ecology.

To introduce this, I just want to show you a couple slides that really sort of capture what the big problem is that we're facing here. Now, when we look at the abundance of prokaryotic cells in different types of environments, what we see is that there is an enormous number of different prokaryotes out there.

This summarizes, here, different types of environments. We have the marine environment, freshwater environment, sediment and soils, subsurface sentiments and animal guts.

And that this number here gives you the average number of prokaryotic cells either per milliliter or per gram. And it here we have the total number of cells obtained by multiplying the average number with the total volume of the particular environment.

So what you can see is that in the marine environment, we have an average half a million cells per milliliter of water, OK? It freshwater, we have about a million cells.

What is that telling you? There's a ton of prokaryotes out there. What you go swimming, you take a little gulp of water: you've probably eaten several million prokaryotes, that it's nothing to worry about because what this also tells us is that very, very few prokaryotes out there are really pathogens because otherwise you'd be sick all the time.

Now, in sediments and soils, in as little as a gram you have five times 10^9 prokaryotic cells almost. 5 billion prokaryotic cells are out there, and even in very, very deep sediments that reach down to 3,000 m, you have a substantial number of prokaryotic cells.

Well, and here's your guts, 10^5 times 10^6 gives you 10^11 per gram. So again, you're just a walking incubator for a very complex microbial community. Here's the global abundance. You see that steeps of surface sediments and the marine environment, probably in terms of numbers at least, the most important microbial environments. Now, faced with this enormous abundance of prokaryotes out there, very important question is how many of them are out there? Or, how diverse our prokaryotes in the environment? That's important if you want to figure out their function and the environment, and want to understand also their evolution. And what I want to show you here is that we've gone through an amazing development in our understanding of prokaryotic diversity in the environment over the last 10 to 15 years or so. Who knows about E.

. Wilson here? One person? So, he wrote a very famous book on biodiversity, which was published in 1988, where he tried to summarize, really, how diverse the known organisms are on the planet it also try to extrapolate to the total diversity.

And what you see is that he came up with about 1.4 million different species here, mostly dominated by insects. That's the big section here on this pie chart. The plants: very important.

And if you look, the prokaryotes feature with about 3, 00 different species. So, in 1988 we thought there were very few prokaryotic species out there. If you look about 10 years into the future and take the assessment here, and this just exemplifies how the thinking has changed, you see that we think now that there is about 11 million different species out there, and that the vast majority of them are prokaryotic, OK, 10 million. So, this big part of the pie chart is really the prokaryotic diversity. Now, what really has changed is that we've actually started to use molecular techniques to determine the diversity of prokaryotes in the environment.

So molecular ecology is really the use of molecular gene sequences obtained directly from the environment -- -- to learn about the diversity prokaryotic -- -- diversity out there. Now, this slide just quickly summarizes this. Basically, the idea is that you go out into the environment and collect either water or soil samples that, as I just showed you, invariably contain a lot of different prokaryotic cells. You then lyse the cells and purify their DNA. And so that you end up with a mixture of DNA that represents the organisms out there, and then you can use universal PCR primers to actually amplify ribosomal RNA genes from all the organisms that are present in your samples.

Now, why can you use universal PCR primers? Well, they target the regions number A that I showed you before.

Those regions in the genes are invariant amongst all organisms.

You guys all remember how the PCR works, right? We cover this.

OK? Yes? No? Who doesn't? You don't? All right, come to the board. War nur Spaß. OK, you should look it up. I don't have time to cover this, unfortunately, but basically it's a technique that allows you to amplify specific types of genes millions to billion fold. And once you have done this, what you can do is that you can purify the genes on gels, and then separate them by cloning them into individual plasmids. And those plasmids have been inserted into E. coli cells, and the E.

coli cells are then individually grown up so that each culture contains only a single plasmid, and you can then sequence these ribosomal DNAs or ribosomal RNA genes from those clones.

And so, you have obtained a library of the ribosomal RNA genes from the environment. So, we use environmental ribosomal RNA gene libraries from which we then can actually compare how many different types of genes are out there.

So let me show you an example of this. What we have done recently, we've gone out in one of the first really comprehensive samplings of coastal bacteria plankton, which means the bacteria that are present free living in ocean water. And so, we've done this, we've collected all those clones, and then basically we constructed those phylogenetic trees that I showed you before that really allow us see how many different types are out there, and how closely related they are to one another. And what we found is that in this environment that you think might be very simple because it just the water column right? No, not much structure in there.

We found over 1500 bacterial 16S ribosomal RNA sequences to occur, so an enormous diversity of prokaryotes of bacteria in that particular environment. And the important point is that when you actually look at a collection of such studies that I just showed you, what you find is that the vast majority of microorganisms in the environment have never been cultured. So traditionally what we do of course to learn about microorganisms when you grow E.

coli, or so, you throw them onto culture plates.

You make lots of different cells, and that allows you to study some of their properties. But when you look, for example, at results from the ocean, this summarizes now coastal and open ocean environments, again, the bacteria plankton is those free-floating bacterial cells in the water.

And you compare this to what we've actually been able to culture from those environments. What you see is that you have some dominant groups here. They have all funny names, most of them, because they're just clones and clone libraries.

But these are the dominant groups that show up in clone libraries.

Here's their relative representation in different clone libraries from a variety of environments. And so here you have one very important one, the SAR11 group, or this one, the SAR86, that always show up in clone libraries.

But we've never see them in culture, so the important point to realize here is that what is actually happening is that whenever we go out, we find a great diversity of bacteria out there, but we have no idea what they actually do.

And this is one of the big questions that we need to answer to understand, really, how the planet actually works. What are those uncultured microorganisms out in the environment really doing, and what is their importance? And we'll talk about this next time.

We're going to talk about environmental genomics because essentially what we can do now, is we have techniques available that allow us to isolate and least large fragments of the genomes, sequence those, and look at what kinds of genes they have present.

And that allows us, then, to infer some of their function in the biogeochemical cycles in the environment.

OK, so with this I'm going to close today unless you have any more questions.


Schau das Video: Crashkurs Statistik Einleitung (Kann 2022).