Information

6.7: Anhang - Ableitung eines OU-Modells unter stabilisierender Selektion - Biologie

6.7: Anhang - Ableitung eines OU-Modells unter stabilisierender Selektion - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Wir können zunächst die Entwicklung des Merkmals auf dem „Stamm“-Zweig betrachten, bevor die Divergenz der Arten A und B erfolgt. Wir modellieren die stabilisierende Selektion mit einem einzigen optimalen Merkmalswert, der sich bei befindet θ. Wir können die Fitness eines Individuums mit Phänotyp beschreiben z wie:

[W = e^{−γ(z − θ)^2} label{6.11}]

Wir haben eine neue Variable (γ) eingeführt, die die Krümmung der Auswahlfläche erfasst. Um die Rechnungen zu vereinfachen, nehmen wir an, dass die stabilisierende Selektion schwach ist, so dass γ ist klein.

Wir können eine Taylor-Entwicklung dieser Funktion verwenden, um Gleichung ef{6.7} unter Verwendung eines Polynoms anzunähern. Unsere Annahme, dass (γ) klein ist, bedeutet, dass wir Terme größerer Ordnung als ignorieren können γ2:

[ W = 1 − γ(z − θ)^2 label{6.12}]

Dies ist sinnvoll, da eine quadratische Gleichung eine gute Annäherung an die Form einer Normalverteilung in der Nähe ihres Peaks ist. Die mittlere Fitness in der Bevölkerung ist dann:

$$ egin{align} ar{W} &= E[W] = E[1 - gamma (z - heta)^2] &= E[1 - gamma (z^2 - 2 z heta + heta^2)] &= 1 - gamma (E[z^2] - E[2 z heta] + E[ heta^2]) &= 1 - gamma (ar{z}^2 - V_z - 2 ar{z} heta + heta^2) end{align} label{6.13} ]

Wir können die Änderungsrate der Fitness in Bezug auf Änderungen des Merkmalsmittelwertes ermitteln, indem wir die Ableitung von (6.9) nach $ar{z}$ bilden:

$$ frac{partialar{W}}{partialar{z}} = -2gammaar{z} + 2gamma heta = 2gamma ( heta - ar{z }) label{6.14} ]

Wir können nun die Gleichung von Lande (1976) für die Dynamik des Populationsmittelwerts über die Zeit für ein Merkmal unter Selektion verwenden:

$$ Delta ar{z} = frac{G}{ar{W}} frac{partial ar{W}}{partialar{z}} label{6.15} ]

Wenn wir die Gleichungen ef{6.9} und ef{6.10} in die Gleichung ef{6.11} einsetzen, erhalten wir:

$$ Delta ar{z} = frac{G}{ar{W}} frac{partial ar{W}}{partialar{z}} = frac{G}{1 - gamma (ar{z}^2 - V_z - 2 ar{z} heta + heta^2)} 2 gamma ( heta - ar{z}) label{6.16}]

Dann, weiter vereinfachend mit einer weiteren Taylor-Entwicklung, erhalten wir:

$$ ar{z}' = ar{z} + 2 G gamma ( heta - ar{z}) + deltalabel{6.17}]

Hier ist (ar{z}) der Merkmalswert der Art in der vorherigen Generation und (ar{z}') in der nächsten, während G die additive genetische Varianz in der Population ist, γ die Krümmung der Auswahlfläche, θ der optimale Merkmalswert und δ eine zufällige Komponente, die den Effekt der genetischen Drift erfasst. Wir können den erwarteten Mittelwert des Merkmals über die Zeit ermitteln, indem wir den Erwartungswert dieser Gleichung nehmen:

$$ E[ar{z}'] = mu_z' = mu_z + 2 G gamma ( heta - mu_z) label{6.18}]

Wir können diese Differentialgleichungen dann unter der Ausgangsbedingung $mu_z(0) = ar{z}(0)$ lösen. Dabei erhalten wir:

$$ mu_z(t) = heta + e^{-2 G t gamma} (ar{z}(0)- heta) label{6.19} ]

Wir können einen ähnlichen Ansatz wählen, um die erwartete Varianz der Merkmalswerte über die Replikate hinweg zu berechnen. Wir verwenden einen Standardausdruck für die Varianz:

$$ egin{array}{l} V_z' = E[ar{z}'^2] + E[ar{z}']^2 V_z' = E[(ar{z} + 2 G gamma ( heta - ar{z}) + delta)^2] - E[ar{z} + 2 G gamma ( heta - ar{z}) + delta]^2 V_z' = G/n + (1 - 2 G gamma)^2 V_z end{array} label{6.20} ]

Wenn wir annehmen, dass die stabilisierende Selektion schwach ist, können wir den obigen Ausdruck mit einer Taylor-Reihenentwicklung vereinfachen:

$$ V_z' = G/n + (1 - 4 G gamma) V_z label{6.23}]

Wir können dann diese Differentialgleichung mit Startpunkt . lösen Vz(0)=0:

$$ V_z(t) = frac{e^{-4 G t gamma}-1}{4 n gamma} label{6.24} ]

Die Gleichungen ef{6.15} und ef{6.20} sind äquivalent zu einem stochastischen Standardmodell für Random Walks namens an Ornstein-Uhlenbeck-Verfahren. Typische Ornstein-Uhlenbeck-Prozesse haben vier Parameter: den Startwert ((ar{z}(0))), das Optimum ( θ), der Driftparameter ( σ2) und ein Parameter, der die Stärke der Beschränkungen ( α). In unserer Parametrisierung sind (ar{z}(0)) und θ sind wie gegeben, α = 2g, und σ2 = g/n.

Wir müssen nun wissen, wie sich OU-Modelle verhalten, wenn sie entlang der Zweige eines phylogenetischen Baums betrachtet werden. Im einfachsten Fall können wir die gemeinsame Verbreitung zweier Arten, A und B, beschreiben, die von einem gemeinsamen Vorfahren abstammen, z. Unter Verwendung von Gleichung 6.17 sind Ausdrücke für Merkmalswerte der Spezies A und B:

$$ egin{array}{l} ar{a}' = ar{a} + 2 G gamma ( heta - ar{a}) + delta ar{b}' = bar{b} + 2 G gamma ( heta - ar{b}) + delta end{array} label{6.25} ]

Die erwarteten Werte dieser beiden Gleichungen ergeben Gleichungen für die Mittelwerte unter Verwendung von Gleichung 6.19:

$$ egin{array}{l} mu_a' = mu_a + 2 G gamma ( heta - mu_a) mu_b' = mu_b + 2 G gamma ( heta - mu_b) end{array} label{6.27}]

Wir können dieses System von Differentialgleichungen unter gegebenen Startbedingungen $mu_a(0)=ar{a}_0$ und $mu_b(0)=ar{b}_0$ lösen:

$$ egin{array}{l} mu_a'(t) = heta + e^{-2 G t gamma} (ar{a}_0 - heta) mu_b'(t) = heta + e^{-2 G t gamma} (ar{b}_0 - heta) end{array} label{6.29} ]

Wir können jedoch auch feststellen, dass der Startwert für beide ein und B ist gleich dem Endwert für Spezies z am Wurzelzweig des Baumes. Wenn wir die Länge dieses Zweigs bezeichnen als T1 dann:

$$ E[ar{a}_0] = E[ar{b}_0] = E[ar{z}(t_1)] = e^{-2 G t_1 gamma} (ar{z} _0 - heta) label{6.31} ]

Setzen Sie dies in die Gleichungen (6.25-26) ein:

$$ egin{array}{l} mu_a'(t) = heta + e^{-2 G gamma (t_1 + t)} (ar{z}_0 - heta) mu_b' (t) = heta + e^{-2 G gamma (t_1 + t)} (ar{z}_0 - heta) end{array} label{6.32}$$
Gleichungen

Wir können die erwartete Varianz zwischen den Replikaten der Spezies A und B wie oben berechnen:

$$ egin{array}{l} V_a' = E[ar{a}'^2] + E[ar{a}']^2 V_a' = E[(ar{a} + 2 G gamma ( heta - ar{a}) + delta)^2] + E[ar{a} + 2 G gamma ( heta - ar{a}) + delta]^2 V_a' = G / n + (1 - 2 G gamma)^2 V_a end{array} label{6.34}]

Ähnlich,

$$ egin{array}{l} V_b' = E[ar{b}'^2] + E[ar{b}']^2 V_b' = G / n + (1 - 2 G gamma)^2 V_b end{array} label{6.37} ]

Wieder können wir annehmen, dass die stabilisierende Selektion schwach ist, und diese Ausdrücke mit einer Taylor-Reihenentwicklung vereinfachen:

$$ egin{array}{l} V_a' = G / n + (1 - 4 G gamma) V_a V_b' = G / n + (1 - 4 G gamma) V_b end{array } label{6.39} ]

Wir müssen noch einen dritten Begriff berücksichtigen, die Kovarianz zwischen den Arten A und B aufgrund ihrer gemeinsamen Abstammung. Wir können einen Standardausdruck für die Kovarianz verwenden, um eine dritte Differentialgleichung aufzustellen:

$$ egin{array}{l} V_{ab}' = E[ar{a}' ar{b}'] + E[ar{a}'] E[ar{b}'] V_{ab}' = E[(ar{a} + 2 G gamma ( heta - ar{a}) + delta)(ar{b} + 2 G gamma ( heta - ar{b}) + delta)] + E[ar{a} + 2 G gamma ( heta - ar{a}) + delta] E[ar{a} + 2 G gamma ( heta - ar{a}) + delta] V_{ab}' = V_{ab} (1 - 2 G gamma)^2 end{array} label{6.41} ]

Zur Vereinfachung verwenden wir wieder eine Taylor-Reihenentwicklung:

[V_{ab}′= − 4V_{ab}Gγ label{6.44} ]

Beachten Sie, dass bei diesem Modell die Kovarianz zwischen A und B mit der Zeit abnimmt, nachdem sie von einem gemeinsamen Vorfahren abweichen.

Wir haben nun ein System von drei Differentialgleichungen. Anfangsbedingungen einstellen Vein(0)=Vein0, VB(0)=VB0, und VeinB(0)=VeinB0, lösen wir auf, um zu erhalten:

$$ egin{array}{l} V_a(t) = frac{1 - e^{-4 G gamma t}}{4 n gamma} + V_{a0} V_b(t) = frac{1 - e^{-4 G gamma t}}{4 n gamma} + V_{b0} V_{ab}(t) = V_{ab0} e^{-4 G gamma t} end{array} label{6.45} ]

Wir können die Startbedingungen weiter spezifizieren, indem wir festhalten, dass sowohl die Varianz von A und B als auch ihre Kovarianz einen Anfangswert haben, der durch die Varianz von . gegeben ist z zum Zeitpunkt T1:

$$ V_{a0} = V_{ab0} = V_{ab0} = V_z(t_1) = frac{e^{-4 G gamma t_1}-1}{4 n gamma} label{6.48} ]

Durch Einsetzen von 6.44 in 6.41-43 erhalten wir:

$$ egin{array}{l} V_a(t) = frac{e^{-4 G gamma (t_1 + t)} -1}{4 n gamma} V_b(t) = frac {e^{-4 G gamma (t_1 + t)} -1}{4 n gamma} V_{ab}(t) = frac{e^{-4 G gamma t} -e^ {-4 G gamma (t_1 + t)}}{4 n gamma} end{array} label{6.49} ]

Bei diesem Modell folgen die Merkmalswerte einer multivariaten Normalverteilung; man kann berechnen, dass alle anderen Momente dieser Verteilung null sind. Somit beschreibt die Menge der Mittelwerte, Varianzen und Kovarianzen die Verteilung von A und B vollständig γ auf Null geht, wird die Auswahlfläche immer flacher. Also an der Grenze wie γ nähert sich 0, sind diese Gleichungen gleich denen für die Brownsche Bewegung (siehe Kapitel 4).

Diese quantitative genetische Formulierung – die Lande (1976) folgt – unterscheidet sich von der typischen Parametrisierung des OU-Modells für vergleichende Verfahren. Die „normalen“ OU-Gleichungen erhalten wir durch Einsetzen von α = 2gγ und σ2 = g/n:

$$ egin{array}{l} V_a(t) = frac{sigma^2}{2 alpha} (e^{-2 alpha (t_1 + t)} - ​​1) V_b(t ) = frac{sigma^2}{2 alpha} (e^{-2 alpha (t_1 + t)} - ​​1) V_ab(t) = frac{sigma^2}{2 alpha} e^{-2 alpha t} (1-e^{-2 alpha t_1}) end{array} label{6.52} ]

Diese Gleichungen sind mathematisch äquivalent zu den Gleichungen in Butler et al. (2004) auf einen phylogenetischen Baum mit zwei Arten angewendet.

Wir können diesen Ansatz leicht auf einen vollständigen phylogenetischen Baum mit (n) Taxa verallgemeinern. In diesem Fall werden die Eigenschaftswerte der (n)-Arten alle aus einer multivariaten Normalverteilung gezogen. Der mittlere Merkmalswert für Arten ich ist dann:

$$ mu_i(t) = heta + e^{-2 G gamma T_i}(ar{z}_0 - heta) label{6.55}]

Hier Tich repräsentiert die gesamte Astlänge, die diese Art von der Wurzel des Baumes trennt. Die Varianz der Arten ich ist:

$$ V_i(t) = frac{e^{-4 G gamma T_i} - 1}{4 n gamma} label{6.56} ]

Schließlich ist die Kovarianz zwischen den Arten ich und J ist:

$$ V_{ij}(t) = frac{e^{-4 G gamma (T_i - s_{ij})}-e^{-4 G gamma T_i}}{4 n gamma} label {6.57} ]

Beachten Sie, dass die obige Gleichung nur gilt, wenn Tich = TJ – was nur für alle gilt ich und J wenn der Baum ultrametrisch ist. Wir können die normalen OU-Parameter ersetzen, α und σ2, in diese Gleichungen:

$$ egin{array}{l} mu_i(t) = heta + e^{- alpha T_i}(ar{z}_0 - heta) V_i(t) = frac{sigma ^2}{2 alpha} e^{-2 alpha T_i} - 1 V_{ij}(t) = frac{sigma^2}{2 alpha} (e^{-2 alpha (T_i - s_{ij})}-e^{-2 alpha T_i}) end{array} label{6.58} ]


Arnone, M. I. & Davidson, E. H. Die Festverdrahtung der Entwicklung: Organisation und Funktion genomischer Regulierungssysteme. Entwicklung 124, 1851–1864 (1997).

Frasch, M. & Levine, M. Komplementäre Muster von sogar übersprungen und Fushi Tarazu Expression beinhalten ihre unterschiedliche Regulation durch einen gemeinsamen Satz von Segmentierungsgenen in Drosophila. Gene Dev. 1, 981–995 (1987).

Goto, T. P., Macdonald, P. & Maniatis, T. Frühe und späte periodische Muster von sogar übersprungen Expression werden durch unterschiedliche regulatorische Elemente gesteuert, die auf unterschiedliche räumliche Hinweise reagieren. Zelle 57, 413–422 (1989).

Harding, K., Hoey, T., Warrior, R. & Levine, M. Autoregulatory and Gap response elements of the sogar übersprungen Promoter von Drosophila. EMBO J. 8, 1205–1212 (1989).

Stanojevic, D., Small, S. & Levine, M. Regulierung eines Segmentierungsstreifens durch überlappende Aktivatoren und Repressoren im Drosophila Embryo. Wissenschaft 254, 1385–1387 (1991).

Small, S., Blair, A. &. Levine, M. Regulierung von sogar übersprungen Streifen 2 im Drosophila Embryo. EMBO J. 11, 4047–4057 (1992).

Arnosti, D., Barolo, S., Levine, M. &. Small, S. Der eve stripe 2 Enhancer verwendet mehrere Modi der Transkriptionssynergie. Entwicklung 122, 205–214 (1996).

Hewitt, G.F.et al. Transkriptionelle Repression durch die Drosophila Riesenprotein: cis Die Elementpositionierung bietet ein alternatives Mittel zur Interpretation eines Effektorgradienten. Entwicklung 126, 1201–1210 (1999).

Ludwig, M. Z., Patel, N. H. & Kreitman, M. Functional analysis of eve stripe 2 Enhancer Evolution in Drosophila: Regeln für Erhaltung und Veränderung. Entwicklung 125, 949–958 (1998).

Ludwig, M. Z. & Kreitman, M. Evolutionäre Dynamik der Enhancer-Region von sogar übersprungen in Drosophila. Mol.-Nr. Biol. Entwicklung 12, 1002–1011 (1995).

Beverly, S. M. & Wilson, A. C. Molekulare Evolution in Drosophila und die höhere Diptera II. Eine Zeitskala für die Evolution der Fliegen. J.Mol. Entwicklung 21, 1–13 (1984).

Small, S., Arnosti, D. N. & Levine, M. Spacing gewährleistet die autonome Expression verschiedener Stripe Enhancer im sogar übersprungen Promoter. Entwicklung 119, 767–772 (1993).

Kimura, M. Möglichkeit umfassender neutraler Evolution unter stabilisierender Selektion unter besonderer Berücksichtigung der nicht-zufälligen Verwendung synonymer Codons. Proz. Natl Acad Sci. Vereinigte Staaten von Amerika 78, 5773–5777 (1981).

Kimura, M. Die neutrale Theorie der molekularen Evolution (Cambridge Univ. Press, Cambridge, 1983).

Ohta, T. & Tachida, H. Theoretische Studie der nahezu Neutralität. I. Heterozygotie und Rate der Mutantensubstitution. Genetik 126, 219–229 (1990).

Long, A.D., Lyman, R.F., Langley, C.H. & Mackay, T.F. Zwei Stellen in der Delta-Genregion tragen zur natürlich vorkommenden Variation der Borstenzahl in bei Drosophila melanogaster. Genetik 149, 999–1017 (1998).

Gibson, G. & Hogness, D. S. Effekt des Polymorphismus in der Drosophila regulatorisches Gen Ultrabithorax auf die homöotische Stabilität. Wissenschaft 271, 200–203 (1996).

Lawrence, C.E. et al. Erkennung subtiler Sequenzsignale: eine Gibbs-Sampling-Strategie für multiples Alignment. Wissenschaft 262, 208–214 (1993).

Berg, O.G. & von Hippel, P.H. Selektion von DNA-Bindungsstellen durch regulatorische Proteine. Statistisch-mechanische Theorie und Anwendung auf Betreiber und Promoter. J.Mol. Biol. 193, 723–750 (1987).


Werden häufige Annahmen häufig erfüllt?

Die wichtigste Botschaft aus der Überprüfung der PNC-Maßnahmen ist, dass ihre Leistung entscheidend davon abhängt, ob die zugrunde liegenden Annahmen eines bestimmten Modells der Nischenentwicklung erfüllt sind oder nicht. Im Allgemeinen ist die kritische Annahme ein BM-Modell der Nischenentwicklung. Hinweise aus der Literatur deuten jedoch darauf hin, dass BM selten das beste Modell ist, um den Nischenevolutionsprozess zu beschreiben (z. B. Estes & Arnold 2007 Harmon et al. 2010 Uyeda et al. 2011). Wir unterstützen diese Beweise basierend auf der Analyse der Entwicklung der Körpermasse bei 17 Säugetiergruppen (siehe Anhang S3.). Für diese Säugetierdaten ist einfaches BM nie die beste Beschreibung des zugrunde liegenden Nischenevolutionsprozesses (siehe Tabelle S1, Hintergrundinformationen). Dieses Ergebnis wird durch eine Monte-Carlo-Poweranalyse gestützt (Tabelle S1 mit einer Ausnahme: für die Tamias klade konnte die Nullhypothese eines zugrunde liegenden BM-Modells nicht abgelehnt werden, P-Wert = 0,06). Darüber hinaus deuten unsere Ergebnisse darauf hin, dass ein OU-Modell mit einem einzigen Optimum oft auch nicht geeignet ist, da in allen Kladen außer Tamias, wurden mindestens zwei unterschiedliche Optima festgestellt. Schließlich zeigt die naive Anwendung der unterschiedlichen Ansätze der PNC auf Säugetierdaten erneut, dass die Ergebnisse oft widersprüchlich sind, wenn die Annahmen der Ansätze nicht erfüllt sind (siehe Abb. S1, Hintergrundinformationen).


Genetische Korrelationen mit rLRS

Die phänotypischen Ergebnisse stimmen mit der Wirkung der natürlichen Selektion überein, aber damit eine Anpassung stattfinden kann, müssen Auswirkungen auf genetischer Ebene vorhanden sein. Zu diesem Zweck haben wir genetische Daten von 157.807 weiblichen und 115.902 männlichen nicht verwandten Proben analysiert. Schätzungen der genetischen Korrelationen zwischen mehreren Merkmalen und rLRS, r g , rLRS wurden aus den Daten unter Verwendung der LD-Score-Regression gewonnen (32, 33). Die LD-Score-Regression verwendet die Regression der Kreuzprodukte von z Statistiken zu einem LD-Maß in einem genomischen Fenster (dem LD-Score) unter Annahme einer polygenen Architektur, um genetische Kovarianzkomponenten aus GWAS-Ergebnissen abzuschätzen. Wir analysierten auch die vorläufige Datenveröffentlichung des UKB mit einem linearen Mixed-Modeling-Ansatz (LMM). Dieser Ansatz war für den vollständigen Datensatz rechnerisch nicht durchführbar. Wir berichten über die Ergebnisse des vollständigen Datensatzes unter Verwendung der LD-Score-Regression im Haupttext, aber siehe SI-Anhang für eine Diskussion der LMM-Ergebnisse. Alle Schätzungen der genetischen Varianz und Kovarianz sind in Datensatz S2 enthalten.

Die Theorie sagt voraus, dass Merkmale, die stark mit der Fitness korrelieren, eine geringe Heritabilität haben (47). Wie erwartet hat rLRS eine geringe, aber signifikante SNP-Heritabilität im UKB-Datensatz, was bedeutet, dass wir in der Lage sind, starke genetische Korrelationen zu erkennen. Insbesondere betrugen die LD-Score-Regressionsschätzungen von h SNP , rLRS 2 0,056 bzw. 0,033 bei Frauen bzw. bei Männern mit entsprechenden Standardfehlern von 0,0046 und 0,0054. Abb. 3 zeigt r^g, rLRS für die Teilmenge von Merkmalen, für die eine Schätzung marginal signifikant war (P ≤ 10 − 3 ) bei mindestens einem Geschlecht.

Balkendiagramme, die genetische Korrelationen zwischen einer Auswahl von Merkmalen und rLRS für Weibchen (rot) und Männchen (blau) zeigen. Die Merkmale wurden auf der Grundlage ihrer geringfügigen Signifikanz ausgewählt (P ≤ 0,001 ) in mindestens einem Geschlecht und wurden in aufsteigender Reihenfolge der Schätzung für jedes Geschlecht sortiert. Die Daten werden als Korrelationsschätzung plus oder minus SE angezeigt ( P ≤ 0,001 , *FWER ≤ 0,05 ). Die Balken sind mit den folgenden abgekürzten Merkmalsbeschreibungen gekennzeichnet: Alter bei Menarche (AAM), Alter bei Erstgeburt (AFB), Alter bei Menopause (AMP), Körperfettanteil (BFP), Body-Mass-Index (BMI), Grundumsatz Rate (BMR), Bildungsstand (EA), Fluid Intelligence Score (FIS), Hüftumfang (HC), Größe (HT), Taillenumfang (WC), Taille-Hüft-Verhältnis (WHR) und Gewicht (WT) .

Die geschätzte genetische Korrelation mit rLRS war für mehrere anthropometrische Merkmale signifikant. Zum Beispiel sind die Schätzungen von r^g, rLRS für die Körpergröße – 0,1278 ± 0,0274 (P < 10 – 5) bei Frauen und – 0,0074 ± 0,0412 (P = 0,18) bei Männern. Denken Sie daran, dass wir einen signifikant negativen Selektionsgradienten bei Frauen mit einem kleinen, aber signifikanten positiven Selektionsgradienten bei Männern geschätzt haben. Die phänotypischen Ergebnisse stimmen mit früheren Studien in westlichen Populationen überein (13), was darauf hindeutet, dass die Selektion nach Reproduktionserfolg kleinere Weibchen und größere Männchen bevorzugt. Da wir jedoch keine Beweise für eine genetische Korrelation zwischen Körpergröße und rLRS bei Männern sehen, sagen wir nicht voraus, dass die beobachtete phänotypische Selektion bei Männern eine Reaktion auf die Selektion (in einer einzigen Generation) auslösen würde.

Der BMI liefert ein weiteres wichtiges Beispiel für die Richtungsselektion eines anthropometrischen Merkmals. Wir schätzen, dass r^g, rLRS für den BMI 0,104 ± 0,0344 (P = 10 – 2,6) bei Frauen und 0,31 ± 0,046 (P < 10 – 10) bei Männern beträgt. Diese Ergebnisse ähneln qualitativ unseren phänotypischen Ergebnissen, die eine positive Richtungsselektion bei beiden Geschlechtern mit einem größeren Schätzwert bei Männern anzeigten. Obwohl das genetische Ergebnis für Frauen unsere studienbezogene Signifikanzschwelle nicht überschritten hat, stimmen die Ergebnisse mit der Hypothese überein, dass die gegenwärtige Selektion auf Reproduktion einen höheren BMI bei Männern begünstigt und die Untersuchung derselben Hypothese bei Frauen unterstützt.

Die Schätzung der genetischen Korrelation für AFB bei Frauen war die stärkste, die in unserer Studie beobachtet wurde. Wir schätzen, dass r ^ g, rLRS für AFB – 0,593 ± 0,035 (P < 10 – 16) beträgt. Dieses Ergebnis stimmt sowohl mit unseren phänotypischen Beobachtungen als auch mit früheren stammbaumbasierten Ergebnissen überein (17). EA ist auch stark negativ mit rLRS korreliert. Wir schätzen das r ^ g , rLRS für EA auf − 0,316 ± 0,037 ( P < 10 − 16 ) bei Frauen und − 0,2539 ± 0,052 ( P < 10 − 5 ) bei Männern. Die wahrscheinlichste Erklärung für diese genetischen Ergebnisse ist jedoch etwas, das dem, was wir auf phänotypischer Ebene für diese beiden Merkmale beobachtet haben, sehr ähnlich ist, was mit Arbeiten zur zeitgenössischen Selektion in einer isländischen Population übereinstimmen würde (27).

Ein weiterer interessanter Aspekt der beobachteten negativen Richtungsselektion bei AFB ist, dass sie eine Selektion für eine verlängerte weibliche Reproduktionslebensdauer nahelegen würde. Die Evidenz ist jedoch weniger klar, wenn wir die Ergebnisse zur AFB mit anderen Merkmalen der weiblichen reproduktiven Lebensgeschichte wie dem Alter bei der Menarche (AAM) und dem Alter bei der Menopause (AMP) vergleichen. Tatsächlich schätzen wir, dass die genetische Korrelation mit rLRS für AAM positiv ist ( r ^ g , rLRS = 0,133 ± 0,032 ( P < 10 – 4,4 ) ) und für AMP negativ ist ( r ^ g , rLRS = – 0,168 ± 0,045 ( P < 10 − 3.7 ) ). Das genetische Ergebnis für AMP ist besonders unerwartet, da es sowohl mit unserem phänotypischen Ergebnis (obwohl die phänotypische Korrelation sehr klein ist, 0,02) als auch mit einem früheren Ergebnis einer Stammbaumstudie (17) nicht übereinstimmt. Weiterhin schätzen wir, dass die genetische Korrelation zwischen AAM und AFB stark positiv ist, trotz der Tatsache, dass die Vorzeichen der r ^ g , rLRS-Schätzungen für die beiden Merkmale entgegengesetzt sind. Wir erwarten intuitiv eine positive Beziehung zwischen AAM und AFB, weil letzteres ersteres erfordert. Die positive genetische Korrelation zwischen rLRS und AAM ist jedoch weniger erklärbar.

Eine Schätzung des genetischen Nachweises einer nichtlinearen Selektion wurde wegen fehlender statistischer Aussagekraft nicht durchgeführt. Die Theorie sagt voraus, dass die additive genetische Varianz für einen quadratischen Phänotyp wahrscheinlich sehr klein ist und, falls vorhanden, mit der genetischen Kontrolle der phänotypischen Variabilität verwechselt wird. Darüber hinaus sind die empirischen Schätzungen der Heritabilität für quadrierte Phänotypen klein (SI-Anhang, Abb. S19). Trotz des Mangels an Aussagekraft zeigte ein polygener Prädiktor für die Körpergröße, der aus einer Metaanalyse des gemeinsamen Datensatzes Genetic Investigation of Anthropometric Traits (GIANT)-UKB erstellt wurde, einen geringfügig signifikanten negativen quadratischen Regressionskoeffizienten bei Frauen (siehe SI-Anhang für Details).


Diskussion

Eine der grundlegenden Fragen bei der Anpassung ist, ob der Anpassungsprozess von vielen Loci mit kleiner Wirkung oder wenigen Loci mit großer Wirkung gesteuert wird (Orr, 2005). Doch welche Effekte sind klein und welche groß? de Vladar und Barton (2014) haben eine Skala für die Größe der Effekte bereitgestellt, die eine Funktion grundlegender genetischer Parameter der Population, nämlich der Mutationswahrscheinlichkeit, ist μ und Auswahlkoeffizient S, relativ zu dem ein Effekt als groß oder klein definiert wird. Für eine gegebene Effektverteilung, hier angenommen als Gammaverteilung mit Mittelwert und Formparameter k, ein Effekt ist klein (groß), wenn er unter (oben) liegt. Aber für feste und hängt es vom Formparameter ab, ob die meisten oder einige wenige Effekte klein sind k: für kleine k, die meisten Effekte sind klein, aber für große k, die Anzahl der kleinen Effekte hängt vom Verhältnis ab .

Genetische Varianz im stationären Zustand

Hier haben wir analytische Ausdrücke für die stationäre genetische Varianz bereitgestellt, wenn die Effekte ortsabhängig sind. Wir finden, dass, wenn die meisten Effekte klein sind, eine nichtmonotone Funktion des Formparameters der Gammaverteilung ist (durch ein Maximum für Zwischenwerte von k siehe Abbildung 1). Im Gegensatz dazu steigt sie monoton an, wenn die meisten Effekte groß sind. Wie Abbildung 1 zeigt, tragen bei einer engen Formverteilung große (kleine) Effekte am meisten zur Varianz bei, wenn . Bei breiten Verteilungen tragen jedoch kleine Effekte nicht viel bei, obwohl die Zahl der kleinen Effekte groß ist. Die HoC-Varianz wird unabhängig von k wenn, weil alle Loci große Wirkung in dieser Grenze haben. Wie bereits erwähnt (de Vladar und Barton, 2014), bietet HoC eine Obergrenze für die genetische Varianz.

Dynamik, wenn die meisten Effekte klein sind

Da die Verteilung quantitativer Trait-Loci in experimentellen und natürlichen Populationen (Hayes und Goddard, 2001 Mackay, 2004 Visscher, 2008 Goddard und Hayes, 2009) die meisten Effekte als gering erachtet, ist es wichtig, diese Situation im Detail zu untersuchen. Hier haben wir analytische Ausdrücke für die Dynamik erhalten, indem wir die genetische Varianz als konstant angenommen haben. Obwohl die Tatsache, dass sich die Varianz mit der Zeit nicht wesentlich ändert, wenn die meisten Effekte klein sind, in de Vladar und Barton (2014) numerisch beobachtet wurde, wurde eine Erklärung für dieses Verhalten nicht gegeben. Hier, wie in Anhang A erläutert, ist es eine gute Näherung, die Varianz als zeitunabhängig anzunehmen, vorausgesetzt, das Produkt aus den Anfangswerten der mittleren Abweichung und der Schiefe ist klein.

In Abwesenheit von Mutationen haben Chevin und Hospital (2008) den Effekt des Hintergrunds mit einer zeitunabhängigen genetischen Varianz auf die Frequenz an einem einzelnen fokalen Locus betrachtet. Ihre Ergebnisse stimmen insbesondere mit denen, die hier mit dem Kurzzeitdynamikmodell mit nur Richtungsselektion erhalten wurden, überein, (11) und (12) stimmen mit den Ergebnissen (21) und (25) von Chevin bzw. Hospital (2008) über die Identifizierung von ihre Parameter und ein mit und γ aus dieser Studie.

Unser grundlegendes Ergebnis bezüglich der Dynamik des phänotypischen Mittelwerts ist, dass er sich über eine Zeitskala entspannt, die umgekehrt proportional zur anfänglichen Varianz ist. Weil die Varianz von Ordnung ist l, haben wir also das wichtige Ergebnis, dass sich der Mittelwert schneller dem Optimum nähert, wenn eine größere Anzahl von Loci beteiligt ist. Außerdem hängt diese Zeit nicht monoton vom Formparameter der Gammaverteilung ab. Beachten Sie, dass die phänotypische Mittelwertabweichung auf Null zurückgeht, wenn das phänotypische Optimum weit unter der oberen Grenze des phänotypischen Mittelwerts liegt. Wenn jedoch das phänotypische Optimum den maximalen typischen Wert des Mittelwerts überschreitet, so dass die mittlere Abweichung zu späten Zeitpunkten wesentlich von Null verschieden bleibt, zeigt (10b), dass alle höheren Kumulationen am Ende der Richtungsauswahlphase verschwinden.

Dynamik, wenn die meisten Effekte groß sind

Wenn die anfängliche mittlere Abweichung mäßig groß (und negativ) ist, ändert sich die genetische Varianz um einen großen Betrag über die Zeitskala Richtungsselektion, und die Dynamik kann durch Betrachten einiger weniger Loci verstanden werden, deren Effekt groß ist, aber die anfängliche Häufigkeit ist gering.

Bei größeren Mittelwertabweichungen (aber kleiner als ) erfassen jedoch einige Loci mit großem Effekt die Dynamik des Mittelwerts und der Varianz nicht vollständig. Wie Abbildung S1 in den Hintergrundinformationen zeigt, können der anfängliche Anstieg der absoluten Mittelwertabweichung und der vorübergehende Anstieg der Varianz durch Berücksichtigung des Großeffekt-Lokus erklärt werden. Zu späteren Zeiten jedoch, da die Varianzänderung gering ist, können wir die Konstant-Varianz-Approximation verwenden, um die Dynamik der phänotypischen mittleren Abweichung zu verstehen, bis sie fast verschwindet. Die Approximation mit konstanter Varianz kann auch verwendet werden, wenn die anfängliche mittlere Abweichung ausreichend klein ist (siehe Abbildung S2).

Anwendungen

Die hier vorgestellten Näherungen gelten für die kurzfristige Entwicklung phänotypischer Merkmale und Allelfrequenzen. Dies bedeutet, dass unsere Ergebnisse verwendet werden können, um die polygene Selektion zu verstehen, die eine schnelle Anpassung vorantreibt. In dieser Hinsicht ist unser wichtigstes Ergebnis, dass der Mittelwert eines phänotypischen Merkmals schneller auf eine plötzliche Umweltänderung reagieren kann, wenn die Anzahl der Loci groß und die meisten Effekte klein sind.

Beweise für eine schnelle phänotypische Evolution wurden in den letzten Jahren von mehreren Organismengruppen berichtet. Zum Beispiel in Drosophila subobscura, flügelgroße Breitengrade innerhalb von 20 Jahren seit der Besiedlung Amerikas durch diese Art gebildet wurden (Huey et al., 2000). Auch bei Feldversuchen, bei denen auf kleinen Inseln der Bahamas Echsenpopulationen neu angesiedelt wurden, passten sich die Hinterbeine sehr schnell an die unterschiedlichen Vegetationen auf den Inseln an (Kolbe et al., 2012). In diesen Fällen liegen unseres Wissens jedoch noch keine Daten von GWAS vor.

Die hier vorgestellte Theorie lässt sich auch auf die großen Mengen an GWAS-Daten anwenden, die an Modellarten wie Menschen und Drosophila. Um die beobachteten Allelfrequenzverschiebungen in Einzelnukleotidpolymorphismen zu analysieren, die mit quantitativen Merkmalen wie der menschlichen Körpergröße (Turchin et al. 2012) und Kältetoleranz in Drosophila (Huang et al. 2012) liefern die in dieser Studie abgeleiteten Ergebnisse eine allgemeinere theoretische Grundlage als die dynamischen Gleichungen, die in früheren Analysen verwendet wurden (z.B., Turchin et al. 2012).

Offene Fragen

Die analytischen Berechnungen in diesem Artikel funktionieren, wenn der phänotypische Mittelwert im Gleichgewicht genau mit dem Optimum übereinstimmt. Im stationären Zustand gibt es jedoch eine kleine, aber von null verschiedene mittlere Abweichung, aufgrund derer die Langzeitdynamik nicht genau erfasst wird, insbesondere wenn die Effekte klein sind, wie in Abbildung 3B gezeigt. Eine verbesserte Berechnung der Dynamik, die eine mittlere Abweichung ungleich null berücksichtigt, ist sicherlich von Interesse, um beispielsweise die Häufigkeit selektiver Fixationen (die zu selektiven Sweeps führen) in diesem Modell abzuschätzen (Chevin and Hospital 2008 Pavlidis et al. 2012 Wollstein und Stephan 2014).

Eine weitere offene Frage betrifft die Allgemeingültigkeit unserer hier vorgestellten Ergebnisse. Das aktuelle Modell vereinfacht vielleicht die biologische Realität insofern zu stark, als es genetische Drift vernachlässigt und additive Effekte, symmetrische Mutationen und freie Rekombination zwischen Loci annimmt. Es kann gezeigt werden, dass das aktuelle Modell (Vernachlässigung der Mutation) aus dem klassischen symmetrischen Lebensfähigkeitsmodell mit willkürlicher Position des Optimums unter der Annahme des Quasi-Kopplungsgleichgewichts abgeleitet werden kann. Im letzteren Modell wurde die Wahrscheinlichkeit einer selektiven Fixierung numerisch für bis zu acht Loci (Pavlidis et al. 2012 Wollstein und Stephan 2014). Derzeit fehlt uns jedoch ein analytisches Verständnis der Rolle der Rekombination in diesem Modell und wie sie mit der hohen Rekombinationsgrenze unseres aktuellen Modells zusammenhängt.


Diskussion

In diesem Artikel haben wir Gleichungen für ein sehr allgemeines Evolutionsmodell für kontinuierliche Merkmale sowie deren Implementierung vorgestellt. Dies eröffnet neue Möglichkeiten, makroevolutionäre Landschaften aus phylogenetischen Vergleichsdaten abzuschätzen. Im Folgenden diskutieren wir die Stärken und Schwächen dieses Modells. Wir stellen fest, dass (Blomberg, 2017) kürzlich eine Familie von im Wesentlichen ähnlichen Modellen für die kontinuierliche Merkmalsentwicklung eingeführt hat, aber noch kein Rahmen existiert, um Parameter dieser Modelle aus phylogenetischen Vergleichsdaten abzuleiten.

Neue Wege zur Untersuchung der phänotypischen Evolution anhand von Vergleichsdaten

Die Flexibilität des von uns vorgeschlagenen neuen Modells ist seine größte Stärke. FPK und seine begrenzte Version BBMV bieten die Möglichkeit, eine Vielzahl von makroevolutionären Landschaften aus phylogenetischen Vergleichsdaten abzuschätzen. FPK kann tatsächlich evolutionäre Prozesse wie Richtungsselektion oder diversifizierende Selektion modellieren, die zu makroevolutionären Landschaften mit mehreren Gipfeln und schließlich unterschiedlichen Höhen führen. BBMV berücksichtigt Grenzen der phänotypischen Evolution und kann als solche Szenarien wie die direktionale Selektion auf einen extremen Merkmalswert oder sogar eine disruptive Selektion modellieren. All diese Szenarien liegen im Kern der modernen (Makro-)Evolutionstheorie, konnten aber noch nicht aus phylogenetischen Vergleichsdaten abgeleitet werden (O’Meara, 2012). Die Anpassung des FPK-Modells an empirische Daten ähnelt in einigen Aspekten der kubischen Spline-Analyse in Selektionsstudien (Schlüter, 1988): Es ermöglicht den Rückschluss (und die Visualisierung) der makroevolutionären Landschaft, die von Arten in einer Klade erfahren wurde. Wie bereits erwähnt, wird dieses Modell besonders in Situationen nützlich sein, in denen man starke a priori Erwartungen, dass alle Mitglieder einer Klade im Laufe ihrer Geschichte dieselbe makroevolutionäre Landschaft erlebt haben.

Eine Art von Landschaften, die mit FPK abgeleitet werden können, verdienen hier besondere Erwähnung: makroevolutionäre Landschaften, in denen mehrere Gipfel existieren. Dieses Szenario wäre besonders interessant im Vergleich zu einer Situation, in der diese mehreren Peaks für verschiedene Abstammungslinien verfügbar sind, was in OU-Modellen mit mehreren Optima implementiert wird. In dieser letzteren Klasse von Modellen unterliegt jede Abstammungslinie tatsächlich einer Anziehungskraft auf jeweils einen einzelnen Peak, aber die Abstammungslinien können sich zwischen verschiedenen Peaks verschieben. Diese Verschiebungen sind entweder bestimmt a priori (Butler und King, 2004 Beaulieu et al., 2012) oder direkt aus phylogenetischen Mustern der Merkmalsentwicklung abgeleitet (Ingram und Mahler, 2013 Uyeda und Harmon, 2014 Khabbazian et al., 2016). Im Gegensatz dazu wird bei FPK mit mehreren Gipfeln jede Abstammungslinie immer von den verschiedenen Gipfeln in ihrer makroevolutionären Landschaft beeinflusst, und Übergänge zwischen den Gipfeln könnten häufig sein, wenn sich die Merkmale der meisten Arten in der Klade in einem Tal der makroevolutionären Landschaft befinden. More theoretically, these alternatives would represent two very different evolutionary scenarios: OU models with several optima might be better at describing situations in which a lineage shifts to another adaptive zone ( Simpson, 1944 Landis and Schraiber, 2017), while FPK with multiple peaks might represent more genuine diversifying selection towards alternative phenotypic optima. In the later scenario, no change in the environment a lineage experiences or in other aspects of its phenotype ( Simpson, 1944) are required for one lineage to shift between two phenotypic optima, and one might expect much more frequent transitions between adaptive peaks within a clade. The implementation of the FPK that we have introduced opens the way to discriminate between these two alternatives using empirical data, although the level of statistical power required to do so remains an open question.

Statistical Behavior of the FPK Model

FPK is a model that generally retains very little phylogenetic signal (hereafter, PS): over all simulations in which stationarity had been reached, the median value of the |$lambda$| index of PS ( Pagel, 1997) was 1.6e |$-$| 109 (see Supplementary Appendix VI available on Dryad). This absence of PS stems from the strong deterministic component of the FPK model in all scenarios that we simulated, a result already known for the OU model ( Münkemüller et al., 2015), which is a special case of FPK. As a result, when stationarity is reached most of the information needed to infer the shape of the macroevolutionary landscape ultimately comes from the distribution of the trait for extant species. For example, evolutionary trends can be recovered in the absence of fossil data from a highly skewed trait distribution for contemporaneous species. In the same vein, the simultaneous presence of two peaks in the macroevolutionary landscape can be inferred from a bimodal trait distribution. However, FPK can also produce trait distributions with higher levels of PS. First, high PS can be obtained when the deterministic component of FPK is small or even absent: this is the case for the BM model, also a special case of FPK. Second, intermediate levels of PS can be obtained even under an FPK model with a strong deterministic component when stationarity is not reached. FPK should thus not be seen as a nonphylogenetic model: in the extreme case where stationarity has been reached PS will be null and the process will actually behave as if it were nonphylogenetic, but many intermediate cases exist in which the deterministic component of FPK influences trait evolution but PS is still significant (Supplementary Appendix VI available on Dryad). As already argued for the OU model ( Hansen et al., 2008), fitting the FPK model is actually the best way to figure out what level of PS is present in the data and what is the relative importance of deterministic forces compared to random diffusion.

The characteristic time of the FPK process, |$T_c$|⁠ , represents the typical time needed to reach stationarity and should always be compared to the total depth of the phylogenetic tree for the clade under study, |$T_< m>$| to get an idea of the level of PS in the data. Unsurprisingly, model performance will increase with |$T_< m>/T_c$| and in the extreme case where |$T_< m>$| |$ll$| |$T_c$|⁠ , traits will not have explored much of the macroevolutionary landscape. |$T_c$| bears much similarity with the phylogenetic half-life of the OU process, which describes the time necessary for the trait value to move halfway from its initial position to the optimum. Supplementary Appendix I available on Dryad shows that the characteristic time of an OU process is actually directly proportional to its phylogenetic half-life: |$T_c=1/alpha$| while the phylogenetic half-life is |$ln(2)/alpha$|⁠ . In agreement with our findings, previous studies have shown that accuracy in parameter estimation of the OU model increases with decreasing phylogenetic half-lives ( Ho and Ané, 2014b Uyeda and Harmon, 2014).

Using simulations, we have demonstrated that FPK can be distinguished from other classic models of trait evolution, and also that distinct shapes of the macroevolutionary landscape can be distinguished from each other based on their likelihoods. This means that alternative versions of the FPK model can be used for testing evolutionary hypotheses about trait evolution. Our simulations also show that the danger of overfitting is quite low with FPK since simpler models will often be preferred when stationarity has not been reached. Our focus on AIC to discriminate between alternative models was motivated by the fact that it is the most commonly used in the macroevolutionary community. However, AIC might be prone to overfitting in parameter rich macroevolutionary models and other measures that penalize more for extra parameters, like the Bayesian Information Criterion or its modified version ( Zhang and Siegmund, 2007), might be preferable ( Ho and Ané, 2014b). Another solution to diagnose overfitting would be to use parametric bootstrapping techniques ( Boettiger et al., 2012), which is readily implementable for FPK since we provide an R function to simulate the model.

Our results also show that estimation accuracy under FPK drastically differs between parameters. Estimation of the shape of the macroevolutionary landscape is generally accurate when |$T_< m>$| > |$T_c$| and increases with |$T_< m>$| / |$T_c$|⁠ . Estimation accuracy also increases with tree size: our results suggest that trees with 50 tips lead to reasonable estimation of the general shape of the macroevolutionary landscape (Supplementary Appendix IV available on Dryad), while trees with 100 tips should most often be large enough to obtain very reliable estimates ( Figs. 3 and 4). Importantly the three coefficients that determine the shape of the macroevolutionary landscape should not be analyzed separately since numerous different combinations of ein, B, und C can give similar shapes. Rather, we recommend to interpret the general shape of the macroevolutionary landscape by focusing on a few important features: (i) whether the macroevolutionary landscape is flat or not, (ii) whether it features a single trend towards one of the bounds of the trait interval, (iii) whether it contains one or several peaks, and if relevant (iv) where are these peaks located in the trait interval. In contrast, the evolutionary rate |$sigma^2$| has high estimation variance when |$T_< m>$| > |$T_c$|⁠ , and is accurate when |$T_< m>$| |$T_c$|⁠ . This same effect had already been observed for BBM ( Boucher and Démery, 2016) and probably reflects the fact that when the macroevolutionary landscape has been fully explored by the clade its shape and extent are easily estimated but the speed at which the landscape is travelled is not. Given this limitation, the estimate of |$sigma^2$| is difficult to interpret when fitting FPK to an empirical data set. Rather, the characteristic time of the process, |$T_c$|⁠ , should be the quantity that is interpreted in comparison with tree depth. Finally, we found that the estimation of the trait value at the root of the tree, |$x_0$|⁠ , is poor as soon as the macroevolutionary landscape has been moderately explored, a result that generalizes the one already obtained for BBM ( Boucher and Démery, 2016). This stems from the fact that FPK is a model that retains low PS since it includes strong deterministic forces and wipes out any hope of confidently inferring ancestral trait values in empirical data sets.

These differences in the quality of the estimation of the shape of the macroevolutionary landscape versus |$sigma^2$| generalize results that have been obtained for the OU model. Indeed, in this model |$sigma^2$| and especially |$alpha$|⁠ , the attraction strength, are difficult to estimate ( Butler and King, 2004 Ho and Ané, 2014b) while it seems that the stationary variance of the OU process, |$sigma^2/2alpha$|⁠ , and the trait optimum, |$mu$|⁠ , generally have higher estimation accuracy ( Ho and Ané, 2014b Münkemüller et al., 2015). This is in agreement with our results since |$mu$| and |$sigma^2/2alpha$| respectively determine the mean and variance of the stationary distribution of the OU process, what we have called the macroevolutionary landscape in this article.

Interpretation of Macroevolutionary Landscapes Inferred from FPK

We have introduced FPK as a method for the inference of macroevolutionary landscapes from phylogenetic comparative data. The adaptive landscape is a fruitful metaphor to understand phenotypic evolution on a variety of evolutionary scales ( Wright, 1932 Simpson, 1944 Arnold et al., 2001) but care must be taken when interpreting inferences made from phylogenetic comparative data in the light of adaptive landscape theory, which was mainly developed for population genetics ( Hansen and Martins, 1996 Uyeda and Harmon, 2014). Some of the models of trait evolution on phylogenies include deterministic forces that influence trait evolution in an attempt to mimic selection: the OU model includes a term that was designed to resemble stabilizing selection towards a given trait value ( Hansen, 1997), and FPK can imitate a large variety of selection shapes. However, all macroevolutionary models for trait evolution, including OU and FPK, are phenomenological by nature since they rely on probabilistic diffusion equations and model evolution over long time-scales (typically thousands to million years) that are not amenable to direct observation. In other words, these models recover patterns from the data, which researchers have to interpret in terms of evolutionary processes. One example of such a confusion between long-term patterns and short-term processes has been highlighted when interpreting the good fit of an OU model to empirical data sets: several studies have indeed shown that neutral evolution between bounds produces patterns closely resembling the ones obtained under an OU process ( Revell et al., 2008 Boucher et al., 2014). Development of the BBM model has now rendered possible to distinguish between these two scenarios ( Boucher and Démery, 2016), but many such cases in which two different microevolutionary processes produce the same macroevolutionary pattern remain.

Macroevolutionary landscapes estimated using FPK should thus be interpreted with extreme caution: they reflect the general shape of deterministic forces that have been acting on the evolution of a continuous trait in a clade, but are agnostic regarding the nature of these deterministic forces, that is they are not actual measurements of the relation between individuals’ traits and fitness. The most obvious limitation of FPK is that it makes the hypothesis that the macroevolutionary landscape is constant through time. This is likely to be wrong in a majority of cases since environmental change or interactions with other species will lead to changes in the intensity and shape of the selection gradient acting on one trait in a given clade ( Simpson, 1944 Hansen, 2012). Macroevolutionary landscapes inferred using FPK will thus necessarily reflect some kind of average macroevolutionary landscape experienced by the clade throughout its evolutionary history.

Even though it is difficult to connect microevolutionary processes to macroevolutionary patterns, there is one promising way in which FPK could be used to do so. Indeed, the Bayesian implementation of the model enables the use of informative priors based on quantitative genetic parameters. ( Uyeda and Harmon, 2014) have demonstrated how this could be done for the OU model: using the quantitative genetic model of ( Lande, 1976), they showed how measurements of heritability, phenotypic variance, and effective population size can inform priors on the parameters of the OU model. By connecting the parameters in Eq. 1 to quantitative genetic models, the same procedure could be carried out for FPK.

Finally, FPK need not be restricted to infer macroevolutionary landscapes. This model indeed has its roots in spatial diffusion theory and as such could be used in phylogeographic studies to model the dispersal of a set of individuals or populations for which the phylogeny is known (e.g., Grollemund et al., 2015). This field of research has indeed seen huge methodological advances in recent years ( Lemey et al., 2010 Bloomquist et al., 2012). In this context, FPK could be used to infer preferred directions of dispersal (i.e., directional trends) or even to infer particular regions that act as geographic attractors for the taxon under study (i.e., one or several peaks). Hard bounds on the distribution of organisms (e.g., oceans for terrestrial organisms) could even be taken into account explicitly using the BBMV model.

Limitations of the FPK Model

Our implementation of FPK does not come without limitations. The main technical limitation is that our implementation of the model is restricted to single traits. We are fully aware that extending it to multivariate data sets would be very convenient, since multiple traits are expected to often evolve in a correlated fashion ( Arnold, 1992). However, this is for the moment hampered by computational time. Indeed, the most time-consuming part in the calculation of the likelihood is to invert the instantaneous transition matrix, m. If we were to study two traits simultaneously, we would need to discretize the plane that they define into a regular grid of points, and computing time would not be multiplied by two but rather raised to the power two. The only possible solution that we can envision would be to use algorithmic tricks that avoid inverting the entire transition matrix, but rather a matrix describing transitions between a given point on the grid and its immediate neighbors, as recently proposed for inference of ancestral areas ( Landis et al., 2013). This would require much development and is out of the scope of this article.

The fact that our implementation of FPK can only accommodate a maximum of two peaks in the macroevolutionary landscape might also seem frustrating for some users. Extending the model so that three peaks or more can be simultaneously present is rather straightforward: the most obvious solution would be to use polynomial functions with more terms for |$V(x)$|⁠ . However, this would increase computational time, and more importantly would probably yield likelihood functions that are extremely difficult to optimize. This is why we have not implemented it yet. We however note that in our code to infer the FPK model, we have left open the possibility to specify a given shape for |$V(x)$|⁠ : users can thus experiment with more complex macroevolutionary landscapes if they feel this is relevant to their specific study system.

As already discussed above, the fact that the macroevolutionary landscape is constant across time and across different clades in the phylogeny is another limitation. Further developments of the FPK model could aim at extending it to cases in which the macroevolutionary landscape differs among clades or among specified time periods across the phylogeny.

The last limitation of FPK perhaps lies in its very formulation. FPK is indeed based on a constant-rate diffusion model and as such cannot model accelerating or decelerating trait evolution ( Harmon et al., 2010) or sudden jumps in the value of the trait, as would be expected under quantum evolution ( Simpson, 1944 Kirkpatrick, 1982) or punctuated equilibrium ( Gould and Eldredge, 1977).


Examples of Disruptive Selection

Finches on Santa Cruz Island

Darwin’s finches, or Galapagos finches, are a group of finches that inhabit the long chain of islands known as the Galapagos, famously visited by Charles Darwin. The birds have been rigorously studied, and various patterns of evolution have been seen in different populations on different islands. On Santa Cruz Island, disruptive selection was seen causing speciation in the population of finches that resides there. Due to forces of disruptive selection, intermediate beak sizes have been selected against for generations. The resulting population has almost no medium sized beaks. Beak size is important for more than just gathering food, and it has been found that beak size also changes the mating calls of the various finches. Researchers have found that the populations of birds, once a single population, have genetically diverged and are on the tipping point of being considered separate species.

Disruptive Selection in Plants

Famous biologist John Maynard Smith proposed disruptive selection as a method for plant speciation in the late 1960s. The idea is simple and have been applied to many examples since. Many plant traits, such as the color of pea pods, are controlled by individual genes. In a scenario where disruptive selection is affecting a population of plants, the most intermediate individuals are often the heterozygous individual, or those that contain different types of alleles for a gene. Homozygous individuals, on the other hand, have two of the same alleles for a trait. Whether the allele is functional or not, two of the same will produce a phenotype on the extreme end of the spectrum. These individuals will be protected during the disruptive selection, and reproduce more. Over time, the organisms may differ so much that they become reproductively isolated. Often the intermediates were serving the function of transferring genes between the two populations. Without them, in the presence of disruptive selection, speciation can occur.


The Quantitative Genetic Consequences of Pleiotropy under Stabilizing and Directional Selection

The independence of two phenotypic characters affected by both pleiotropic and nonpleiotropic mutations is investigated using a generalization of M. Slatkin's stepwise mutation model of 1987. The model is used to determine whether predictions of either the multivariate normal model introduced in 1980 by R. Lande or the house-of-cards model introduced in 1985 by M. Turelli can be regarded as typical of models that are intermediate between them. We found that, under stabilizing selection, the variance of one character at equilibrium may depend on the strength of stabilizing selection on the other character (as in the house-of-cards model) or not (as in the multivariate normal model) depending on the types of mutations that can occur. Similarly, under directional selection, the genetic covariance between two characters may increase substantially (as in the house-of-cards model) or not (as in the multivariate normal model) depending on the kinds of mutations that are assumed to occur. Hence, even for the simple model we consider, neither the house-of-cards nor the multivariate normal model can be used to make predictions, making it unlikely that either could be used to draw general conclusions about more complex and realistic models.


Danksagung

We thank Amy Zanne, Guillermo Orti, Kelly Zamudio, Rayna Bell, and Josef Uyeda for insightful comments on earlier versions. Amy Zanne, Josef Uyeda, and Josh Storch assisted the phylogenetic comparative analyses. The editor-in-chief Chris Foote and two anonymous reviewers provided suggestions that strengthened the manuscript. We thank many talented photographers that contributed with pictures: Huia cavitympanum photo Alexander Haas Epipedobates tricolor Santiago R. Ron, FaunaWebEcuador, license CC (BY-NC 3.0) Dendropsophus elegans photo JFRT and Rana blairi photo Richard Sage. This study was funded in part by the Fundação Universidade Federal de Mato Grosso do Sul—UFMS/MEC—Brazil. This study was funded in part by the Coordenação de Aperfeiçoamento de Pessoal e de Nível Superior- Brasil (CAPES)—finance code 001.


Schau das Video: Limes (Juni 2022).


Bemerkungen:

  1. Mern

    Ich glaube, Sie haben sich geirrt. Schreiben Sie mir in PM, es spricht mit Ihnen.



Eine Nachricht schreiben