Information

Warum ist DNA-Shuffling effizienter als Punktmutation?

Warum ist DNA-Shuffling effizienter als Punktmutation?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

In einem verwandten Beitrag zu Biologie-SE wurde der folgende aufschlussreiche Kommentar abgegeben:

Der Vorteil des DNA-Shufflings gegenüber der Einführung einzelner Mutationen besteht darin, dass weniger Mutanten gescreent werden müssen und die Aktivität/Stabilität des Proteins um das Hundertfache verbessert werden könnte.

Gibt es ein mathematisches Argument, warum das DNA-Shuffling effizienter sein sollte als die Einführung von Punktmutationen?

Selbst wenn jeder DNA-Shuffling-/Punktmutationsschritt gleich "teuer" ist (und in Wirklichkeit scheint das DNA-Shuffling viel arbeitsintensiver zu sein), erzeugen beide eine Variante pro Schritt, oder? Warum ist die Variante also in einem Fall krass besser als die andere?

Verwandter Beitrag: Gerichtete Evolution: Punktmutation vs. Insertion-Deletion vs. Shuffling


Sie sollten dieses Papier lesen. Hier ist das Wesentliche, was Sie interessiert:

Da die meisten Punktmutationen schädlich oder neutral sind, muss die zufällige Punktmutationsrate niedrig sein und die Anhäufung von nützlichen Mutationen und die Entwicklung einer gewünschten Funktion ist in solchen Experimenten relativ langsam. Zum Beispiel erforderte die Entwicklung einer Fucosidase aus einer Galactosidase fünf Shuffling- und Screening-Runden, bevor eine >10-fache Verbesserung der Aktivität festgestellt wurde4. Natürlich vorkommende homologe Sequenzen sind für "funktionelle Vielfalt" vorangereichert, weil schädliche Varianten gegen über Milliarden von Jahren Evolution selektiert wurden…

Obwohl das Mischen eines einzelnen Gens eine Genbibliothek erzeugt, die sich nur durch wenige Punktmutationen unterscheidet1, 2, 3, 4, 5, 6, erzeugt der Blockaustauschcharakter des Familien-Shufflings Chimären, die sich in vielen Positionen unterscheiden. In früheren Arbeiten wurde beispielsweise ein einzelnes Beta-Lactamase-Gen drei Zyklen lang gemischt, was nur vier Aminosäuremutationen ergab3, während ein einziger Zyklus des Familien-Shufflings der vier Cephalosporinasen zu einem mutierten Enzym führte, das sich um 102 Aminosäuren von der Citrobacter-Enzym, 142 Aminosäuren vom Enterobacter-Enzym, 181 Aminosäuren vom Klebsiella-Enzym und 196 Aminosäuren vom Yersinia-Enzym. Die erhöhte Sequenzdiversität der durch Familien-Shuffling erhaltenen Bibliotheksmitglieder führt zu einem „sparse Sampling“ eines viel größeren Teils des Sequenzraums15, der theoretischen Sammlung aller möglichen Sequenzen gleicher Länge, geordnet nach Ähnlichkeit (Abb. 4). Die Auswahl aus „sparse Bibliotheken“ ermöglicht die schnelle Identifizierung der vielversprechendsten Bereiche innerhalb einer erweiterten Sequenzlandschaft (ein multidimensionaler Graph von Sequenzraum versus Funktion)


DNA-Shuffling wäre effizienter, wenn Sie bereits ein großes Repertoire an Varianten haben (die viele Punktunterschiede aufweisen; siehe Cohen, 2001). Wenn dies nicht der Fall ist, wäre es besser, Punktmutationen mit fehleranfälliger PCR einzuführen.

Ein detaillierter mathematischer Rahmen zum Vergleich dieser beiden Methoden ist nicht verfügbar. Es gibt jedoch viele Mutationsmodelle und es gibt auch mindestens ein Modell für das DNA-Shuffling (Sun F., 1999).

Grundsätzlich hängt die Anzahl der Mutanten für ein Punktmutationsexperiment von der Fehlerrate der Polymerase ab. In einem DNA-Shuffling-Experiment erstellen Sie nur eine zufällige Kombination aus vorhandenen Varianten. Welcher effizienter ist, hängt also von diesen (und vielen weiteren) Parametern ab. Darüber hinaus hängt die "Effizienz" auch davon ab, welches Experiment Sie versuchen.


Vorausschauende Evolution und DNA-Shuffling

DNA-Shuffling hat sich als leistungsfähige Technik für die gerichtete Evolution von Proteinen erwiesen. Eine Mischung aus theoretischer und angewandter Forschung hat nun Erkenntnisse darüber geliefert, wie die Rekombination gesteuert werden kann, um Proteine ​​und sogar Organismen mit veränderten Funktionen effizienter zu erzeugen.

Proteine ​​sind Maschinen, die von der Evolution geschaffen wurden, aber es ist unklar, wie genau die Evolution ihre Sequenz, Struktur und Funktion gesteuert hat. Es ist zweifellos richtig, dass einzelne Mutationen in einem Protein sowohl seine Struktur als auch seine Funktion beeinflussen und dass solche Mutationen während der Evolutionsgeschichte behoben werden können, aber es ist auch wahr, dass es andere Elemente der Proteinsequenz gibt, auf die die Evolution eingewirkt hat. Beispielsweise scheint der genetische Code so angelegt zu sein, dass Mutationen und Übersetzungsfehler die Proteinstruktur und -funktion nur minimal schädigen [1]. Könnte die Wahrscheinlichkeit, dass eine nützliche Mutation in der Population gefunden und fixiert wird, auch im Laufe der Evolution manipuliert worden sein, so dass die Proteine, die wir heute sehen, sich besser verändern können als die Proteine, die nach der "Erfindung" möglicherweise zusammengeschustert wurden der Übersetzung? Haben sich Proteine ​​tatsächlich entwickelt, um sich zu entwickeln? Es gibt bereits einige Hinweise darauf, dass Bakterien in der Lage sind, Phänotypen zu entwickeln, die zur weiteren Anpassung fähiger sind (Übersicht in [2,3,4]). Als Ergebnis von Selektionsexperimenten entstehen beispielsweise mutatorische [5] und hyperrekombinogene [6] Stämme. Die Entwicklung des DNA-Shuffling (Übersicht in [7,8]) und das Erscheinen mehrerer neuerer Arbeiten, die diese Technik verwenden [9,10,11] bieten uns eine überraschende neue Möglichkeit, diese grundlegenden Fragen auf individueller Ebene zu stellen und zu beantworten Gene und vielleicht sogar Genome.

DNA-Shuffling, eine Methode für in vitro Rekombination, wurde als Technik zur Generierung mutierter Gene entwickelt, die Proteine ​​mit verbesserter oder einzigartiger Funktionalität kodieren [12,13]. Es besteht aus einem dreistufigen Prozess, der mit der enzymatischen Verdauung von Genen beginnt und kleinere DNA-Fragmente liefert. Die kleinen Fragmente können dann zufällig hybridisieren und werden aufgefüllt, um längere Fragmente zu erzeugen. Letztendlich werden alle rekombinierten Gene voller Länge, die neu erzeugt werden, über die Polymerase-Kettenreaktion amplifiziert. Wenn eine Reihe von Allelen oder mutierten Genen als Ausgangspunkt für das DNA-Shuffling verwendet wird, entsteht eine Bibliothek rekombinierter Gene, die in neue Proteine ​​übersetzt werden können, die wiederum auf neue Funktionen gescreent werden können. Gene mit nützlichen Mutationen können weiter gemischt werden, um sowohl diese unabhängigen, nützlichen Mutationen in einem einzigen Gen zusammenzuführen als auch alle schädlichen Mutationen zu eliminieren. Obwohl durch serielle Mutagenese und Screening möglicherweise auch mehrere nützliche Mutationen erzeugt werden könnten, ist das DNA-Shuffling viel schneller: Beispielsweise enthält die Ausgangspopulation einer durch mutagene PCR generierten Bibliothek typischerweise 70-99% nicht funktionelle Varianten [14], während die meisten durch DNA-Shuffling gebildeten Varianten sind funktionell. Somit sollte das DNA-Shuffling eine optimierte Untersuchung des Sequenzraums und die einfache Erfassung neuer Protein-Phänotypen ermöglichen, wie dies tatsächlich für eine Reihe von Protein-Targets der Fall ist [15,16].

Über biotechnologische Anwendungen hinaus kann DNA-Shuffling möglicherweise verwendet werden, um die natürliche Rekombination zu rekapitulieren und zu fragen, ob die Rekombination im Allgemeinen zu besseren oder neuen Proteinen führt. Dabei kann DNA-Shuffling nicht nur mit Genen durchgeführt werden, die eng verwandte Allele sind, sondern auch mit einer Gruppe von phylogenetisch verwandten Genen, die sich um bis zu 40% unterscheiden können, ein Vorgang, der als Family Shuffling bekannt ist [15]. Wie oben erwähnt, wurde stark vermutet, dass durch die Familienzusammenführung die vorteilhaftesten Mutationen in dasselbe Gen übertragen und so die Proteinfunktion schnell optimiert oder verändert werden könnte, indem man von einer Population von Genen ausgeht, von denen bereits bekannt ist, dass sie funktionsfähig sind. Tatsächlich sollte diese Intuition jedoch nur dann zutreffen, wenn mutierte Allele im Allgemeinen entweder additiv oder synergistisch wirken können. Wenn mutierte Allele neutral sind oder sich gegenseitig stören, gibt es keinen generischen Vorteil der Rekombination.

Um dieser Hypothese nachzugehen, hat Joern et al. [9] haben eine neue Technik zur Kartierung von Rekombinationsereignissen durch Sondenhybridisierungsanalyse entwickelt. Durch Kreuzung von Genen für mehrere Dioxygenasen wurden gemischte Bibliotheken erzeugt: Toluoldioxygenase, todC1C2-Tetrachlorbenzol-Dioxygenasen, tecA1A2 und Biphenyldioxygenase, bphA1A2. Shuffled-Varianten aus der Drei-Eltern-Bibliothek wurden auf Toluylen-Dioxygenase-Aktivität gescreent und zufällig ausgewählte Varianten wurden sequenziert, um die tatsächliche Anzahl von Crossovers zu bestimmen, die zu funktionellen und nichtfunktionellen Varianten geführt hatten. Es überrascht nicht, dass Crossovers häufig in Regionen mit hoher Homologie auftraten: Obwohl Regionen, die zehn oder mehr gemeinsame, identische Reste enthielten, weniger als 10 % der Länge der Gene ausmachten, traten über 60 % der Crossovers in diesen Regionen auf. Interessanterweise wurde festgestellt, dass die Anzahl der Crossover-Ereignisse nicht mit der Proteinfunktion korreliert, was darauf hindeutet, dass einzelne Segmente eines Proteins während der Evolution unabhängig voneinander agieren könnten [9]. Es ist auch möglich, dass die Proteine ​​so eng miteinander verwandt waren, dass mehrfache Überkreuzungen die Funktionalität nicht reduzierten oder veränderten.

Aufbauend auf diesen Ergebnissen hat Voigt et al. [10] stellten die Hypothese auf, dass funktionelle Gene, die durch DNA-Shuffling (und vielleicht durch natürliche Rekombination) abgeleitet werden, geclusterte Sätze struktureller Interaktionen (die sogenannten „Schemata“) des ursprünglichen Proteins erhalten sollten (Abbildung 1a). Um diese Hypothese zu validieren, entwickelten die Autoren einen Algorithmus, der versuchte, die Wirkung von Crossover-Ereignissen an bestimmten Stellen in einem Gen vorherzusagen. Insbesondere bewertete der Algorithmus, welche Aminosäuren sowohl in der primären als auch in der tertiären Proteinstruktur nahe beieinander lagen und sagte voraus, welche Interaktionsuntergruppen so manipuliert werden könnten, dass die Proteinstruktur und -funktion minimal gestört würde. Diese Analyse führt zu einem „Schemaprofil“ für die Proteine, das den Grad der Störung der Schemata anzeigt, die die Rekombination an jedem Punkt entlang der Sequenz verursacht (Abbildung 1b). Mehrere Proteine, die zuvor entwickelt wurden in vitro durch Familien-Shuffling wurden ausgewertet, und die Schemaprofile dieser Proteine ​​korrelierten gut mit den experimentell bestimmten Kreuzungspunkten [14].

Eine grafische Darstellung der Beziehung zwischen Proteinstruktur und Schemata. (ein) Das β-Lactamase-Protein ist in verschiedenfarbige Unterstrukturen (Schemata) unterteilt dargestellt, die sich aus dem Schemaprofil des Proteins ableiten. (B) Ein Beispiel für ein Schemaprofil für ein (einfacheres) hypothetisches Protein. Peaks korrelieren mit Positionen im Protein, wo die Rekombination maximal störend ist, Täler korrelieren mit Positionen, von denen vorhergesagt wird, dass sie die Struktur und Funktion des Proteins minimal stören. (C) Die Intronstruktur kann mit der Schemastruktur korrelieren. Soweit es nun möglich ist, Schemaprofile zu berechnen, kann angenommen werden, dass Introns (weiß) im Allgemeinen auf Minima fallen, während Exons (schwarz) im Allgemeinen größere Störungswerte aufweisen können.

Dieser Algorithmus wurde dann verwendet, um Schemaprofile zwischen zwei β-Lactamasen, TEM-1 und PSE-4, zu erzeugen, die Ampicillinresistenz verleihen und nur 40% Aminosäuresequenzidentität teilen. Hybridenzyme mit unterschiedlichen Rekombinationsgraden zwischen den Schemata wurden dann konstruiert, und die rekombinierten Varianten wurden in Bakterien transformiert, die auf Ampicillinresistenz getestet wurden. Die resistentesten Hybriden enthielten rekombinierte Gene mit Crossovers, von denen im Voraus vorhergesagt wurde, dass sie zwischen den Schemata auftreten [10].

Besonders überraschend ist nicht, dass DNA-Shuffling zwischen Domänen stattfindet, selbst eine kurze Betrachtung der dreidimensionalen Strukturen von Proteinen deutet sofort darauf hin, dass rekombinatorische Breakpoints wahrscheinlich den geringsten Einfluss auf die Proteinfunktion haben, wenn sie außerhalb der von Voigt gefundenen Hauptstruktureinheiten auftreten et al. [16] (obwohl bestimmte Bruchstellen zwischen strukturellen Untereinheiten, wie etwa in der Mitte von α-Helices, ohne Schema-Profiling wahrscheinlich nicht vorhergesagt worden wären). Das Erstaunliche ist vielmehr, dass sich Proteine ​​so entwickelt haben, dass sie im Großen und Ganzen aus strukturellen Domänen bestehen, die eine Rekombination eingehen können. Als Voigt et al. [10] weisen darauf hin, dass Gô [17,18] eine Korrelation zwischen Intronpositionen und strukturellen Domänen gefunden hat. Dies wurde von Gilbert und seinen Mitarbeitern [19] erweitert, die die Idee entwickelten, Proteine ​​könnten modular aus Strukturdomänen aufgebaut werden, um den Ursprung von Introns zu erklären. Obwohl sich die Hypothese der „frühen Introns“ seit langem als unplausibel erwiesen hat [20,21,22], ist die ursprüngliche Vorstellung, dass Introns als Puffer für die Rekombination fungieren könnten, immer noch intellektuell überzeugend und könnte mit den Ergebnissen von Voigt . übereinstimmen et al. [10].

Interessanterweise haben sich die von Joern et al. [9] und Voigt et al. [10] kann unnötig sein. „Blindes“ DNA-Shuffling zwischen eng verwandten Proteinen könnte bereits mehr als gut genug sein, um Proteine ​​mit neuartigen Phänotypen zu erzeugen. Zum Beispiel haben wir eine β-Glucuronidase entwickelt in vitro ihre Substratspezifität von β-Glucuroniden auf β-Galactoside umgestellt und eine über 500-fache Aktivitätssteigerung gegenüber dem neuen Substrat erreicht [23]. Diese katalytische Umwandlung wurde in drei Shuffling- und Screening-Runden erreicht, aber weitere Selektionsrunden führten nicht zu einer größeren Spaltung von β-Galactosiden. Die anfängliche Bibliothek dieser Selektion wurde mittels mutagener PCR konstruiert, und ein großer Teil der Population war inaktiv, doch die katalytische Spezifität der Selektion führte zu einer Verschiebung der Substratpräferenz um das 52-Millionenfache.

Ebenso neue Experimente von Zhang et al. [11] liefern zusätzliche Beweise dafür, dass blindes Mischen nicht nur auf Proteinebene, sondern sogar auf Organismusebene zu einer vollständigen Funktionsverbesserung fähig ist. Diese Forscher koppelten die klassische Stammverbesserung (Mutation und Selektion) mit genetischer Rekombination. Die Protoplastenfusion führt zu einer sehr effizienten Rekombination zwischen den Genomen von Streptomyces Spezies, und die iterative Protoplastenfusion führt zur Neuordnung mehrerer Marker zwischen den Spezies. Um die Leistungsfähigkeit dieser neuen Methode zu zeigen, a Streptomyces Stamm, der das komplexe Polyketid-Antibiotikum Tyiosin produziert, wurde auf eine verbesserte Funktion hin selektiert und wurde dann gezwungen, sich dem Äquivalent der sexuellen Fortpflanzung zu unterziehen. Die Genome mehrerer überlebender Mutanten wurden nach jeder Selektionsrunde gemischt, um eine kombinatorische Bibliothek von Organismen zu erzeugen, die erneut auf verbesserte Funktion gescreent werden konnte. Ein Stamm, der durch nur zwei Shuffling-Runden erzeugt wurde, konnte Tylosin mit einer Rate produzieren, die mit Stämmen vergleichbar war, die 20 Runden klassischer Selektion unterzogen worden waren. Diese Ergebnisse zeigen, dass das Genom-Shuffling wahrscheinlich zu ähnlich radikalen Veränderungen und Verbesserungen der Organismenfunktion führen wird, wie sie zuvor für Proteine ​​beobachtet wurden.

Insgesamt unterstützen diese Ergebnisse weiter die Idee, dass Evolution reflexiv agieren kann, also die eigene Handlungsfähigkeit verbessert. Aus den Ergebnissen von Arnold und Mitarbeitern [9,10] ist es möglich, dass Regionen, die zwischen vorhergesagte Schemata fallen, der Reihe nach konserviert werden könnten, um die Rekombination zu erleichtern, diese Hypothese könnte direkt durch Datenbankanalyse überprüft werden. Die Anwendung der von Arnold und Mitarbeitern [9,10], del Cardayré und Mitarbeitern [11] und anderen beschriebenen Techniken kann es Forschern ermöglichen, Bibliotheken für das Screening effektiver zu entwerfen. Ein großer Teil der Produkte, die bei traditionellen Screening- oder sogar Shuffling-Reaktionen erzeugt werden, ist nicht funktionsfähig. Schema-Profiling und Path-Shuffling könnten es schließlich ermöglichen, Experimente mit gerichteter Evolution zu entwerfen, bei denen strukturelle und metabolische Untereinheiten erhalten bleiben, wodurch die Erforschung des Sequenzraums weitgehend auf funktionelle Moleküle beschränkt wird. Letztendlich sollten diese Fortschritte unser Verständnis natürlicher genetischer Prozesse erweitern und es Biologen dadurch ermöglichen, in einem Bruchteil der Zeit, die die Natur oder konventionelle Züchtung in Anspruch nehmen würde, neue Proteine ​​und Wege zu generieren.


Hintergrund

Wie entstehen Gene mit neuen Funktionen? Dies bleibt eine der faszinierendsten offenen Fragen in der evolutionären Genetik. Drei Hauptmechanismen können Gene mit neuartiger Funktion erzeugen: Punktmutationen und kleine Insertionen oder Deletionen in bestehenden Genen Duplizierung ganzer Gene oder Domänen innerhalb von Genen in Kombination mit Mutationen, die eine funktionelle Divergenz der Duplikate verursachen [1–3] und Rekombination zwischen unähnlichen Genen um neue rekombinante Gene zu erzeugen (siehe zB [4, 5]). Wir nennen hier nur diese Art der Rekombination Gen-Shuffling, ausgenommen beispielsweise die Duplikation von Domänen innerhalb eines Gens. Bei einem solchen Gen-Shuffling-Ereignis können die elterlichen Gene entweder zerstört oder erhalten werden [6]. Gen-Shuffling ist eindeutig die stärkste der drei Ursachen für funktionelle Innovation, da es neue Gene mit einer Struktur erzeugen kann, die sich drastisch von der der beiden Elterngene unterscheidet. Labor-Evolutionsstudien zeigen, dass Gen-Shuffling es ermöglicht, dass neue Genfunktionen in einer Größenordnung entstehen, die um Größenordnungen höher ist als bei Punktmutationen [7, 8].

Über die Raten von Punktmutationen [9] und Genduplikationen [10, 11] ist viel bekannt. Im Gegensatz dazu ist die Geschwindigkeit, mit der Gen-Shuffling auftritt, relativ unerforscht, trotz der Bedeutung des Shufflings für funktionelle Innovation. Anekdotische Hinweise deuten zwar darauf hin, dass ein erfolgreiches Gen-Shuffling stattfindet und Gene mit neuen Funktionen erzeugt [4]. Insbesondere Proteine ​​sind oft Mosaike von Domänen, die sich durch Sequenz- und Strukturähnlichkeit auszeichnen [12–19]. Viele Domänen kommen in mehreren Proteinen mit unterschiedlichen Funktionen vor, was darauf hindeutet, dass neue Proteine ​​durch die Kombination von Domänen anderer Proteine ​​entstehen können, ein Prozess, der eine Rekombination erfordert. Darüber hinaus haben viele Studien systematisch eine Unterklasse von Genrekombinationsereignissen identifiziert – Genfusionen [20–24]. Diese Studien zählen Genfusionsereignisse in einem interessierenden Genom im Verhältnis zu mehreren, oft sehr entfernt verwandten Arten. Da fusionierte Gene oft ähnliche Funktionen haben, kann die Identifizierung von Fusionsereignissen bei der Ableitung von Genfunktionen helfen. Hier geht es um eine über die oben genannten Studien hinausgehende Frage: Wie häufig ist Gen-Shuffling im Vergleich zu anderen Kräften der Genomveränderung, wie etwa der Genduplikation? Dieses Problem ist wegen der vielen möglichen Ergebnisse von Rekombinationsereignissen schwierig. Diese Ergebnisse fallen in drei Hauptkategorien, Genfusionen, Domänendeletionen und Domäneninsertionen (Abbildung 1a). Die systematische Identifizierung dieser Ergebnisse auf genomischer Ebene ist rechenintensiv, was unsere Analysen auf eine bescheidene Anzahl von Genomen beschränkt hat (Tabelle 1).

Gen-Shuffling erkennen. (ein) Gen-Shuffling und wie es die Genstruktur verändert. Die drei Szenarien der 'Domäneninsertion' stellen Insertionen von Domänen von Gen 2 in Gen 1 dar. Die reziproken Insertionen (Gen 1 in Gen 2) sind nicht dargestellt. (B) Unterscheidung zwischen wahren und unechten Rekombinationsereignissen. Bei einem unechten Rekombinationsereignis weist das Referenzgenom R1 zwei separate Gene auf, wobei sowohl T als auch R2 ein einzelnes, gemischtes Gen aufweisen. Die sparsamste Erklärung für diese Beobachtung ist, dass das gemischte Gen in R1 vorhanden war, aber seit der Divergenz von R1 von T.

Man kann Gen-Shuffling-Ereignisse entweder aus Proteinsequenzinformationen oder aus Informationen über die Proteinstruktur identifizieren. Strukturbasierte Ansätze [12–15] haben den Vorteil, dass sie Rekombinationsereignisse erkennen können, bei denen die Sequenzähnlichkeit zwischen einem Rekombinationsprodukt und seinen Eltern bis zur Unkenntlichkeit erodiert ist. Da jedoch auch zwei sehr weit entfernt verwandte Strukturdomänen durch konvergente Evolution entstanden sein können [25, 26], kann es problematisch sein, die gemeinsame Abstammung zweier Domänen allein anhand der Struktur zu identifizieren. Als weitere Einschränkung können strukturbasierte Ansätze nur Rekombinationsereignisse identifizieren, die die Grenzen von Proteindomänen respektieren, während einige erfolgreiche Rekombinationsereignisse innerhalb von Domänen auftreten können [27–29]. Außerdem liegen nicht für alle Gene Strukturinformationen vor. Beispielsweise enthält die Pfam-Datenbank der Proteindomänen [30] keine Strukturinformationen für mehr als 40 % der Proteine ​​in knospenden Hefen (Saccharomyces cerevisiae). Strukturbasierte Ansätze können daher viele gemischte Gene übersehen. Aufgrund dieser Probleme haben wir uns für einen sequenzbasierten Ansatz entschieden, der es uns ermöglicht, nach Shuffling-Ereignissen zu suchen, ohne einschränkende Annahmen über deren Natur zu treffen. Im Wesentlichen erlegt unsere Suche dem Shuffling keine Einschränkungen auf, außer dass zwei proteinkodierende Sequenzen in einem einzigen Gen zusammengeführt werden müssen, die zuvor Teil von zwei verschiedenen Genen waren. Wir vermeiden daher die Annahme, dass Shuffling nur an Domänengrenzen oder mit bestimmten Rekombinationsmechanismen auftritt, ohne eine der beiden Möglichkeiten auszuschließen. Unsere Analyse kann auch Genduplikationsereignisse in entweder elterlichen oder rekombinierten Genen erklären.

Wir identifizieren hier Gen-Shuffling-Ereignisse, die in einer „Test“-Art T seit ihrer Abweichung von einer Referenzart R1 aufgetreten sind. Ein Gen im Testgenom, dessen Teile mit mehr als einem Gen im Referenzgenom übereinstimmen, ist ein Kandidat für ein Gen-Shuffling-Ereignis, das seit dem gemeinsamen Vorfahren der beiden Genome aufgetreten ist. Unsere Analyse verwendet auch ein drittes Genom (Referenzgenom R2), um zu verhindern, dass Genspaltung oder Genverlust im Referenzgenom R1 zu einer falschen Identifizierung von Gen-Shuffling-Ereignissen führt. Da R2 relativ zu T und R1 eine Fremdgruppe ist, können wir solche Ereignisse in R1 erkennen (siehe Abbildung 1b). Wie bei jedem vergleichenden sequenzbasierten Ansatz hängt unsere Analyse von der nachweisbaren Sequenzähnlichkeit zwischen den Genen ab. Mit anderen Worten, unsere Analyse schließt sich schnell entwickelnde Gene aus.


Methoden

Als Eingabe nehmen wir die Aminosäuresequenzen der Elternteil zu mischende Proteine, ausgerichtet auf eine Länge von n (Aminosäuren und Lücken) basierend auf Sequenz und/oder Struktur. Zur Vereinfachung der Darstellung präsentieren wir unsere Methoden für den häufigsten Fall des Mischens von zwei Elternteilen, ein1 und ein2. Unsere Methoden erstrecken sich ohne weiteres auf die Schaffung äquivalenter Stellen für die Rekombination bei mehreren Elternteilen, und es bleibt eine interessante zukünftige Arbeit, um ein ungleichmäßiges Mischen zu ermöglichen (d. h. wo unterschiedliche Kreuzungen zwischen verschiedenen Elternpaaren möglich sind).

Um das Shuffling-Experiment zu optimieren, wählen wir für jede Aminosäure für jeden Elternteil ein Codon aus, was DNA-Sequenzen ergibt D1 und D2 der Länge 3n (Beibehaltung von Lücken für diejenigen in den Aminosäuresequenzen). Um den Pool von Codons, die an einer bestimmten Position betrachtet werden, zu erweitern, können wir uns für eine Aminosäuresubstitution entscheiden. Daher nehmen wir als zusätzliche Eingabe eine Spezifikation der erlaubte Auswechslungen für jede Restposition für jedes Elternteil, zusammen mit einer Zahl m von ihnen zu machen. Die zulässige Substitutionsspezifikation kann aus der Sequenz- und/oder Strukturanalyse der Eltern abgeleitet werden, einschließlich allgemeiner Aminosäuresubstitutionsmatrizen [18], positionsspezifischer Aminosäurestatistiken von verwandten Proteinen [19] und Δ Δ G-Faltung ∘ falten Vorhersagen für mögliche Substitutionen [20]. Die unten dargestellten Ergebnisse bestimmen zulässige Substitutionen gemäß der BLOSUM62-Substitutionsmatrix, wobei nur "konservative" Substitutionen berücksichtigt werden, die nicht mehr als 4 schlechter abschneiden als der Wildtyp [15].

Bei der Beschreibung der Algorithmen verwenden wir mögliche Codon-Sets Darstellen der Codons, die an jeder Position im Wildtyp und unter den erlaubten Substitutionen erlaubt sind. Für Position ich, einstellen C1[ich] enthält die möglichen Codons für ein1[ich], wobei jedes mit einem Hinweis darauf gepaart wird, ob es eine Substitution erfordert oder nicht, z. Satz C2[ich] ist für den zweiten Elternteil ähnlich definiert. Wir stellen fest, dass diese leicht verwendet werden können, um einzuschränken, wo Mutationen eingesetzt werden sollen (z. B. Maskierung basierend auf Strukturanalyse, wie von Moore und Maranas [17] diskutiert), indem in einigen Positionen nur Wildtyp-Codons (oder Aminosäuren) zugelassen werden.

Wir betrachten vier Arten von Zielfunktionen, Targeting gemeinsame Nukleotide (an ausgerichteten Positionen), Nearest-Neighbor-Approximation zur Änderung der freien Glühenergie (aus Dinukleotidpaaren), gemeinsame Nukleotidläufe (in zusammenhängenden Zeichenfolgen), oder Bibliotheksvielfalt (unter resultierenden Chimären). Wir entwickeln immer komplexere dynamische Programmieralgorithmen, um diese Ziele zu optimieren.

Gemeinsame Nukleotidoptimierung

Bei dieser grundlegendsten Optimierung für das DNA-Shuffling besteht das Ziel darin, die Anzahl identischer Nukleotide an gemeinsamen Positionen zu maximieren:

wo ich ist die Indikatorfunktion (1 für wahr, 0 für falsch).

Da keine Substitutionen erlaubt sind, ist jede Restposition unabhängig voneinander. Daher wählen wir einfach für jede Position ein Codon-Paar (eins für jeden Elternteil) mit einer maximalen Anzahl von gemeinsamen Nukleotiden aus. Wenn Substitutionen erlaubt sind, müssen wir sie für eine optimale Wirkung zuweisen. Obwohl mehrere Ansätze möglich sind, entwickeln wir hier einen, der auf dynamischer Programmierung basiert, als Grundlage für die komplexeren Zielfunktionen, die wir in den folgenden Unterabschnitten verfolgen.


Vorausschauende Evolution und DNA-Shuffling

DNA-Shuffling hat sich als leistungsfähige Technik für die gerichtete Evolution von Proteinen erwiesen. Eine Mischung aus theoretischer und angewandter Forschung hat nun Erkenntnisse darüber geliefert, wie die Rekombination gesteuert werden kann, um Proteine ​​und sogar Organismen mit veränderten Funktionen effizienter zu erzeugen.

Proteine ​​sind Maschinen, die von der Evolution geschaffen wurden, aber es ist unklar, wie genau die Evolution ihre Sequenz, Struktur und Funktion gesteuert hat. Es ist zweifellos richtig, dass einzelne Mutationen in einem Protein sowohl seine Struktur als auch seine Funktion beeinflussen und dass solche Mutationen während der Evolutionsgeschichte behoben werden können, aber es ist auch wahr, dass es andere Elemente der Proteinsequenz gibt, auf die die Evolution eingewirkt hat. Beispielsweise scheint der genetische Code so angelegt zu sein, dass Mutationen und Übersetzungsfehler die Proteinstruktur und -funktion nur minimal schädigen [1]. Könnte die Wahrscheinlichkeit, dass eine nützliche Mutation in der Population gefunden und fixiert wird, auch im Laufe der Evolution manipuliert worden sein, so dass die Proteine, die wir heute sehen, sich besser verändern können als die Proteine, die nach der "Erfindung" möglicherweise zusammengeschustert wurden der Übersetzung? Haben sich Proteine ​​tatsächlich entwickelt, um sich zu entwickeln? Es gibt bereits einige Hinweise darauf, dass Bakterien in der Lage sind, Phänotypen zu entwickeln, die zur weiteren Anpassung fähiger sind (Übersicht in [2,3,4]). Als Ergebnis von Selektionsexperimenten entstehen beispielsweise mutatorische [5] und hyperrekombinogene [6] Stämme. Die Entwicklung des DNA-Shuffling (Übersicht in [7,8]) und das Erscheinen mehrerer neuerer Arbeiten, die diese Technik verwenden [9,10,11] bieten uns eine überraschende neue Möglichkeit, diese grundlegenden Fragen auf individueller Ebene zu stellen und zu beantworten Gene und vielleicht sogar Genome.

DNA-Shuffling, eine Methode für in vitro Rekombination, wurde als Technik zur Generierung mutierter Gene entwickelt, die Proteine ​​mit verbesserter oder einzigartiger Funktionalität kodieren [12,13]. Es besteht aus einem dreistufigen Prozess, der mit der enzymatischen Verdauung von Genen beginnt und kleinere DNA-Fragmente liefert. Die kleinen Fragmente können dann zufällig hybridisieren und werden aufgefüllt, um längere Fragmente zu erzeugen. Letztendlich werden alle rekombinierten Gene voller Länge, die neu erzeugt werden, über die Polymerase-Kettenreaktion amplifiziert. Wird eine Reihe von Allelen oder mutierten Genen als Ausgangspunkt für das DNA-Shuffling verwendet, entsteht eine Bibliothek rekombinierter Gene, die in neue Proteine ​​übersetzt werden können, die wiederum auf neue Funktionen gescreent werden können. Gene mit nützlichen Mutationen können weiter gemischt werden, um sowohl diese unabhängigen, nützlichen Mutationen in einem einzigen Gen zusammenzuführen als auch alle schädlichen Mutationen zu eliminieren. Obwohl durch serielle Mutagenese und Screening potenziell mehrere nützliche Mutationen erzeugt werden könnten, ist das DNA-Shuffling viel schneller: So enthält die Ausgangspopulation einer durch mutagene PCR generierten Bibliothek typischerweise 70-99% nicht funktionelle Varianten [14], während die meisten durch DNA-Shuffling gebildeten Varianten sind funktionell. Somit sollte das DNA-Shuffling eine optimierte Untersuchung des Sequenzraums und die einfache Erfassung neuer Protein-Phänotypen ermöglichen, wie dies tatsächlich für eine Reihe von Protein-Targets der Fall ist [15,16].

Über biotechnologische Anwendungen hinaus kann DNA-Shuffling möglicherweise verwendet werden, um die natürliche Rekombination zu rekapitulieren und zu fragen, ob die Rekombination im Allgemeinen zu besseren oder neuen Proteinen führt. Dabei kann DNA-Shuffling nicht nur mit Genen durchgeführt werden, die eng verwandte Allele sind, sondern auch mit einer Gruppe von phylogenetisch verwandten Genen, die sich um bis zu 40% unterscheiden können, ein Vorgang, der als Family Shuffling bekannt ist [15]. Wie oben erwähnt, wurde stark vermutet, dass durch die Familienzusammenführung die vorteilhaftesten Mutationen in dasselbe Gen übertragen und so die Proteinfunktion schnell optimiert oder verändert werden könnte, indem man von einer Population von Genen ausgeht, von denen bereits bekannt ist, dass sie funktionsfähig sind. Tatsächlich sollte diese Intuition jedoch nur dann zutreffen, wenn mutierte Allele im Allgemeinen entweder additiv oder synergistisch wirken können. Wenn mutierte Allele neutral sind oder sich gegenseitig stören, gibt es keinen generischen Vorteil der Rekombination.

Um dieser Hypothese nachzugehen, hat Joern et al. [9] haben eine neue Technik zur Kartierung von Rekombinationsereignissen durch Sondenhybridisierungsanalyse entwickelt. Durch Kreuzung von Genen für mehrere Dioxygenasen wurden gemischte Bibliotheken erzeugt: Toluoldioxygenase, todC1C2-Tetrachlorbenzol-Dioxygenasen, tecA1A2 und Biphenyldioxygenase, bphA1A2. Shuffled-Varianten aus der Drei-Eltern-Bibliothek wurden auf Toluylen-Dioxygenase-Aktivität gescreent und zufällig ausgewählte Varianten wurden sequenziert, um die tatsächliche Anzahl von Crossovers zu bestimmen, die zu funktionellen und nichtfunktionellen Varianten geführt hatten. Es überrascht nicht, dass Crossovers häufig in Regionen mit hoher Homologie auftraten: Obwohl Regionen, die zehn oder mehr gemeinsame, identische Reste enthielten, weniger als 10 % der Länge der Gene ausmachten, traten über 60 % der Crossovers in diesen Regionen auf. Interessanterweise wurde festgestellt, dass die Anzahl der Crossover-Ereignisse nicht mit der Proteinfunktion korreliert, was darauf hindeutet, dass einzelne Segmente eines Proteins während der Evolution unabhängig voneinander agieren könnten [9]. Es ist auch möglich, dass die Proteine ​​so eng miteinander verwandt waren, dass multiple Crossovers die Funktionalität nicht reduzierten oder veränderten.

Aufbauend auf diesen Ergebnissen hat Voigt et al. [10] stellten die Hypothese auf, dass funktionelle Gene, die durch DNA-Shuffling (und vielleicht durch natürliche Rekombination) gewonnen werden, geclusterte Sätze struktureller Interaktionen (die sogenannten „Schemata“) des ursprünglichen Proteins erhalten sollten (Abbildung ​ (Abbildung 1a). 1a ). Um diese Hypothese zu validieren, entwickelten die Autoren einen Algorithmus, der versuchte, die Wirkung von Crossover-Ereignissen an bestimmten Stellen in einem Gen vorherzusagen. Insbesondere bewertete der Algorithmus, welche Aminosäuren sowohl in der primären als auch in der tertiären Proteinstruktur nahe beieinander lagen und sagte voraus, welche Interaktionsuntergruppen so manipuliert werden könnten, dass die Proteinstruktur und -funktion minimal gestört würde. This analysis results in a 'schema profile' for the proteins, which indicates the amount of disruption to the schemas that recombination at each point along the sequence will cause (Figure ​ (Figure1b). 1b ). Several proteins that had previously been evolved in vitro by family shuffling were evaluated, and the schema profiles of these proteins correlated well with the experimentally determined crossover points [14].

A graphical representation of the relationship between protein structure and schemas. (ein) The β-lactamase protein is shown divided into different colored substructures (schemas), which are derived from the schema profile of the protein. (B) An example of a schema profile for a (simpler) hypothetical protein. Peaks correlate with positions in the protein where recombination will be maximally disruptive valleys correlate with positions that are predicted to minimally disrupt the structure and function of the protein. (C) Intron structure may correlate with schema structure. To the extent it is now possible to calculate schema profiles, it can be hypothesized that introns (white) may generally fall at minima while exons (black) may generally contain larger disruption values.

This algorithm was then used to generate schema profiles between two β-lactamases, TEM-1 and PSE-4, which confer ampicillin resistance and share only 40% amino-acid sequence identity. Hybrid enzymes that had varying degrees of recombination between schemas were then constructed, and the recombined variants were transformed into bacteria, which were assayed for ampicillin resistance. The most resistant hybrids contained recombined genes with crossovers that had been predicted in advance to occur between schemas [10].

What is particularly surprising is not that DNA shuffling occurs between domains even a brief observation of the three-dimensional structures of proteins immediately suggests that recombinational breakpoints will probably have the smallest effect on protein function if they occur outside of major structural units found by Voigt et al. [16] (although certain breakpoints between structural subunits, such as in the middle of α helices, would probably not have been predicted without schema profiling). Rather, the amazing thing is that proteins have evolved so that they are by and large composed of structural domains that can undergo recombination. As Voigt et al. [10] point out, Gô [17,18] found a correlation between intron locations and structural domains. This was expanded on by Gilbert and his co-workers [19], who advanced the notion that proteins could be modularly constructed from structural domains as an attempt to explain the origin of introns. Although the 'introns early' hypothesis has long since been shown to be implausible [20,21,22], the original notion that introns could act as buffers for recombination is still intellectually compelling, and it may be consistent with the results of Voigt et al. [10].

Interestingly, to the extent that proteins have evolved as modular machines that are capable of taking advantage of recombination during their evolutionary history, the very mathematical models propagated by Joern et al. [9] and Voigt et al. [10] may be unnecessary. 'Blind' DNA shuffling between closely related proteins may already be more than good enough to generate proteins with novel phenotypes. For example, we have evolved a β-glucuronidase in vitro to switch its substrate specificity from β-glucuronides to β-galactosides and have achieved an over 500-fold increase in activity towards the new substrate [23]. This catalytic conversion was achieved in three rounds of shuffling and screening, but further rounds of selection failed to achieve greater cleavage of β-galactosides. The initial library of this selection was constructed using mutagenic PCR, and a large fraction of the population was inactive, yet the catalytic specificity of the selection produced a switch of over 52-million-fold in substrate preference.

Similarly, new experiments from Zhang et al. [11] provide additional evidence that blind shuffling is fully capable of functional improvement, not just at the protein level, but even at the organismal level. These researchers coupled classical strain improvement (mutation and selection) with genetic recombination. Protoplast fusion results in very efficient recombination between the genomes of Streptomyces species, and iterative protoplast fusion results in the reassortment of multiple markers between species. To show the power of this new method, a Streptomyces strain producing the complex polyketide antibiotic tyiosin was selected for improved function and was then forced to undergo the equivalent of sexual reproduction. The genomes of several surviving mutants were shuffled after every round of selection to generate a combinatorial library of organisms that could again be screened for improved function. A strain generated by only two rounds of shuffling could produce tylosin at a rate comparable to strains that had undergone 20 rounds of classical selection. These results demonstrate that genome shuffling will probably lead to changes and improvements in organismal function as radical as those that have previously been observed for proteins.

Overall, these results further support the idea that evolution can act reflexively - that is, to enhance its own ability to act. From the results of Arnold and co-workers [9,10], it is possible that regions that fall between predicted schema might be conserved in sequence in order to facilitate recombination this hypothesis could be checked directly by database analysis. The application of the techniques described by Arnold and co-workers [9,10], del Cardayré and co-workers [11], and others may allow researchers to more effectively design libraries for screening. A large fraction of the products generated in traditional screening or even shuffling reactions are nonfunctional. Schema profiling and pathway shuffling may eventually make it possible to design directed evolution experiments in which structural and metabolic subunits are preserved, thereby limiting the exploration of sequence space largely to functional molecules. Ultimately, these advances should expand our understanding of natural genetic processes and thereby allow biologists to generate novel proteins and pathways in a fraction of the time that nature or conventional breeding would take.


DNA shuffling of a family of genes from diverse species accelerates directed evolution

DNA shuffling is a powerful process for directed evolution, which generates diversity by recombination 1 , 2 , combining useful mutations from individual genes. Libraries of chimaeric genes can be generated by random fragmentation of a pool of related genes, followed by reassembly of the fragments in a self-priming polymerase reaction. Template switching causes crossovers in areas of sequence homology. Our previous studies used single genes and random point mutations as the source of diversity 3,4,5,6 . An alternative source of diversity is naturally occurring homologous genes, which provide ‘functional diversity’. To evaluate whether natural diversity could accelerate the evolution process, we compared the efficiency of obtaining moxalactamase activity from four cephalosporinase genes evolved separately with that from a mixed pool of the four genes. A single cycle of shuffling yielded eightfold improvements from the four separately evolved genes, versus a 270- to 540-fold improvement from the four genes shuffled together, a 50-fold increase per cycle of shuffling. The best clone contained eight segments from three of the four genes as well as 33 amino-acid point mutations. Molecular breeding by shuffling can efficiently mix sequences from different species, unlike traditional breeding techniques. The power of family shuffling may arise from sparse sampling of a larger portion of sequence space.


8 Approaches to Random Mutagenesis

Random mutagenesis is an incredibly powerful tool for altering the properties of enzymes. Imagine, for example, you were studying a G-protein coupled receptor (GPCR) and wanted to create a temperature-sensitive version of the receptor or one that was activated by a different ligand than the wild-type. How could you do this?

Firstly, you would clone the gene encoding the receptor, then randomly introduce mutations into the gene sequence to create a “library” containing thousands of versions of the gene. Each version (or “variant”) of the gene in the library would contain different mutations and so encode receptors with slightly altered amino acid sequences giving them slightly different enzymatic properties than the wild-type.

Next, you could transform the library into a strain where the receptor would be expressed and apply a high throughput screen to pick out variants in the library that have the properties you are looking for. Using a high throughput screen for GPCR activity (see here for examples) you could pick out the variants from the library that were temperature-sensitive or were activated by different ligands.

Sound easy? Well, of course it’s not that easy. Creating a random mutant library that contains enough variants to give you a good chance of obtaining the altered enzyme you desire is a challenge in itself. There are many ways to create random mutant libraries, each with it’s own pros and cons. Hier sind einige davon:

1. Error-prone PCR. This approach uses a “sloppy” version of PCR, in which the polymerase has a fairly high error rate (up to 2%), to amplify the wild-type sequence. The PCR can be made error-prone in various ways including increasing the MgCl2 in the reaction, adding MnCl2 or using unequal concentrations of each nucleotide. Here is a good review of error prone PCR techiques and theory. After amplification, the library of mutant coding sequences must be cloned into a suitable plasmid. The drawback of this approach is that size of the library is limited by the efficiency of the cloning step. Although point mutations are the most common types of mutation in error prone PCR, deletions and frameshift mutations are also possible. There are a number of commercial error-prone PCR kits available, including those from Stratagene and Clontech.

2. Rolling circle error-prone PCR is a variant of error-prone PCR in which wild-type sequence is first cloned into a plasmid, then the whole plasmid is amplified under error-prone conditions. This eliminates the ligation step that limits library size in conventional error-prone PCR but of course the amplification of the whole plasmid is less efficient than amplifying the coding sequence alone. More details can be found here.

3. Mutator strains. In this approach the wild-type sequence is cloned into a plasmid and transformed into a mutator strain, such as Stratagene’s XL1-Red. XL1-red is an E coli strain whose deficiency in three of the primary DNA repair pathways (mutS, mutD und mutT) causes it to make errors during replicate of it’s DNA, including the cloned plasmid. As a result each copy of the plasmid replicated in this strain has the potential to be different from the wild-type. One advantage of mutator strains is that a wide variety of mutations can be incorporated including substitutions, deletions and frame-shifts. The drawback with this method is that the strain becomes progressively sick as it accumulates more and more mutations in it’s own genome so several steps of growth, plasmid isolation, transformation and re-growth are normally required to obtain a meaningful library.

4. Temporary mutator strains. Temporary mutator strains can be built by over-expressing a mutator allele such as mutD5 (a dominant negative version of mutD) which limits the cell’s ability to repair DNA lesions. By expressing mutD5 from an inducible promoter it is possible to allow the cells to cycle between mutagenic (mutD5 expression on) and normal (mutD5 expression off) periods of growth. The periods of normal growth allow the cells to recover from the mutagenesis, which allows these strains to grow for longer than conventional mutator strains.

If a plasmid with a temperature-sensitive origin of replication is used, the mutagenic plasmid can easily be removed restore normal DNA repair, allowing the mutants to be grown up for analysis/screening. An example of the construction and use of such a strain can be found here. As far as I am aware there are no commercially available temporary mutator strains.

5. Insertion mutagenesis. Finnzymes have a kit that uses a transposon-based system to randomly insert a 15-base pair sequence throughout a sequence of interest, be it an isolated insert or plasmid. This inserts 5 codons into the sequence, allowing any gene with an insertion to be expressed (i.e. no frame-shifts or stop codons are cause). Since the insertion is random, each copy of the sequence will have different insertions, thus creating a library.

6. Ethyl methanesulfonate (EMS) is a chemical mutagen. EMS aklylates guanidine residues, causing them to be incorrectly copied during DNA replication. Since EMS directly chemically modifies DNA, EMS mutagenesis can be carried out either in vivo (i.e. whole-cell mutagenesis) or in vitro. An example of in vitro mutagenesis with EMS in which a PCR-amplified gene was subjected to reaction with EMS before being ligated into a plasmid and transformed can be found here.

7. Nitrous acid is another chemical mutagen. It acts by de-aminating adenine and cytosine residues (although other mechanisms are discussed here) causing transversion point mutations (A/T to G/C and vice versa). An example of a study using nitrosoguanidine mutagenesis can be found here.

Notiz: I have only mentioned two chemical mutagens but there are many others. Hirokazu Inoue has written an excellent article describing some of them and their use in mutagenesis, see here (pdf).

Another note: Chemical mutagens are, of course… mutagens and therefore should be handled with great care. Be especially careful with EMS as it is volatile at room temperature. Read the MSDS and do a proper risk assessment before carrying out these experiments.


DNA shuffling: Modifying the hand that nature dealt

DNA shuffling is a technique being utilized for in vitro recombination of a single gene or pools of homologous genes. The genes are fragmented into randomly sized pieces, and polymerase chain reaction (PCR) reassembly of full-length genes from the fragments, via self-priming, yields recombination due to PCR template switching. After these PCR products are screened and the interesting products sequenced, improved clones are reshuffled to recombine useful mutations in additive or synergistic ways, in effect mimicking the process of natural sexual recombination. Proteins can be &lsquobred&rsquo with the appropriate individual properties and then their &lsquoprogeny&rsquo screened for the desired combination of traits. DNA shuffling is a powerful tool enabling rapid and directed evolution of new genes, operons and whole viral genomes.

Tagebuch

In Vitro Cellular & Developmental Biology - Plant &ndash Springer Journals


Zukunftsperspektiven

As structural genomics matures, these versatile screening strategies are starting to bridge the gap between structural biology and cellular biology. For example, split GFP can be used for tracking pathogen effector proteins in host cells [58], mapping cell-cell contacts [59], and viral/cell membrane fusion [60]. Future applications may include tagging membrane proteins on either side of the cellular lumen. Domain screening technologies coupled with deep sequencing will likely play increasingly important roles in antigen generation for phage based antibody development and vaccinology [61]. One can expect hybrid approaches to increasing protein stability of individual proteins and protein complexes combining computational design to create ‘smart’ libraries towards stability or activity (Rosetta3, [62]), in-house microfluidic gene synthesis [63,64] of corresponding constrained diversity DNA libraries, and microfluidic screens or selections for protein stability and activity [65,66].


Verweise

Freeland SJ, Hurst LD: The genetic code is one in a million. J Mol Evol. 1998, 47: 238-248.

Radman M, Matic I, Taddei F: Evolution of evolvability. Ann NY Acad Sci. 1999, 870: 146-155.

Radman M, Taddei F, Matic I: Evolution-driving genes. Res Mikrobiol. 2000, 151: 91-95. 10.1016/S0923-2508(00)00122-4.

Tenaillon O, Taddei F, Radmian M, Matic I: Second-order selection in bacterial evolution: selection acting on mutation and recombination rates in the course of adaptation. Res Mikrobiol. 2001, 152: 11-16. 10.1016/S0923-2508(00)01163-3.

Sniegowski PD, Gerrish PJ, Lenski RE: Evolution of high mutation rates in experimental populations of E coli. Natur. 1997, 387: 703-705. 10.1038/42701.

Guttman DS, Dykhuizen DE: Clonal divergence in Escherichia coli as a result of recombination, not mutation. Wissenschaft. 1994, 266: 1380-1383.

Farinas ET, Bulter T, Arnold FH: Directed enzyme evolution. Curr Opin Biotechnol. 2001, 12: 545-551. 10.1016/S0958-1669(01)00261-0.

Kolkman JA, Stemmer WP: Directed evolution of proteins by exon shuffling. Nat. Biotechnologie. 2001, 19: 423-428. 10.1038/88084.

Joern JM, Meinhold P, Arnold FH: Analysis of shuffled gene libraries. J. Mol. Biol. 2002, 316: 643-656. 10.1006/jmbi.2001.5349.

Voigt CA, Martinez C, Wang ZG, Mayo SL, Arnold FH: Protein building blocks preserved by recombination. Nat Struct Biol. 2002, 9: 553-558.

Zhang YX, Perry K, Vinci VA, Powell K, Stemmer WP, del Cardayré SB: Genome shuffling leads to rapid phenotypic improvement in bacteria. Natur. 2002, 415: 644-646. 10.1038/415644a.

Stemmer WP: DNA shuffling by random fragmentation and reassembly: in vitro recombination for molecular evolution. Proc Natl Acad Sci USA. 1994, 91: 10747-10751.

Stemmer WP: Rapid evolution of a protein in vitro by DNA shuffling. Natur. 1994, 370: 389-391. 10.1038/370389a0.

Matsumura I, Ellington AD: Mutagenic PCR of protein-coding genes for in vitro evolution. In In Vitro Mutagenesis Protocols. Edited by: Braman J. 2001, Totowa NJ: Humana

Crameri A, Raillard SA, Bermudez E, Stemmer WP: DNA shuffling of a family of genes from diverse species accelerates directed evolution. Natur. 1998, 391: 288-291. 10.1038/34663.

Ness JE, Welch M, Giver L, Bueno M, Cherry JR, Borchert TV, Stemmer WP, Minshull J: DNA shuffling of subgenomic sequences of subtilisin. Nat. Biotechnologie. 1999, 17: 893-896. 10.1038/12884.

Gô M: Correlation of DNA exonic regions with protein structural units in haemoglobin. Natur. 1981, 291: 90-92.

Gô M: Modular structural units, exons, and function in chicken lysozyme. Proc Natl Acad Sci USA. 1983, 80: 1964-1968.

Gilbert W, Glynias M: On the ancient nature of introns. Gen. 1993, 135: 137-144. 10.1016/0378-1119(93)90058-B.

Palmer JD, Logsdon JM: The recent origins of introns. Curr Opin Genet Dev. 1991, 1: 470-477.

Cavalier-Smith T: Intron phylogeny: a new hypothesis. Trends Genet. 1991, 7: 145-148.

Rogers JH: The role of introns in evolution. FEBS Lett. 1990, 268: 339-343. 10.1016/0014-5793(90)81282-S.

Matsumura I, Ellington AD: In vitro evolution of beta-glucuronidase into a beta-galactosidase proceeds through non-specific intermediates. J. Mol. Biol. 2001, 305: 331-339. 10.1006/jmbi.2000.4259.


Evolution of a cytokine using DNA family shuffling

DNA shuffling of a family of over 20 human interferon-α (Hu-IFN-α) genes was used to derive variants with increased antiviral and antiproliferation activities in murine cells. A clone with 135,000-fold improved specific activity over Hu-IFN-α2a was obtained in the first cycle of shuffling. After a second cycle of selective shuffling, the most active clone was improved 285,000-fold relative to Hu-IFN-α2a and 185-fold relative to Hu-IFN-α1. Remarkably, the three most active clones were more active than the native murine IFN-αs. These chimeras are derived from up to five parental genes but contained no random point mutations. These results demonstrate that diverse cytokine gene families can be used as starting material to rapidly evolve cytokines that are more active, or have superior selectivity profiles, than native cytokine genes.


Schau das Video: Punktmutationen: Stumme Mutation, Missense Mutation Fehlsinn, Nonsense Mutation - 2. Genetik (Kann 2022).


Bemerkungen:

  1. JoJor

    Bravo, sehr gutes Denken

  2. Archibaldo

    Dieser Beitrag ist unvergleichlich))), es ist sehr interessant für mich :)

  3. Nikolaus

    Ich denke, dass Sie sich irren. Lassen Sie uns darüber diskutieren. Schreiben Sie mir in PM.

  4. Dijora

    Entschuldigung dafür, dass ich mir eine ähnliche Situation einmischte. Es ist möglich zu diskutieren. Schreiben Sie hier oder in PM.



Eine Nachricht schreiben