Information

17.3: Sequenzierung des gesamten Genoms – Biologie

17.3: Sequenzierung des gesamten Genoms – Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Fähigkeiten zum Entwickeln

  • Beschreiben Sie drei Arten der Sequenzierung
  • Definieren Sie die Sequenzierung des gesamten Genoms

Obwohl es in den letzten Jahren erhebliche Fortschritte in der Medizin gab, sind Ärzte immer noch von einigen Krankheiten verwirrt und verwenden die Sequenzierung des gesamten Genoms, um dem Problem auf den Grund zu gehen. Die Sequenzierung des gesamten Genoms ist ein Verfahren, das die DNA-Sequenz eines gesamten Genoms bestimmt. Die Sequenzierung des gesamten Genoms ist ein Brute-Force-Ansatz zur Problemlösung, wenn eine genetische Grundlage im Kern einer Krankheit besteht. Mehrere Laboratorien bieten inzwischen Dienstleistungen zur Sequenzierung, Analyse und Interpretation ganzer Genome an.

Beispielsweise ist die Ganz-Exom-Sequenzierung eine kostengünstigere Alternative zur Ganz-Genom-Sequenzierung. Bei der Exom-Sequenzierung werden nur die kodierenden, Exon-produzierenden Regionen der DNA sequenziert. Im Jahr 2010 wurde die Sequenzierung des gesamten Exoms verwendet, um einen kleinen Jungen zu retten, dessen Darm mehrere mysteriöse Abszesse aufwies. Das Kind hatte mehrere Dickdarmoperationen ohne Linderung. Schließlich wurde eine Sequenzierung des gesamten Exoms durchgeführt, die einen Defekt in einem Signalweg aufdeckte, der die Apoptose (programmierter Zelltod) kontrolliert. Eine Knochenmarktransplantation wurde verwendet, um diese genetische Störung zu überwinden, was zu einer Heilung für den Jungen führte. Er war der erste Mensch, der aufgrund einer Diagnose durch Whole-Exom-Sequenzierung erfolgreich behandelt wurde. Heute ist die Sequenzierung des menschlichen Genoms leichter verfügbar und kann in ein oder zwei Tagen für etwa 1000 US-Dollar abgeschlossen werden.

In Sequenzierungsprojekten verwendete Strategien

Die grundlegende Sequenzierungstechnik, die in allen modernen Sequenzierungsprojekten verwendet wird, ist die Kettenabbruchmethode (auch als Didesoxy-Methode bekannt), die in den 1970er Jahren von Fred Sanger entwickelt wurde. Das Kettenabbruchverfahren beinhaltet die DNA-Replikation einer einzelsträngigen Matrize unter Verwendung eines Primers und eines regulären Desoxynukleotids (dNTP), das ein Monomer oder eine einzelne Einheit der DNA ist. Primer und dNTP werden mit einem kleinen Anteil fluoreszenzmarkierter Didesoxynukleotide (ddNTPs) vermischt. Die ddNTPs sind Monomere, denen eine Hydroxylgruppe (–OH) an der Stelle fehlt, an der normalerweise ein anderes Nukleotid anlagert, um eine Kette zu bilden (Abbildung (PageIndex{1})).

Jedes ddNTP ist mit einer anderen Fluorophorfarbe markiert. Jedes Mal, wenn ein ddNTP in den wachsenden komplementären Strang eingebaut wird, beendet es den Prozess der DNA-Replikation, was zu mehreren kurzen Strängen replizierter DNA führt, die jeweils an einem anderen Punkt während der Replikation enden. Wenn das Reaktionsgemisch nach der Auftrennung in Einzelstränge gelelektrophoretisch verarbeitet wird, bilden die mehrfach neu replizierten DNA-Stränge aufgrund der unterschiedlichen Größen eine Leiter. Da die ddNTPs fluoreszenzmarkiert sind, spiegelt jede Bande auf dem Gel die Größe des DNA-Strangs und des ddNTP wider, der die Reaktion beendete. Die unterschiedlichen Farben der Fluorophor-markierten ddNTPs helfen, das an dieser Position eingebaute ddNTP zu identifizieren. Das Ablesen des Gels anhand der Farbe jeder Bande auf der Leiter ergibt die Sequenz des Matrizenstrangs (Abbildung (PageIndex{2})).

Frühe Strategien: Shotgun-Sequenzierung und paarweise Endsequenzierung

Bei der Schrotflinten-Sequenzierungsmethode werden mehrere Kopien eines DNA-Fragments zufällig in viele kleinere Stücke geschnitten (ähnlich dem, was mit einer runden Schrotpatrone passiert, wenn sie aus einer Schrotflinte abgefeuert wird). Alle Segmente werden dann unter Verwendung des Kettensequenzierungsverfahrens sequenziert. Dann werden die Fragmente mit Hilfe eines Computers analysiert, um zu sehen, wo sich ihre Sequenzen überschneiden. Durch Angleichen überlappender Sequenzen am Ende jedes Fragments kann die gesamte DNA-Sequenz neu gebildet werden. Eine größere Sequenz, die aus überlappenden kürzeren Sequenzen zusammengesetzt ist, wird als Contig bezeichnet. Stellen Sie sich als Analogie vor, dass jemand vier Kopien eines Landschaftsfotos besitzt, das Sie noch nie zuvor gesehen haben und keine Ahnung haben, wie es aussehen soll. Die Person zerreißt dann jedes Foto mit den Händen, so dass von jeder Kopie verschieden große Stücke vorhanden sind. Die Person mischt dann alle Teile zusammen und bittet Sie, das Foto zu rekonstruieren. In einem der kleineren Stücke sieht man einen Berg. In einem größeren Teil sehen Sie, dass sich derselbe Berg hinter einem See befindet. Ein drittes Fragment zeigt nur den See, aber es zeigt, dass sich am Ufer des Sees eine Hütte befindet. Wenn Sie sich also die überlappenden Informationen in diesen drei Fragmenten ansehen, wissen Sie, dass das Bild einen Berg hinter einem See zeigt, an dessen Ufer eine Hütte steht. Dies ist das Prinzip hinter der Rekonstruktion ganzer DNA-Sequenzen mittels Shotgun-Sequenzierung.

Ursprünglich analysierte die Shotgun-Sequenzierung nur ein Ende jedes Fragments auf Überlappungen. Dies war ausreichend, um kleine Genome zu sequenzieren. Der Wunsch, größere Genome, wie das eines Menschen, zu sequenzieren, führte jedoch zur Entwicklung der Double-Barrel-Shotgun-Sequenzierung, die formaler als Pairwise-End-Sequenzierung bekannt ist. Bei der paarweisen Endsequenzierung werden beide Enden jedes Fragments auf Überlappung analysiert. Die paarweise Sequenzierung ist daher umständlicher als die Shotgun-Sequenzierung, aber es ist einfacher, die Sequenz zu rekonstruieren, da mehr Informationen verfügbar sind.

Sequenzierung der nächsten Generation

Seit 2005 werden automatisierte Sequenzierungstechniken, die von Labors verwendet werden, unter dem Dach der Next-Generation-Sequenzierung zusammengefasst, einer Gruppe automatisierter Techniken, die für die schnelle DNA-Sequenzierung verwendet werden. Diese automatisierten, kostengünstigen Sequenzer können innerhalb eines Tages Sequenzen von Hunderttausenden oder Millionen kurzer Fragmente (25 bis 500 Basenpaare) generieren. Diese Sequenzer verwenden ausgeklügelte Software, um den mühsamen Prozess des Ordnens aller Fragmente zu bewältigen.

Evolution Connection: Sequenzen vergleichen

Ein Sequenz-Alignment ist eine Anordnung von Proteinen, DNA oder RNA; es wird verwendet, um Ähnlichkeitsregionen zwischen Zelltypen oder -arten zu identifizieren, die auf die Erhaltung von Funktionen oder Strukturen hinweisen können. Sequenz-Alignments können verwendet werden, um phylogenetische Bäume zu konstruieren. Die folgende Website verwendet ein Softwareprogramm namens BLAST (Basic Local Alignment Search Tool).

Klicken Sie unter "Basic Blast" auf "Nucleotid Blast". Geben Sie in das große Feld "Abfragesequenz" die folgende Sequenz ein: ATTGCTTCGATTGCA. Suchen Sie unter dem Feld das Feld "Spezies" und geben Sie "Mensch" oder "Homo sapiens" ein. Klicken Sie dann auf „BLAST“, um die eingegebene Sequenz mit bekannten Sequenzen des menschlichen Genoms zu vergleichen. Das Ergebnis ist, dass diese Sequenz an über hundert Stellen im menschlichen Genom vorkommt. Scrollen Sie unter der Grafik mit den horizontalen Balken nach unten und Sie sehen eine kurze Beschreibung der jeweiligen Treffer. Wählen Sie einen der Treffer oben in der Liste aus und klicken Sie auf "Grafik". Dies bringt Sie zu einer Seite, die zeigt, wo die Sequenz im gesamten menschlichen Genom zu finden ist. Sie können den Schieberegler, der wie eine grüne Flagge aussieht, hin und her bewegen, um die Sequenzen direkt um das ausgewählte Gen herum anzuzeigen. Sie können dann zu Ihrer ausgewählten Sequenz zurückkehren, indem Sie auf die Schaltfläche "ATG" klicken.

Verwendung von Gesamtgenomsequenzen von Modellorganismen

Das erste vollständig sequenzierte Genom stammte von einem bakteriellen Virus, dem Bakteriophagen fx174 (5368 Basenpaare); dies wurde von Fred Sanger mit Shotgun-Sequenzierung erreicht. Mehrere andere Organellen- und Virusgenome wurden später sequenziert. Der erste Organismus, dessen Genom sequenziert wurde, war das Bakterium Haemophilus influenzae; dies wurde von Craig Venter in den 1980er Jahren durchgeführt. Etwa 74 verschiedene Labors arbeiteten an der Sequenzierung des Genoms der Hefe Saccharomyces cerevisiae, das 1989 begann und 1996 abgeschlossen wurde, da es 60-mal größer war als jedes andere sequenzierte Genom. Bis 1997 lagen die Genomsequenzen zweier wichtiger Modellorganismen vor: des Bakteriums Escherichia coli K12 und die Hefe Saccharomyces cerevisiae. Genome anderer Modellorganismen wie der Maus Muskulatur, die Fruchtfliege Drosophila melanogaster, der Nematode Caenorhabditis. elegans, und Menschen Homo sapiens sind mittlerweile bekannt. Viele Grundlagenforschung wird an Modellorganismen betrieben, weil sich die Informationen auf genetisch ähnliche Organismen übertragen lassen. Ein Modellorganismus ist eine Art, die als Modell untersucht wird, um die biologischen Prozesse in anderen durch den Modellorganismus repräsentierten Arten zu verstehen. Die Sequenzierung ganzer Genome hilft bei den Forschungsanstrengungen in diesen Modellorganismen. Der Vorgang des Anhängens biologischer Informationen an Gensequenzen wird Genom-Annotation genannt. Die Annotation von Gensequenzen hilft bei grundlegenden Experimenten in der Molekularbiologie, wie dem Design von PCR-Primern und RNA-Targets.

DNA-Mikroarrays sind Verfahren zum Nachweis der Genexpression durch Analyse eines Arrays von DNA-Fragmenten, die auf einem Objektträger oder einem Siliziumchip fixiert sind, um aktive Gene und Sequenzen zu identifizieren. Mit Microarrays lassen sich fast eine Million genotypische Anomalien entdecken, während die Whole-Genom-Sequencing Aufschluss über alle sechs Milliarden Basenpaare im menschlichen Genom geben kann. Obwohl die Untersuchung medizinischer Anwendungen der Genomsequenzierung interessant ist, neigt diese Disziplin dazu, sich mit abnormen Genfunktionen zu befassen. Die Kenntnis des gesamten Genoms wird es ermöglichen, künftig auftretende Krankheiten und andere genetische Störungen frühzeitig zu entdecken und so fundiertere Entscheidungen über Lebensstil, Medikamente und Kinderwunsch zu treffen. Die Genomik steckt noch in den Kinderschuhen, obwohl es eines Tages zur Routine werden könnte, jedes Neugeborene mit der Sequenzierung des gesamten Genoms auf genetische Anomalien zu untersuchen.

Neben Krankheiten und Medizin kann die Genomik zur Entwicklung neuartiger Enzyme beitragen, die Biomasse in Biokraftstoff umwandeln, was zu einer höheren Pflanzen- und Kraftstoffproduktion und niedrigeren Kosten für den Verbraucher führt. Dieses Wissen sollte eine bessere Kontrolle über die Mikroben ermöglichen, die bei der Herstellung von Biokraftstoffen verwendet werden. Die Genomik könnte auch die Methoden zur Überwachung der Auswirkungen von Schadstoffen auf Ökosysteme verbessern und zur Beseitigung von Umweltschadstoffen beitragen. Die Genomik hat die Entwicklung von Agrochemikalien und Pharmazeutika ermöglicht, die der Medizin und der Landwirtschaft zugute kommen könnten.

Es klingt großartig, all das Wissen zu haben, das wir aus der Sequenzierung des gesamten Genoms gewinnen können; Der Mensch hat jedoch die Verantwortung, dieses Wissen mit Bedacht einzusetzen. Andernfalls könnte es leicht sein, die Macht dieses Wissens zu missbrauchen, was zu einer Diskriminierung aufgrund der Genetik einer Person, der menschlichen Gentechnik und anderer ethischer Bedenken führt. Diese Informationen können auch zu rechtlichen Problemen in Bezug auf Gesundheit und Datenschutz führen.

Zusammenfassung

Die Sequenzierung des gesamten Genoms ist die neueste verfügbare Ressource zur Behandlung genetischer Krankheiten. Einige Ärzte verwenden die Sequenzierung des gesamten Genoms, um Leben zu retten. Genomik hat viele industrielle Anwendungen, darunter die Entwicklung von Biokraftstoffen, die Landwirtschaft, die Pharmazie und die Kontrolle der Umweltverschmutzung. Das Grundprinzip aller modernen Sequenzierungsstrategien ist die Kettenabbruchmethode der Sequenzierung.

Obwohl die menschlichen Genomsequenzen Medizinern wichtige Erkenntnisse liefern, verwenden Forscher vollständige Genomsequenzen von Modellorganismen, um das Genom der Spezies besser zu verstehen. Die Automatisierung und die geringeren Kosten für die Sequenzierung des gesamten Genoms können in Zukunft zu einer personalisierten Medizin führen.

Kettenabbruchmethode
Verfahren zur DNA-Sequenzierung unter Verwendung markierter Didesoxynukleotide, um die DNA-Replikation zu beenden; es wird auch Didesoxy-Methode oder Sanger-Methode genannt
contig
größere DNA-Sequenz, die aus überlappenden kürzeren Sequenzen zusammengesetzt ist
Desoxynukleotid
einzelnes Monomer (einzelne Einheit) der DNA
Didesoxynukleotid
einzelnes DNA-Monomer, dem eine Hydroxylgruppe fehlt (–OH)
DNA-Mikroarray
Methode zum Nachweis der Genexpression durch Analyse eines Arrays von DNA-Fragmenten, die auf einem Objektträger oder einem Siliziumchip fixiert sind, um aktive Gene und Sequenzen zu identifizieren
Genom-Annotation
Prozess des Anhängens biologischer Informationen an Gensequenzen
Modellorganismus
Art, die untersucht und als Modell verwendet wird, um die biologischen Prozesse in anderen Arten zu verstehen, die durch den Modellorganismus repräsentiert werden
Sequenzierung der nächsten Generation
Gruppe automatisierter Techniken zur schnellen DNA-Sequenzierung
Schrotflinten-Sequenzierung
Methode zur Sequenzierung mehrerer DNA-Fragmente, um die Sequenz eines großen DNA-Stücks zu generieren
Sequenzierung des gesamten Genoms
Prozess, der die DNA-Sequenz eines gesamten Genoms bestimmt

Gesamtgenom-Resequenzierung zeigt Anpassung vor der Divergenz von Büffel-Unterarten

Die Anwendung von Hochdurchsatz-Genotypisierungs- oder Sequenzierungsdaten hilft uns, die genomische Reaktion auf natürliche und künstliche Selektion zu verstehen. In dieser Studie haben wir die Genome von fünf einheimischen Büffelpopulationen gescannt, die zu drei anerkannten Rassen gehören, die an verschiedene geografische und agroökologische Zonen im Iran angepasst sind, um das Ausmaß der genomischen Vielfalt zu entschlüsseln und genomische Regionen und Gene zu lokalisieren, die in der Vergangenheit ausgewählt wurden. Insgesamt wurden 46 ganze Genome von Flussbüffeln aus den Provinzen West- und Ost-Aserbaidschan, Gilan, Mazandaran und Khuzestan neu sequenziert. Unsere Sequenzierungsdaten erreichten eine Abdeckung von über 99% des Referenzgenoms von Flussbüffeln und eine durchschnittliche Lesetiefe von etwa 9,2× pro Probe. Wir identifizierten 20,55 Millionen SNPs, darunter 63.097 Missense-, 707 Stop-Gain- und 159 Stop-Loss-Mutationen, die funktionelle Konsequenzen haben könnten. Genomische Diversitätsanalysen zeigten eine bescheidene Strukturierung der iranischen Büffelpopulationen nach dem häufigen Genfluss oder der Beimischung in der jüngeren Vergangenheit. Der Nachweis einer positiven Selektion wurde unter Verwendung sowohl der Differenzierungs- (Fst) als auch der Fixierungsmetrik (Pi) untersucht. Die Analyse der Fixierung ergab drei genomische Regionen in allen drei Rassen mit abweichenden Polymorphismusgehalten auf BBU2, 20 und 21. Das Fixierungssignal auf BBU2 überlappte mit den OCA2-HERC2-Genen, was auf eine Anpassung an die UV-Exposition durch den Pigmentierungsmechanismus hindeutet. Eine weitere Validierung unter Verwendung von Resequenzierungsdaten von anderen fünf Rinderarten sowie der 90K-Daten des Axiom Buffalo Genotyping Array von Fluss- und Sumpfbüffeln zeigte, dass diese Fixierungssignale über Fluss- und Sumpfbüffel hinweg andauerten und sich auf Taurin-Rinder erstreckten, was auf ein uraltes evolutionäres Ereignis hinweist, das vor der Artbildung von Büffel- und Taurinrindern. Diese Ergebnisse trugen zu unserem Verständnis der wichtigsten genetischen Schalter bei, die während der Evolution moderner Büffel stattfanden.

Schlüsselwörter: Indigene iranische Büffelbeimischung Differenzierungsindex Nukleotid-Diversitäts-Selektionssignatur.

© The Author(s) 2020. Herausgegeben von Oxford University Press im Auftrag der Society for Molecular Biology and Evolution.


Frühe Strategien: Shotgun-Sequenzierung und paarweise Endsequenzierung

Bei der Schrotflinten-Sequenzierungsmethode werden mehrere Kopien eines DNA-Fragments zufällig in viele kleinere Stücke geschnitten (ähnlich dem, was mit einer runden Schrotpatrone passiert, wenn sie aus einer Schrotflinte abgefeuert wird). Alle Segmente werden dann unter Verwendung des Kettensequenzierungsverfahrens sequenziert. Dann werden die Fragmente mit Hilfe eines Computers analysiert, um zu sehen, wo sich ihre Sequenzen überschneiden. Durch Angleichen überlappender Sequenzen am Ende jedes Fragments kann die gesamte DNA-Sequenz neu gebildet werden. Eine größere Sequenz, die aus überlappenden kürzeren Sequenzen zusammengesetzt ist, wird als Contig bezeichnet. Stellen Sie sich als Analogie vor, dass jemand vier Kopien eines Landschaftsfotos besitzt, das Sie noch nie zuvor gesehen haben und nicht wissen, wie es aussehen soll. Die Person zerreißt dann jedes Foto mit den Händen, so dass von jeder Kopie verschieden große Stücke vorhanden sind. Die Person mischt dann alle Teile zusammen und bittet Sie, das Foto zu rekonstruieren. In einem der kleineren Stücke sieht man einen Berg. In einem größeren Teil sehen Sie, dass sich derselbe Berg hinter einem See befindet. Ein drittes Fragment zeigt nur den See, aber es zeigt, dass sich am Ufer des Sees eine Hütte befindet. Wenn Sie sich also die überlappenden Informationen in diesen drei Fragmenten ansehen, wissen Sie, dass das Bild einen Berg hinter einem See zeigt, an dessen Ufer eine Hütte steht. Dies ist das Prinzip hinter der Rekonstruktion ganzer DNA-Sequenzen mittels Shotgun-Sequenzierung.

Ursprünglich analysierte die Shotgun-Sequenzierung nur ein Ende jedes Fragments auf Überlappungen. Dies war ausreichend, um kleine Genome zu sequenzieren. Der Wunsch, größere Genome, wie das eines Menschen, zu sequenzieren, führte jedoch zur Entwicklung der Double-Barrel-Shotgun-Sequenzierung, die formaler als Pairwise-End-Sequenzierung bekannt ist. Bei der paarweisen Endsequenzierung werden beide Enden jedes Fragments auf Überlappung analysiert. Die paarweise Sequenzierung ist daher umständlicher als die Shotgun-Sequenzierung, aber es ist einfacher, die Sequenz zu rekonstruieren, da mehr Informationen verfügbar sind.


Gesamtgenom-Sequenzierungsansätze für die Naturschutzbiologie: Vorteile, Grenzen und praktische Empfehlungen

Die Gesamtgenom-Resequenzierung (WGR) ist eine leistungsstarke Methode zur Beantwortung grundlegender evolutionsbiologischer Fragen, die mit traditionellen Methoden nicht vollständig gelöst wurden. WGR umfasst vier Ansätze: die Sequenzierung von Individuen bis zu einer hohen Abdeckungstiefe mit entweder unaufgelösten oder aufgelösten Haplotypen, die Sequenzierung von Populationsgenomen bis zu einer großen Tiefe durch Mischen äquimolarer Mengen unmarkierter individueller DNA (Pool-seq) und die Sequenzierung von multiplen Individuen aus einer Population in eine geringe Tiefe (lcWGR). Diese Techniken erfordern die Verfügbarkeit eines Referenzgenoms. Dies, zusammen mit den immer noch hohen Kosten für die Shotgun-Sequenzierung und dem großen Bedarf an Rechenressourcen und Speicher, hat ihre Implementierung in Nichtmodellarten mit knappen genomischen Ressourcen und in Bereichen wie der Naturschutzbiologie eingeschränkt. Unser Ziel hier ist es, die verschiedenen WGR-Methoden, ihre Vor- und Nachteile sowie mögliche Anwendungen in der Naturschutzbiologie zu beschreiben. WGR bietet eine beispiellose Markerdichte und erfasst eine große Vielfalt genetischer Variationen, die nicht auf einzelne Nukleotidpolymorphismen beschränkt sind (z. B. Strukturvarianten und Mutationen in regulatorischen Elementen). Identifizierung der genetischen Grundlage phänotypischer Merkmale und Krankheiten. Derzeit erfüllt jedoch kein einzelner WGR-Ansatz alle Anforderungen der Erhaltungsgenetik, und jede Methode hat ihre eigenen Grenzen und Quellen potenzieller Verzerrungen. Wir diskutieren Vorschläge zur Minimierung solcher Verzerrungen. Wir stellen uns eine nicht ferne Zukunft vor, in der die Analyse ganzer Genome in vielen Nichtmodellarten und -bereichen, einschließlich der Naturschutzbiologie, zu einer Routineaufgabe wird.

Schlüsselwörter: Pool-seq Konservierungsbiologie Low-Coverage-Sequenzierung Management Populationsgenomik Sequenzierung des gesamten Genoms.


Verwendung von Gesamtgenomsequenzen von Modellorganismen

Der britische Biochemiker und Nobelpreisträger Fred Sanger verwendete ein bakterielles Virus, den Bakteriophagen fx174 (5368 Basenpaare), um das erste Genom vollständig zu sequenzieren. Andere Wissenschaftler sequenzierten später mehrere andere Organellen- und Virusgenome. Der amerikanische Biotechnologe, Biochemiker, Genetiker und Geschäftsmann Craig Venter sequenzierte das Bakterium Haemophilus influenzae in den 1980er Jahren. Etwa 74 verschiedene Labors arbeiteten an der Sequenzierung des Genoms der Hefe Saccharomyces cerevisiae, das 1989 begann und 1996 abgeschlossen wurde, da es 60-mal größer war als jede andere Genomsequenzierung. Bis 1997 lagen die Genomsequenzen zweier wichtiger Modellorganismen vor: des Bakteriums Escherichia coli K12 und die Hefe Saccharomyces cerevisiae. Wir kennen inzwischen die Genome anderer Modellorganismen, wie der Maus Muskulatur, die Fruchtfliege Drosophila melanogaster, der Nematode Caenorhabditis. elegans, und Menschen Homo sapiens. Forscher betreiben umfangreiche Grundlagenforschung an Modellorganismen, weil sie die Informationen auf genetisch ähnliche Organismen anwenden können. Ein Modellorganismus ist eine Spezies, die Forscher als Modell verwenden, um die biologischen Prozesse in anderen Spezies zu verstehen, die der Modellorganismus repräsentiert. Die Sequenzierung ganzer Genome hilft bei den Forschungsanstrengungen in diesen Modellorganismen. Der Prozess des Anhängens biologischer Informationen an Gensequenzen ist die Genom-Annotation. Das Annotieren von Gensequenzen hilft bei grundlegenden Experimenten in der Molekularbiologie, wie dem Design von PCR-Primern und RNA-Targets.


Biologie 171

Am Ende dieses Abschnitts können Sie Folgendes tun:

Obwohl es in den letzten Jahren erhebliche Fortschritte in den medizinischen Wissenschaften gegeben hat, sind Ärzte immer noch von einigen Krankheiten verwirrt und verwenden die Sequenzierung des gesamten Genoms, um die Wurzel des Problems zu finden. Die Sequenzierung des gesamten Genoms ist ein Prozess, der die DNA-Sequenz eines gesamten Genoms bestimmt. Die Sequenzierung des gesamten Genoms ist ein Brute-Force-Ansatz zur Problemlösung, wenn eine genetische Grundlage im Kern einer Krankheit besteht. Mehrere Laboratorien bieten inzwischen Dienstleistungen zur Sequenzierung, Analyse und Interpretation ganzer Genome an.

Beispielsweise ist die Ganz-Exom-Sequenzierung eine kostengünstigere Alternative zur Ganz-Genom-Sequenzierung. Bei der Exom-Sequenzierung sequenziert der Arzt nur die kodierenden, Exon-produzierenden Regionen der DNA. Im Jahr 2010 verwendeten Ärzte die Sequenzierung des gesamten Exoms, um einen kleinen Jungen zu retten, dessen Darm mehrere mysteriöse Abszesse aufwies. Das Kind hatte mehrere Dickdarmoperationen ohne Linderung. Schließlich führten sie eine Sequenzierung des gesamten Exoms durch, die einen Defekt in einem Signalweg aufdeckte, der die Apoptose (programmierter Zelltod) kontrolliert. Die Ärzte setzten eine Knochenmarktransplantation ein, um diese genetische Störung zu überwinden, was zu einer Heilung des Jungen führte. Er war der erste Mensch, der eine erfolgreiche Behandlung auf der Grundlage einer Ganz-Exom-Sequenzierungsdiagnose erhielt. Heute ist die Sequenzierung des menschlichen Genoms leichter verfügbar und die Ergebnisse sind innerhalb von zwei Tagen für etwa 1000 US-Dollar verfügbar.

In Sequenzierungsprojekten verwendete Strategien

Die grundlegende Sequenzierungstechnik, die in allen modernen Sequenzierungsprojekten verwendet wird, ist die Kettenabbruchmethode (auch bekannt als Didesoxy-Methode), die Fred Sanger in den 1970er Jahren entwickelt hat. Das Kettenabbruchverfahren beinhaltet die DNA-Replikation einer einzelsträngigen Matrize unter Verwendung eines Primers und eines regulären Desoxynukleotids (dNTP), das ein Monomer ist, oder eine einzelne DNA-Einheit. Primer und dNTP mischen sich mit einem kleinen Anteil fluoreszenzmarkierter Didesoxynukleotide (ddNTPs). Die ddNTPs sind Monomere, denen eine Hydroxylgruppe (–OH) an der Stelle fehlt, an der normalerweise ein anderes Nukleotid anlagert, um eine Kette zu bilden ((Abbildung)). Wissenschaftler kennzeichnen jedes ddNTP mit einer anderen Fluorophorfarbe. Jedes Mal, wenn ein ddNTP in den wachsenden komplementären Strang eingebaut wird, beendet es den DNA-Replikationsprozess, was zu mehreren kurzen Strängen replizierter DNA führt, die jeweils an einem anderen Punkt während der Replikation enden. Wenn die Gelelektrophorese das Reaktionsgemisch nach der Auftrennung in Einzelstränge verarbeitet, bilden die mehreren neu replizierten DNA-Stränge aufgrund der unterschiedlichen Größen eine Leiter. Da die ddNTPs fluoreszenzmarkiert sind, spiegelt jede Bande auf dem Gel die Größe des DNA-Strangs und das ddNTP wider, das die Reaktion beendet hat. Die unterschiedlichen Farben der Fluorophor-markierten ddNTPs helfen, das an dieser Position eingebaute ddNTP zu identifizieren. Das Ablesen des Gels anhand der Farbe jeder Bande auf der Leiter erzeugt die Sequenz des Matrizenstrangs ((Abbildung)).



Frühe Strategien: Shotgun-Sequenzierung und paarweise Endsequenzierung

Bei der Schrotflinten-Sequenzierungsmethode werden mehrere DNA-Fragmentkopien zufällig in viele kleinere Stücke geschnitten (ähnlich dem, was mit einer runden Schrotpatrone passiert, wenn sie aus einer Schrotflinte abgefeuert wird). Alle Segmente sequenzieren unter Verwendung der Kettensequenzierungsmethode. Anschließend können Wissenschaftler mit Hilfe des Sequenzcomputers die Fragmente analysieren, um zu sehen, wo sich ihre Sequenzen überschneiden. Durch den Abgleich überlappender Sequenzen an den Enden jedes Fragments können Wissenschaftler die gesamte DNA-Sequenz umformen. Eine größere Sequenz, die aus überlappenden kürzeren Sequenzen zusammengesetzt ist, wird als Contig bezeichnet. Stellen Sie sich als Analogie vor, dass jemand vier Kopien eines Landschaftsfotos besitzt, das Sie noch nie zuvor gesehen haben und nicht wissen, wie es aussehen soll. Die Person zerreißt dann jedes Foto mit den Händen, so dass von jeder Kopie verschieden große Stücke vorhanden sind. Die Person mischt dann alle Teile zusammen und bittet Sie, das Foto zu rekonstruieren. In einem der kleineren Stücke sieht man einen Berg. In einem größeren Teil sehen Sie, dass sich derselbe Berg hinter einem See befindet. Ein drittes Fragment zeigt nur den See, aber es zeigt, dass sich am Ufer des Sees eine Hütte befindet. Wenn Sie sich also die überlappenden Informationen in diesen drei Fragmenten ansehen, wissen Sie, dass das Bild einen Berg hinter einem See zeigt, an dessen Ufer eine Hütte steht. Dies ist das Prinzip hinter der Rekonstruktion ganzer DNA-Sequenzen mittels Shotgun-Sequenzierung.

Ursprünglich analysierte die Shotgun-Sequenzierung nur ein Ende jedes Fragments auf Überlappungen. Dies war ausreichend, um kleine Genome zu sequenzieren. Der Wunsch, größere Genome, wie das eines Menschen, zu sequenzieren, führte jedoch zur Entwicklung der Double-Barrel-Shotgun-Sequenzierung oder Pairwise-End-Sequenzierung. Bei der paarweisen Endsequenzierung analysieren Wissenschaftler die Enden jedes Fragments auf Überlappung. Die paarweise Sequenzierung ist daher umständlicher als die Shotgun-Sequenzierung, aber es ist einfacher, die Sequenz zu rekonstruieren, da mehr Informationen verfügbar sind.

Sequenzierung der nächsten Generation

Seit 2005 werden automatisierte Sequenzierungstechniken, die von Labors verwendet werden, unter dem Dach der Next-Generation-Sequenzierung zusammengefasst, einer Gruppe automatisierter Techniken, die für die schnelle DNA-Sequenzierung verwendet werden. Diese automatisierten, kostengünstigen Sequenzer können innerhalb eines Tages Sequenzen von Hunderttausenden oder Millionen kurzer Fragmente (25 bis 500 Basenpaare) generieren. Diese Sequenzer verwenden eine ausgeklügelte Software, um den mühsamen Prozess des Ordnens aller Fragmente zu bewältigen.

Vergleichen von Sequenzen Ein Sequenz-Alignment ist eine Anordnung von Proteinen, DNA oder RNA. Wissenschaftler verwenden es, um ähnliche Regionen zwischen Zelltypen oder Arten zu identifizieren, die auf eine Funktions- oder Strukturerhaltung hinweisen können. Wir können Sequenz-Alignments verwenden, um phylogenetische Bäume zu konstruieren. Die folgende Website verwendet ein Softwareprogramm namens BLAST (Basic Local Alignment Search Tool).

Klicken Sie unter "Basic Blast" auf "Nucleotid Blast". Geben Sie die folgende Sequenz in das große Feld “query sequence” ein: ATTGCTTCGATTGCA. Suchen Sie unter dem Feld das Feld “Species” und geben Sie “human” oder “Homo sapiens” ein. Klicken Sie dann auf "BLAST", um
Vergleichen Sie die eingegebene Sequenz mit den bekannten Sequenzen des menschlichen Genoms. Das Ergebnis ist, dass diese Sequenz an über hundert Stellen im menschlichen Genom vorkommt. Scrollen Sie unter der Grafik mit den horizontalen Balken nach unten und Sie sehen eine kurze Beschreibung zu jedem der passenden Treffer. Wählen Sie einen der Treffer oben in der Liste aus und klicken Sie auf “Graphics”. Dadurch gelangen Sie zu einer Seite, die die Position der Sequenz im gesamten menschlichen Genom anzeigt. Sie können den Schieberegler, der wie eine grüne Flagge aussieht, hin und her bewegen, um die Sequenzen direkt um das ausgewählte Gen herum anzuzeigen. Sie können dann zu Ihrer ausgewählten Sequenz zurückkehren, indem Sie auf die Schaltfläche “ATG” klicken.

Verwendung von Gesamtgenomsequenzen von Modellorganismen

Der britische Biochemiker und Nobelpreisträger Fred Sanger verwendete ein bakterielles Virus, den Bakteriophagen fx174 (5368 Basenpaare), um das erste Genom vollständig zu sequenzieren. Andere Wissenschaftler sequenzierten später mehrere andere Organellen- und Virusgenome. Der amerikanische Biotechnologe, Biochemiker, Genetiker und Geschäftsmann Craig Venter sequenzierte das Bakterium Haemophilus influenzae in den 1980er Jahren. Etwa 74 verschiedene Labors arbeiteten an der Sequenzierung des Genoms der Hefe Saccharomyces cerevisiae, das 1989 begann und 1996 abgeschlossen wurde, da es 60-mal größer war als jede andere Genomsequenzierung. Bis 1997 lagen die Genomsequenzen zweier wichtiger Modellorganismen vor: des Bakteriums Escherichia coli K12 und die Hefe Saccharomyces cerevisiae. Wir kennen inzwischen die Genome anderer Modellorganismen, wie der Maus Muskulatur, die Fruchtfliege Drosophila melanogaster, der Nematode Caenorhabditis. elegans, und Menschen Homo sapiens. Forscher betreiben umfangreiche Grundlagenforschung an Modellorganismen, weil sie die Informationen auf genetisch ähnliche Organismen anwenden können. Ein Modellorganismus ist eine Spezies, die Forscher als Modell verwenden, um die biologischen Prozesse in anderen Spezies zu verstehen, die der Modellorganismus repräsentiert. Die Sequenzierung ganzer Genome hilft bei den Forschungsanstrengungen in diesen Modellorganismen. Der Prozess des Anhängens biologischer Informationen an Gensequenzen ist die Genom-Annotation. Das Annotieren von Gensequenzen hilft bei grundlegenden Experimenten in der Molekularbiologie, wie dem Design von PCR-Primern und RNA-Targets.

Gehen Sie jeden Schritt der Genomsequenz in DNA Sequence Assembly (Webseite, interaktiv) durch.

Verwendungen von Genomsequenzen

DNA-Mikroarrays sind Methoden, mit denen Wissenschaftler die Genexpression nachweisen, indem sie verschiedene DNA-Fragmente analysieren, die auf einem Glasobjektträger oder einem Siliziumchip fixiert sind, um aktive Gene und Sequenzen zu identifizieren. Mit Microarrays können wir fast eine Million genotypische Anomalien entdecken, während die Sequenzierung des gesamten Genoms Informationen über alle sechs Milliarden Basenpaare im menschlichen Genom liefern kann. Obwohl das Studium der medizinischen Anwendungen der Genomsequenzierung interessant ist, beschäftigt sich diese Disziplin mit abnormalen Genfunktionen. Die Kenntnis des gesamten Genoms wird es Forschern ermöglichen, künftig auftretende Krankheiten und andere genetische Störungen frühzeitig zu entdecken. Dies ermöglicht fundiertere Entscheidungen über Lebensstil, Medikamente und Kinderwunsch. Die Genomik steckt noch in den Kinderschuhen, obwohl es eines Tages zur Routine werden könnte, jedes Neugeborene mit der Sequenzierung des gesamten Genoms auf genetische Anomalien zu untersuchen.

Neben Krankheiten und Medizin kann die Genomik zur Entwicklung neuartiger Enzyme beitragen, die Biomasse in Biokraftstoff umwandeln, was zu einer höheren Pflanzen- und Kraftstoffproduktion und niedrigeren Verbraucherkosten führt. Dieses Wissen sollte bessere Methoden zur Kontrolle der Mikroben ermöglichen, die die Industrie zur Herstellung von Biokraftstoffen verwendet. Genomik könnte auch Überwachungsmethoden verbessern, die die Auswirkungen von Schadstoffen auf Ökosysteme messen und zur Beseitigung von Umweltschadstoffen beitragen. Genomics hat bei der Entwicklung von Agrochemikalien und Pharmazeutika geholfen, die der Medizin und der Landwirtschaft zugute kommen könnten.

Es klingt großartig, all das Wissen zu haben, das wir aus der Sequenzierung des gesamten Genoms gewinnen können, aber der Mensch hat die Verantwortung, dieses Wissen mit Bedacht zu nutzen. Andernfalls könnte es leicht sein, die Macht dieses Wissens zu missbrauchen, was zu Diskriminierung aufgrund der Genetik einer Person, der menschlichen Gentechnik und anderer ethischer Bedenken führt. Diese Informationen können auch zu rechtlichen Problemen in Bezug auf Gesundheit und Datenschutz führen.

Abschnittszusammenfassung

Die Sequenzierung des gesamten Genoms ist die neueste verfügbare Ressource zur Behandlung genetischer Krankheiten. Einige Ärzte verwenden die Sequenzierung des gesamten Genoms, um Leben zu retten. Genomik hat viele industrielle Anwendungen, darunter die Entwicklung von Biokraftstoffen, die Landwirtschaft, die Pharmazie und die Kontrolle der Umweltverschmutzung. Das Grundprinzip aller modernen Sequenzierungsstrategien ist die Kettenabbruchmethode der Sequenzierung.

Obwohl die menschlichen Genomsequenzen Medizinern wichtige Erkenntnisse liefern, verwenden Forscher vollständige Genomsequenzen von Modellorganismen, um das Genom der Spezies besser zu verstehen. Die Automatisierung und die geringeren Kosten für die Sequenzierung des gesamten Genoms können in Zukunft zu einer personalisierten Medizin führen.

Glossar


Sequenzierung des gesamten Genoms

Von ⁠Dr. Brandon Colby MD, ein Arzt-Experte in den Bereichen Genomik und personalisierte Präventivmedizin.

Du hast vielleicht schon Begriffe gehört wie Sequenzierung des gesamten Genoms und Genomik und dachte, dass sie klingen, als wären sie direkt aus dem Drehbuch für einen futuristischen Film. Aber in Wirklichkeit sind Sequenzierungstechnologien in vielen Teilen der Welt leicht verfügbar und können sehr nützlich sein, um mehr über die menschliche Genetik und unsere eigene Gesundheit zu verstehen.

Das menschliche Genom enthält eine Fülle von Informationen über jeden von uns, von unserer Abstammung bis hin zu unserem Risiko, bestimmte genetische Krankheiten zu entwickeln oder an unsere Kinder weiterzugeben. As a result, it’s no wonder DNA sequencing is becoming a widely used tool in both research and healthcare.

What Is Whole Genome Sequencing?

Put simply, whole genome sequencing (WGS) is a genetic testing technology that allows us to determine how our DNA is confirmed. In order to understand this testing procedure better, let’s take a look at what DNA is, how it’s formed, and what it does.

Deoxyribonucleic acid, more commonly known as DNA, is the molecule that contains all living organisms’ genetic codes. All the living beings that have been identified and examined contain DNA, from complex mammals such as humans to simple organisms like bacteria.

DNA is made up of molecules called nucleotides. These nucleotides act as the basic building blocks of our DNA and are composed of three distinct parts:

The nitrogenous base portion of each nucleotide can be adenine (A), cytosine (C), guanine (G), and thymine (T). These bases are “strung together” during DNA replication. Practically all the cells that exist in our bodies contain DNA, with only a few known exceptions — such as mature hair cells.

The nitrogenous bases are replicated in a specific order, and they form base pairs by binding to a base from a parallel strand — A always binds to T, while C always binds to G —, forming the familiar double helix DNA image that we all know. One of the key features of DNA is that it can replicate itself constantly to create new cells that are identical to their parental cell.

Understanding the Science of DNA

While DNA is formed by two strands of nucleotides that are bound together, a simpler molecule called RNA is formed by a single strand. In humans, RNA molecules act as a messenger and transfer molecules that carry genetic information during the DNA transcription process.

Nitrogenous bases are the portion of our DNA that contains genetic information, and the “patterns” created by these bases in our DNA determine our genetic makeup - specific DNA sequences form genes. Each gene has coding regions that function almost like a blueprint for cells since they contain “instructions” that tell cells in our body how to synthesize amino acids to form different proteins.

There are only 20 amino acids, but they can be combined in different ways to create thousands of different proteins, each with its own structure and function. Proteins carry out a wide range of processes inside our bodies, depending on their type. If there are abnormal variations in our DNA sequence, these instructions could be faulty and lead to various health issues.

However, not all of our DNA is conformed by protein-coding genes — in fact, nearly 99 percent of all our DNA is made up of non-coding DNA, meaning that it doesn’t contain instructions for protein-coding. For a long time, scientists thought that non-coding DNA didn’t have a specific function however, we’re learning more about the purpose of non-coding DNA every day.

Some parts of our non-coding DNA act as regulatory agents that activate or repress DNA transcription, whereas others contain instructions for the synthesis of RNA, among other functions. Therefore, sequencing our non-coding DNA and RNA can also tell us a lot about human health, since it also plays an important role in genetics.

Chromosomes are long strands of DNA that contain our genes — humans normally have 23 pairs of chromosomes. We each receive two versions of the same gene — one from each of our biological parents. The different versions of a gene are called alleles, and they determine the biological traits that we will express, such as eye or hair color.

Some alleles are dominant (meaning that you only need one copy of the same allele to express its associated characteristic), whereas others are recessive (meaning that you need to inherit two copies of the same allele to express that characteristic). This explains why DNA testing results will be different for everyone, even for full siblings.

The human genome is the compilation of all the genetic information that each person contains, regardless of whether it’s coding or non-coding.

What Is a Whole Genome Sequencing DNA Test

A ⁠whole genome sequencing DNA test is a type of genetic test used to determine the order of the nucleotides that form our entire genome — both coding and non-coding —, allowing scientists and physicians to ascertain whether an individual’s DNA sequence contains any abnormalities.

Genetic testing offers a wide array of benefits for scientific research, genetic counseling, individualized medical care, and even public health initiatives.

The original technology used for whole genome sequencing was called Sanger sequencing or chain termination method, and it was invented in 1977. Although this method was revolutionary for its time, it was also very slow and expensive.

When DNA testing was first used, the data analysis required to sequence just one person’s DNA could take years to complete.

The Sanger method was later automated to make the process faster the automated version of this method was used to complete portions of the Human Sequencing Project, which was a wide-scale, international project that sequenced the base pairs that make up human DNA for the first time.

The Sanger method is still used today to sequence shorter DNA fragments, but newer sequencing methods have made the turnaround time of DNA tests faster while reducing sequencing costs.

These methods also called high-throughput or next-generation sequencing methods have made large-scale DNA testing accessible to a wider audience since they only require a few days to analyze a genome test while still producing high-quality results.

There are several types of DNA tests, and each process genetic information differently and for different purposes. Some types of DNA testing include:

  • Whole genome sequencing (WGS)
    • ​As stated above, WGS sequences the entirety of our genome data, including both coding and non-coding DNA. As its name suggests, this type of genetic testing can identify variations in any part of your genome.
    • Available from Sequencing.com, Illumina, and Oxford Nanopore.
    • Rather than sequencing an individual’s entire genome, this test only sequences the parts of their DNA and RNA that contain coding instructions, which are also known as exons. Many of the genetic mutations that lead to genetic disorders happen in the exome (which is the combination of all our exons), which is why this test can still be very useful despite the fact that it doesn’t analyze your entire genome.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • ​This method isolates specific regions of DNA to analyze them for mutations. This technique can identify variations in specific genes, which can be very useful if you only need to diagnose or rule out distinct variations — for example, when screening for a particular genetic disease.
    • Available from Illumina, GeneDx, and Ambry Genetics.
    • This test measures the variations of single nucleotide polymorphisms (SNPs) against reference genome fragments from members of the same species. SNPs are variations that occur in a single base pair of your DNA. SNPs are the most common type of genetic variation, and SNP genotyping can determine the set of variants that are present in a person’s DNA. Single SNP annotations can also be used in conjunction with WGS to assess the frequency of rare genetic variants and their consequences.
    • Available from Sequencing.com, 23andMe, Ancestry.com, MyHeritage, and FamilyTreeDNA.

    Whole genome sequencing and other sequencing methods shouldn’t be confused with DNA profiling, which is simply used to determine the likelihood of a DNA sample coming from a specific source. DNA profiling is widely used to help solve criminal investigations, but it doesn’t provide any further genomic data.

    Purpose of Whole Genome Sequencing

    For most of known history, human genetics and the role that genes play in our health were a mystery. In fact, DNA and genes are a relatively modern concept — the molecular structure of DNA was only identified in the 1950s. But thanks to the advent of DNA sequencing, scientists can now analyze raw DNA data to understand human health, how certain diseases work, and what we can do to prevent or treat illnesses more efficiently.

    The main objective behind DNA tests, in general, is to identify whether there are any mutations in your DNA that could cause health problems. These tests can also provide information about your genealogy, which can be fascinating on a personal level but also helpful when it comes to determining your risk for certain diseases.

    The information provided by genetic testing is also important for public health since it can be used to guide interventions and individualize them according to the genetic characteristics of different population groups.

    Genome Sequencing and Personalized Medicine

    Whole genome sequencing will play a very big role in the future of personalized medicine. For example, whole genome sequencing provides enough data to personalize therapeutic approaches and treatments to diseases so you’re most likely to receive a treatment that will provide the most benefit with the least risk of side effects.

    Instead of using the same treatment on all patients who suffer from the same condition, physicians could use sequencing data to individualize each patient’s management.

    These advancements wouldn’t just potentially improve patients’ outcomes — they could also help create a more comfortable patient experience since patients won’t have to test different treatments in order to find the right fit for them. Additionally, it could help lower healthcare costs and improve the workflow at medical facilities by providing a straightforward way to decide between different treatment options.

    DNA testing is also used in prenatal genetic counseling, especially for future parents who have a family history of genetic diseases or pregnancy loss. In some cases, genetic testing may be necessary to understand the cause of a patient’s fertility issues. WGS could also be used to detect illnesses and genetic abnormalities in unborn fetuses.

    Whole genome sequencing hasn’t been exclusively applied to humans. Sequencing the DNA of bacterial organisms and other pathogens can help scientists understand the disease better, determine the origin of new mutations, synthesize new medications and vaccines, combat drug-resistant pathogens, and even contain outbreaks of contagious diseases around the world.

    What Can Whole Genome Sequencing Reveal?

    One of the main reasons why whole genome sequencing tests have become so popular is because they help ascertain your predisposition to certain diseases. Specific variations in your DNA sequence can cause genetic disorders some of these mutations are inherited from one or both parents, whereas other variations occur de novo — meaning that this is the first time that this variation is present in a member of a family.

    But DNA sequencing can also tell us a lot about non-genetic disorders. When we think of genetic testing, our mind immediately goes to inherited rare diseases, but DNA testing can tell you whether you’re at risk of developing more common health conditions, such as high blood pressure or diabetes.

    This information can also inform other family members of possible health risks, even if they’re not the ones who took the DNA test.

    Some patients may be advised by their physician to take a DNA sequencing test to provide an accurate diagnosis for their symptoms after failing to discover their cause through other methods — WGS has been successfully used to diagnose genetic disorders in gravely-ill children and to modify the therapeutic management they received.

    Others may simply choose to take a DNA test to learn more about their ancestry. Since WGS analyzes your entire genome, it may reveal unexpected variations that aren’t currently related to any physical symptoms. These variations are often called “secondary findings”.

    Keep in mind that not all genetic variations will automatically generate a disease. Certain genetic changes increase a person’s risk of developing a health condition, such as breast cancer. Depending on the disease, this predisposition can be mitigated through medical treatment or lifestyle changes.

    Other genetic variants are benign and don’t affect our health at all. And in other cases, the exact implications of a genetic variant are still unknown — these variants are also known as “variants of uncertain significance”. It’s always important to discuss the results of your sequencing test with a specialist, such as a geneticist.

    WGS can also reveal your ancestry with a significant degree of accuracy. To do so, a sequencing service will compare the SNPs in your DNA against reference sequences from specific ethnic populations.

    SNPs have been found to be inherited through generations, which is why they’re reliable indicators that can be used to compare your DNA against different populations around the world, thus determining your most likely DNA ancestry. For this reason, SNP sequencing is also valuable in the field of evolutionary biology.

    How Is Whole Genome Sequencing Done

    In the past, genotyping human DNA was a long and expensive process — in fact, the Human Genome Project lasted 13 years —, but now, you can use a DNA kit from the comfort of your own home and get results in a few weeks.

    There are several modern DNA sequencing methods, including:

    • Illumina dye sequencing
    • Pyrosequencing
    • Single-molecule real-time (SMRT) sequencing
    • Nanopore sequencing

    In most cases, once you purchase a commercial direct-to-consumer sequencing test, you’ll receive a collection kit that you’ll be able to use at home. You’ll be instructed to swab the inside of your cheek and place the swab inside a labeled container before shipping it back to the provider.

    Collecting samples using these DNA testing kits is safe, quick, and painless. In other cases, the sample may be collected at a doctor’s office or lab.

    Since the human genome contains so much information, DNA tests can’t analyze it all at once. Instead, these methods use different techniques to break DNA into smaller pieces, and a sequencer is used to determine the order of the nucleotides in each of these DNA fragments. Then, bioinformatic technology is used to put all the pieces back together correctly so that they can be analyzed.

    Whole Genome Sequencing Results

    Depending on the type of DNA test that you’ve purchased, you’ll receive your results in a few days or weeks. Whole genome sequencing provides the most comprehensive type of genomic characterization that is currently available. Each whole genome sequencing test generates a colossal amount of data — after all, the human genome contains approximately 3 billion base pairs.

    But you won’t be receiving the sequencing results of 3 billion base pairs after mailing your DNA test kit back to the provider, of course. This amount of information would be practically impossible to process, even for a healthcare provider or scientist.

    Instead, your results will detail pertinent information regarding your health and genetic makeup. WGS can identify many types of variations in your DNA, such as single nucleotide variants, insertion/deletion (indel) polymorphisms in a specific nucleotide sequence, structural variants, copy number variants, among others.

    The results of a DNA testing kit can provide a wide range of information, including:

    • Single-gene or Mendelian disorders: as their name suggests, these disorders affect a single gene.
      • Your WGS will determine whether you suffer from one of these disorders or are at risk of developing one later on or passing one down to your children.
      • Single-gene disorders include sickle cell anemia, Huntington’s disease, cystic fibrosis, or muscular dystrophy.
      • As we mentioned earlier, this also means that your risk of developing these diseases can often be mitigated through medical intervention or a healthier lifestyle.
      • Some of these conditions include obesity, hypertension, and diabetes.
      • This data can be used to provide individualized medical care, decrease drug toxicity, and adjust medication dosages.

      Additionally, whole genome sequencing can also provide information regarding your ethnicity, ancestry, overall health and wellbeing, nutrition and fitness insights, and much more.

      Whole Genome Sequencing Cost

      Once upon a time — or really, just a few short decades ago — it would have been practically impossible for a private individual to cover the costs of having their DNA sequenced.

      But newer high-throughput sequencing methods can handle whole genomes quickly. In fact, certain modern sequencer machines (also called sequencing “platforms”) can even provide same-day results for small DNA fragments.

      As the processes involved in DNA sequencing have become faster and easier to access, the costs associated with testing have also gone down.

      As recently as 2009, genomic testing could cost approximately $50,000 per individual genome. Now, several companies offer whole genome sequencing for anywhere between $400 to $600, although some companies do charge higher prices.

      Whole Genome Sequencing Service

      In recent years, more and more biotechnology companies have started to offer genetic tests. Illumina is one of the biggest stakeholders in the field of genomics, having patented several different sequencer machines and DNA tests. They offer various sequencing platforms to fit different needs, from traditional whole-genome sequencing platforms used in clinics and research labs, to sequencers that can identify specific diseases.

      Other major genomics companies include Thermo Fisher Scientific and Oxford Nanopore Technologies — the latter of which created an innovative USB sequencer that can be attached to a desktop computer, opening the possibility of portable and convenient DNA sequencing tests.

      Pacific Biosciences is another important biotechnology company. They have introduced a type of real-time sequencing technology that is able to provide the longest DNA reads to date — 10,000 base pairs at once, compared to approximately 150 base pairs at once through other sequencing platforms. If perfected, this new approach could make DNA testing even faster and more accessible than ever before.

      Other companies that provide DNA sequencing include Knome, Sequenom, 454 Life Sciences, Life Sciences, BGI, Helicos Biosciences, Veritas Genetics, Complete Genomics, Affymetrix, and IBM, among others. Not surprisingly, the advent of new whole genomic sequencing technologies has generated public discussion surrounding their ethical implications, and the need to ensure the privacy of individuals who choose to take one of these DNA tests.

      We can’t stress how important it is to research your chosen provider before taking a genome test in order to understand their privacy and data protection policies.

      If you want to learn more about whole genome sequencing, head over to our education center to discover more in-depth articles on this innovative technique.

      1. Rui Yin, Chee Keong Kwoh, Jie Zheng. ⁠Whole Genome Sequencing Analysis. Encyclopedia of Bioinformatics and Computational Biology, Academic Press, 2019, Pages 176-183. ISBN 9780128114322.
      2. University of Leicester. ⁠Gene Expression and Regulation. Retrieved 2021 March 9.
      3. ⁠What are whole exome sequencing and whole genome sequencing? Medline Plus. Retrieved 2021 March 9.
      4. Razvan Cojocaru, Peter J Unrau. ⁠Origin of life: Transitioning to DNA genomes in an RNA world. Simon Fraser University, Canada. Nov 1, 2017. eLife 20176:e32330 DOI: 10.7554/eLife.32330.
      5. Center for Genomics and Global Health. ⁠Why genomics? Retrieved 2021 March 9.
      6. Steinberg, K. M., Okou, D. T., & Zwick, M. E. (2008). ⁠Applying rapid genome sequencing technologies to characterize pathogen genomes. Analytical Chemistry, 80(3), 520–528.
      7. Lewis, T. (2013, April 14). ⁠Human genome project marks 10th anniversary. In LiveScience. Retrieved 2021 March 9.
      8. National Human Genome Research Institute. (2016, January 15). ⁠DNA sequencing costs. In Large-scale genome sequencing and analysis centers (LSAC). Retrieved 2021 March 9.
      9. Fermín J. González-Melado, Chapter 12 - ⁠Whole-Genome Sequencing as a Method of Prenatal Genetic Diagnosis. Clinical Ethics At the Crossroads of Genetic and Reproductive Technologies, Academic Press, 2018, Pages 263-291, ISBN 9780128137642.
      10. Thermo Fisher Scientific. (2016). ⁠Sanger sequencing method. In Sanger Sequencing. Retrieved 2021 March 9.
      11. Thomas PE, Klinger R, Furlong LI, Hofmann-Apitius M, Friedrich CM (2011). ⁠Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers. BMC Bioinformatik. 12 Suppl 4: S4. DOI:10.1186/1471-2105-12-S4-S4.
      12. Mizzi C, Peters B, Mitropoulou C, Mitropoulos K, Katsila T, Agarwal MR, van Schaik RH, Drmanac R, Borg J, Patrinos GP. ⁠Personalized pharmacogenomics profiling using whole-genome sequencing. Pharmacogenomics. 2014 Jun15(9):1223-34.

      ⁠Dr. Brandon Colby MD is a US physician specializing in the personalized prevention of disease through the use of genomic technologies. He’s an expert in genetic testing, genetic analysis, and precision medicine. Dr. Colby is also the Founder of Sequencing.com and the author of ⁠Outsmart Your Genes.

      Dr. Colby holds an MD from the Mount Sinai School of Medicine, an MBA from Stanford University’s Graduate School of Business, and a degree in Genetics with Honors from the University of Michigan. He is an Affiliate Specialist of the American College of Medical Genetics and Genomics (⁠ACMG), an Associate of the American College of Preventive Medicine (⁠ACPM), and a member of the National Society of Genetic Counselors (⁠NSGC)


      Sequencing breakthroughs for genomic ecology and evolutionary biology

      Techniques involving whole-genome sequencing and whole-population sequencing (metagenomics) are beginning to revolutionize the study of ecology and evolution. This revolution is furthest advanced in the Bacteria and Archaea, and more sequence data are required for genomic ecology to be fully applied to the majority of eukaryotes. Recently developed next-generation sequencing technologies provide practical, massively parallel sequencing at lower cost and without the requirement for large, automated facilities, making genome and transcriptome sequencing and resequencing possible for more projects and more species. These sequencing methods include the 454 implementation of pyrosequencing, Solexa/Illumina reversible terminator technologies, polony sequencing and AB SOLiD. All of these methods use nanotechnology to generate hundreds of thousands of small sequence reads at one time. These technologies have the potential to bring the genomics revolution to whole populations, and to organisms such as endangered species or species of ecological and evolutionary interest. A future is now foreseeable where ecologists may resequence entire genomes from wild populations and perform population genetic studies at a genome, rather than gene, level. The new technologies for high throughput sequencing, their limitations and their applicability to evolutionary and environmental studies, are discussed in this review.


      Informationen zum Autor

      These authors contributed equally: Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong.

      Mitgliedschaften

      School of Life Sciences, Simon F.S. Li Marine Science Laboratory, State Key Laboratory of Agrobiotechnology, The Chinese University of Hong Kong, Hong Kong, China

      Wenyan Nong, Zhe Qu, Yiqian Li, Tom Barton-Owen, Annette Y. P. Wong, Ho Yin Yip, Hoi Ting Lee, Satya Narayana, Jianquan Cao & Jerome H. L. Hui

      Centre for Ecology and Conservation, University of Exeter, Penryn, UK

      Tobias Baril & Alexander Hayward

      Dovetail Genomics, Scotts Valley, CA, USA

      State Key Laboratory of Agrobiotechnology, School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      Ting Fung Chan & Sai Ming Ngai

      School of Life Sciences, The Chinese University of Hong Kong, Hong Kong, China

      School of Biological Sciences, The University of Hong Kong, Hong Kong, China

      Leibniz Institute of Natural Product Research and Infection Biology – Hans Knöll Institute, Jena, Germany

      Department of Ocean Science and Hong Kong Branch of Southern Marine Science and Engineering Guangdong Laboratory (Guangzhou), Hong Kong University of Science and Technology, Hong Kong, China

      Department of Biology, Hong Kong Baptist University, Hong Kong, China

      Department of Computer Science and Engineering, The Chinese University of Hong Kong, Hong Kong, China

      Institute of Marine Biotechnology, Universiti Malaysia Terengganu, Terengganu, Malaysia

      Department of Bioscience and Biotechnology, Fakir Mohan University, Balasore, India

      Institute of Tropical Biodiversity and Sustainable Development, University Malaysia Terengganu, 20130, Kuala Nerus, Terengganu, Malaysia

      Research Division, Association for Biodiversity Conservation and Research (ABC), Odisha, 756003, India

      Institute of Oceanography and Maritime Studies (INOCEM), Kulliyyah of Science, International Islamic University, Kuantan, Malaysia

      Department of Cell and Systems Biology, University of Toronto, Toronto, Canada

      Department of Biology, Queen’s University, Toronto, Canada

      Department of Chemistry, City University of Hong Kong, Hong Kong, China

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Sie können auch in PubMed Google Scholar nach diesem Autor suchen

      Beiträge

      J.H.L.H. conceived and supervised the study. W.N. carried out the genome assemblies and analyses, gene model predictions, microRNA mapping, and synteny analyses. Z.Q. carried out the microRNA annotation, final checking microRNA copies and arm switching analyses. Y.L. carried out the homeobox gene analyses, synteny analyses, and the SNP analyses in populations. T.B.O. carried out the homeobox gene identifications and tree construction. A.Y.P.W. carried out the gene and microRNA copies analyses and arm switching analyses. H.Y.Y. provided animal husbandry and logistics. H.T.L. carried out novel microRNA analyses. S.N. carried out the population structure analyses. T.B. and A.H. performed the T.E. Analysen. T.S. involved in the final version of genome assembly, and J.C. involved in earlier version of genome assembly. T.F.C., H.S.K., S.M.N., G.P., P.Y.Q., J.W.Q., K.Y.Y., S.S.T., W.G.B., S.G.C., J.H.L.H. applied and obtained the funding. N.I., S.P., A.J., S.G.C. collected and provided samples in field. S.S.T., W.G.C., S.G.C., A.H., J.H.L.H. drafted the first version of the manuscript. All authors provided comments and approved the manuscript.

      Korrespondierender Autor