Information

Allelspezifische Bisulfit-Sequenzierung

Allelspezifische Bisulfit-Sequenzierung


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Wie viel Aufmerksamkeit sollte man bei der Bewertung des Methylierungsstatus an verschiedenen CpG-Stellen nach der Sequenzierung den zufälligen Insertionen und Deletionen einzelner Basenpaare schenken? Angenommen, es gibt ein CA-Dinukleotid; können wir davon ausgehen, dass die CA in der Sequenz nativ ist oder aus einer G-Deletion resultiert, insbesondere wenn letztere im Vergleich zu anderen Sequenzen verdächtig ist. Gibt es wirklich eine festgelegte Standardsequenz, um das zu vergleichen?


Ich stimme Vance zu, wir brauchen etwas mehr Details, um Ihre Frage besser beantworten zu können. Soweit ich das beurteilen kann, fragen Sie sich, ob ein einzelner Nukleotidpolymorphismus (SNP), der zur Addition einer Cytosinbase an Ihre Sequenz führt, bei der Untersuchung der Methylierungssignatur dieser Sequenz von Belang ist.

Ich würde zuerst mit NCBI feststellen, ob der Polymorphismus in der Bevölkerung verbreitet ist. Je häufiger der Polymorphismus ist, desto weniger wahrscheinlich ist es, dass er schwerwiegende Auswirkungen hat. Das heißt jedoch nicht, dass es keine Wirkung hat.

Ich würde dann untersuchen, wie stark die Methylierung dieser einen Stelle im Vergleich zu Proben ohne die zusätzliche Cytosinbase variiert.

Abschließend möchte ich die Bedeutung des Standorts des SNP feststellen. Befindet es sich auf einer CpG-Insel? Oder liegt es am Ufer, an den Schelfen oder auf dem „offenen Meer“? (siehe Arbeit von Sandoval et al.)

Ohne all das zu wissen, ist es schwer zu sagen, wie wichtig/unwichtig der SNP in Ihrer Methylierungsanalyse ist.


Allel-spezifische Transkriptom- und Methylom-Analyse zeigt stabile Vererbung und Cis-Regulierung der DNA-Methylierung in Nasonia

Affiliations Department of Molecular Biology and Genetics, Cornell University, Ithaca, New York, Vereinigte Staaten von Amerika, Cornell Center for Comparative and Population Genomics, Cornell University, Ithaca, New York, Vereinigte Staaten von Amerika

Zugehörigkeit Department of Biology, University of Rochester, Rochester, New York, Vereinigte Staaten von Amerika

Affiliations Department of Molecular Biology and Genetics, Cornell University, Ithaca, New York, Vereinigte Staaten von Amerika, Cornell Center for Comparative and Population Genomics, Cornell University, Ithaca, New York, Vereinigte Staaten von Amerika


Generieren von Epireads

Das ursprüngliche epiread-Format (vom Methpipe-Team vorgeschlagen) enthält nur Informationen zu CpGs. BISCUIT erweitert dieses Format um SNP-Informationen. Die Spalten im BISCUIT epiread-Format zeigen an:

  1. Chromosomenname
  2. Namen lesen
  3. Position in Paired-End-Sequenzierung lesen
  4. Bisulfit-Strang (Bisulfit Watson (+) oder Bisulfit Crick (-))
  5. Position des Cytosins im ersten CpG (0-basiert)
  6. Retentionsmuster („C“ für Retention oder „T“ für Conversion) für alle abgedeckten CpGs
  7. Position des ersten SNP, wenn eine SNP-Standortdatei bereitgestellt wird
  8. Base Call aller abgedeckten SNPs

Ein Beispiel für das epiread-Format ist:

Um eine epiread-formatierte Datei zu erstellen, müssen Sie den epiread-Unterbefehl mit einer BAM-Datei, einer FASTA-Datei des Referenzgenoms und optional einer BED-Datei für SNPs ausführen.

Die SNP BED-Datei kann durch Ausführen von biscuit vcf2bed -t snp my_pilefup.vcf.gz abgerufen werden. Wenn keine SNP-Datei bereitgestellt wird, enthält die Ausgabe nicht die zusätzlichen Spalten, die sich auf SNPs beziehen. Um das ursprüngliche epiread-Format wiederherzustellen, führen Sie cut -f 1,5,6 für die epiread-Ausgabedatei aus.

Um alle SNP-CpG-Paare zu testen, fügen Sie das Flag -P in Ihre Eingabeaufforderung ein. Beachten Sie, dass Sie bei der Suche nach allelspezifischer Methylierung mit dem Flag -P ausführen und eine SNP-BED-Datei einschließen müssen. Um weitere Hilfe zu verfügbaren Flags zu erhalten, führen Sie im Terminal biscuit epiread aus.


Semisimulierte Allel-spezifische Methylierungsdaten

Wir führten Simulationen durch, um zu bewerten, wie die Leistung unseres Modells mit mehreren kritischen Parametern des zugrunde liegenden Datensatzes zusammenhängt. Um Leistungsmerkmale auf realen Datensätzen abzubilden, haben wir eine Strategie namens „semisimulierte“ Daten verwendet. Die Orte der kartierten Reads wurden realen Daten entnommen, ebenso wie die Orte der CpGs innerhalb der Reads und des zugrunde liegenden Referenzgenoms. Die Methylierungszustände innerhalb dieser Reads wurden gemäß zufällig generierten Allel-spezifischen oder Einzelallel-Methylierungsprofilen bestimmt. Kurz gesagt, innerhalb einer als AMR bezeichneten Region generierten wir zufällig zwei Methylierungsprofile, indem wir einzelne CpG-Methylierungsniveaus als βeta-Varianten, die gegen 0 oder 1 verzerrt waren, untersuchten. Dann ordneten wir jeden Read mit gleicher Wahrscheinlichkeit einem der beiden Allele zu und die Methylierungszustände der CpGs innerhalb des Reads wurden gemäß den Wahrscheinlichkeiten, die durch das diesem Allel entsprechende Methylierungsprofil gegeben sind, entnommen. Eine vollständige Beschreibung dieses Verfahrens finden Sie in der SI-Text.

Bei aktuellen Methylomen aus BS-seq erwarteten wir, dass die Variation der Abdeckung entlang der Chromosomen ein kritischer Faktor für die Leistung unseres Modells ist. Darüber hinaus kann die Variation des Inter-CpG-Abstands unser Verfahren daran hindern, ASM in Regionen mit niedriger CpG-Dichte für eine feste Leselänge zu erfassen. Wir haben untersucht, wie gut unsere Methode ASM in einem bestimmten genomischen Intervall identifizieren kann, indem wir drei unabhängige Variablen manipulieren:

Die mittleren Abdeckungen waren <5×, 10×, 15×>, entsprechend den aktuellen Methylomen aus BS-Seq.

Die Leselängen betrugen <50, 100, 150> Basen, was ungefähr den aktuellen Short-Read-Sequenzierungstechnologien entspricht.

CpG-Dichteverteilungen nahmen drei verschiedene Einstellungen an: CpG-Inseln (CGIs) definiert wie in Ref. 23, Nicht-CGI-Promotoren, definiert als 1 kb stromaufwärts der Transkriptionsstartstelle (TSS) in den Referenzsequenzen des National Center for Biotechnology Information, jedoch nicht in CGIs, und zufällig entnommener genomischer Hintergrund mit einer CpG-Dichte (beobachtet/erwartet) zwischen 0,2 und 0,4.

Details zur Anzahl simulierter Datensätze für jede Parameterkombination finden Sie im SI-Text.

Die Spezifität war im Allgemeinen für alle Simulationsparameterkombinationen sehr hoch (ungefähr 99%), was unser konservatives Modellauswahlkriterium widerspiegelt (Gl. 4 und 5). Im Gegensatz dazu zeigte die Sensitivität eine größere Abhängigkeit von den Eigenschaften der Datensätze. Die Empfindlichkeit war für Regionen mit höherer CpG-Dichte höher, wie erwartet, da unser Modell von den Beziehungen zwischen den CpG-Zuständen innerhalb eines Reads abhängt. Wie in Abb. 1 gezeigt, erreichte die Sensitivität der internen CGIs für alle Leselängen über 95 %, wenn die mittlere Abdeckung über 10× lag. Die Empfindlichkeit erreichte für intergenische Regionen etwa 70 %, erforderte jedoch sowohl eine 10-fache Abdeckung als auch eine Leselänge von 100, was die Abnahme der CpG-Dichte kompensiert. Wie erwartet verbesserten eine größere Abdeckung und Leselänge die Genauigkeit, und der Effekt der Leselänge ist äquivalent zu dem der CpG-Dichte. Diese Ergebnisse zeigen, dass Methylome mit Read-Längen um 100 bp und einer mittleren Abdeckung von mehr als 10× für unser Modell ausreichend erscheinen, um ASM genau zu identifizieren. Diese Kriterien werden von den meisten existierenden Methylomen aus BS-seq-Experimenten erfüllt.

Empfindlichkeit der AMR-Identifikation basierend auf semisimulierten Daten. Es wurden Abdeckungen von 5, 10 und 15× und Leselängen von 50, 100 und 150 bp verwendet. Die CpG-Dichten wurden durch Simulation innerhalb von (EIN) CGIs, (B) Nicht-CGI-Promotorregionen und (C) nicht-CGI-intergene Regionen.


Allelspezifische Methylierung tritt bei genetischen Varianten auf, die mit komplexen Erkrankungen assoziiert sind

Wir vermuten, dass das Phänomen der Allel-spezifischen Methylierung (ASM) den phänotypischen Wirkungen mehrerer Varianten zugrunde liegen könnte, die durch Genome-Wide Association-Studien (GWAS) identifiziert wurden. Wir evaluieren ASM in einer menschlichen Population und dokumentieren seine genomweiten Muster in einem ersten Screening an bis zu 380.678 Stellen innerhalb des Genoms oder bis zu 5% der gesamten genomischen CpGs. Wir zeigen, dass trotz erheblicher interindividueller Variationen 5 % der bewerteten Standorte in mindestens sechs Proben Anzeichen von ASM aufweisen, wobei die Mehrheit dieser Ereignisse (81%) unter genetischem Einfluss steht. Viele dieser cis-regulierten ASM-Varianten sind auch eQTLs in mononuklearen Zellen und Monozyten des peripheren Bluts und/oder in einem hohen Kopplungsungleichgewicht mit Varianten, die mit einer komplexen Krankheit verbunden sind. Schließlich konzentrieren wir uns auf Autoimmun-Phänotypen und erweitern diesen anfänglichen Screen, um die Assoziation von cis-reguliertem ASM mit mehreren komplexen krankheitsassoziierten Varianten in einer unabhängigen Population unter Verwendung von Bisulfit-Sequenzierung der nächsten Generation zu bestätigen. Diese vier Varianten sind an komplexen Phänotypen wie Colitis ulcerosa und AIDS-Progression (rs10491434), Zöliakie (rs2762051), Morbus Crohn, IgA-Nephropathie und früh einsetzender entzündlicher Darmerkrankung (rs713875) und Körpergröße (rs6569648) beteiligt. Unsere Ergebnisse deuten darauf hin, dass cis-reguliertes ASM eine mechanistische Verbindung zwischen den nicht-kodierenden genetischen Veränderungen und der phänotypischen Variation, die bei diesen Krankheiten beobachtet werden, darstellen könnte, und legen ferner einen Weg zur Integration des DNA-Methylierungsstatus mit GWAS-Ergebnissen nahe.

Interessenkonflikt-Erklärung

Konkurrierende Interessen: Wir haben die folgenden Interessen. Diese Studie wurde teilweise vom Massachusetts Lions Eye Research Fund, Inc., Research to Prevent Blindness, Inc. und dem New England Eye Center finanziert. Es sind keine Patente, Produkte in der Entwicklung oder vermarktete Produkte zu deklarieren. Dies ändert nichts an unserer Einhaltung aller PLOS ONE-Richtlinien zum Teilen von Daten und Materialien, wie sie online im Leitfaden für Autoren beschrieben sind.

Figuren

Abbildung 1. Microarray-basierter Nachweis allelspezifischer…

Abbildung 1. Microarray-basierter Nachweis allelspezifischer Methylierung.

Abbildung 2. Typen allelspezifischer Methylierungskandidaten.

Abbildung 2. Typen allelspezifischer Methylierungskandidaten.

Diagramme mit einer Anzahl verschiedener Kategorien von ASM…

Abbildung 3. Cis-regulierte allelspezifische Methylierungsbestätigung in…

Abbildung 3. Cis-regulierte allelspezifische Methylierungsbestätigung in einer unabhängigen Population.

Heatmaps zeigen den Methylierungsstatus in Prozent…

Abbildung 4. Genomischer Kontext von cis-regulierten allelspezifischen…

Abbildung 4. Genomischer Kontext von cis-regulierten allelspezifischen Methylierungsereignissen.


NanoNOMe kombiniert Nanopore und NOMe-seq zum Abbau des Allel-spezifischen Epigenoms

Gnome sind kleine magische Kreaturen, die nach Schätzen graben, also fragen Sie sich vielleicht, ob ein nanoNOMe ein noch kleineres Wesen ist. Nun, eigentlich ist es eine neue molekulare Technik, aber ihre Anwendungen sind einfach magisch. Es wurden mehrere Verfahren entwickelt, um gleichzeitig DNA-Methylierung, Transkriptionsfaktoren und Chromatinzustand zu untersuchen. Viele basieren auf dem Prinzip von NOMe-seq, das eine GpC-Methyltransferase verwendet, um offenes Chromatin zu markieren, was eine Bisulfit-Sequenzierung ermöglicht, um sowohl diese Stellen als auch die DNA-Methylierung an CpG-Stellen zu identifizieren. Die Hauptvorteile dieser Ansätze sind die Einzelmoleküldatenausgabe, was bedeutet, dass DNA-Methylierungs- und Nukleosomenbelegungsdaten aus demselben DNA-Strang stammen. Eine Herausforderung dieser Methoden bestand darin, dass die meisten Sequenzierungstechnologien kurze Reads haben, was bedeutet, dass diese wertvollen Einzelstranginformationen in ihrem Maßstab sehr begrenzt sind.

Das Labor von Winston Timp an der Johns Hopkins University wollte die Leselänge dieser kombinatorischen Methoden erweitern. Dazu nutzten sie die Nanoporen-Sequenzierung. Nanopore ist aufgrund seiner sehr langen Reads (>10kb) von nicht amplifizierter DNA einzigartig unter den Sequenzierungstechnologien. In früheren Arbeiten hat das Labor von Dr. Timp gezeigt, dass die Nanoporen-Sequenzierung mit ihrer Software die DNA-Methylierung genau aufrufen kann Nanopolitur. Dies ist im Vergleich zur Bisfulfit-Sequenzierung eine besondere Herausforderung, da in diesem Fall die DNA nicht amplifiziert ist und somit der Nanoporen-Sequenzer das 5mC-Nukleotid selbst direkt detektiert. In dieser neuen Studie kombinierten sie die Nanoporen-Sequenzierung mit der GpC-Methylierung in einer Methode, die sie Nanoporen-Sequenzierung der Nukleosomenbelegung und des Methyloms (nanoNOMe) nennen. Sie wendeten diesen Ansatz in vier menschlichen Zelllinien an. Folgendes fanden sie auf ihrer Bergbauexpedition:

  • Lange Lesevorgänge ermöglichen die Abfrage von sich wiederholenden Elementen, was bei anderen Methoden schwierig ist
    • Von allen repetitiven Elementen zeigen nur Alu-Elemente eine erhöhte Methylierung, und die Zugänglichkeit von Chromatin ist bei allen repetitiven Elementen reduziert, insbesondere in den LINE- und LTR-Regionen
    • Dieser Ansatz könnte auch verwendet werden, um epigenetische Effekte auf mutierte vs. Wildtyp-Allele zu untersuchen

    Im Kern fügt nanoNOMe der DNA selbst eine exogene Informationsschicht hinzu, die verwendet werden kann, um Informationen über die Nukleosomenbelegung in der Zelle zu speichern und ein vollständig phasengesteuertes menschliches Epigenom zu erzeugen. Diese wird dann entlang langer Einzelmoleküle mittels Nanoporen-Sequenzierung ausgelesen. Wir könnten uns viele Anwendungen für diesen Ansatz in der Grundlagenforschung und in Krankheitsmodellen vorstellen. Wenn Sie also epigeNome auf der Suche nach Ihren eigenen Schätzen abbauen, sollten Sie eine nanoNOme-Expedition in Betracht ziehen.


    Ergebnisse

    Muster von KIs über epigenomische Markierungen hinweg

    Um die Auswirkungen genetischer Variation auf das Epigenom zu untersuchen, hat das Roadmap Epigenomics Project der National Institutes of Health (NIH) (17) hat nun die Gesamtgenomsequenzierung (WGS) an Genomen von 13 Spendern abgeschlossen und Referenzepigenome der NIH Roadmap aus 71 kombinierten Proben veröffentlicht, die zusammen 27 verschiedene Gewebetypen und neun Zelltypen repräsentieren (Abb. S1). Zur genauen Identifizierung heterozygoter genomischer Loci haben wir die Spendergenome sequenziert (18). Acht Assays waren in den meisten Proben enthalten und wurden für den AI-Nachweis verwendet: WGBS, RNA-Sequenzierung (RNA-seq) und Chromatin-Immunpräzipitations-Sequenzierung (ChIP-seq) für sechs verschiedene Histonmarkierungen (H3K4me3, H3K4me1, H3K36me3, H3K27me3, H3K9me3, und H3K27ac) (Abb. S1). Wir führten eine allelspezifische Methylierungsanalyse (ASM) an heterozygoten Single-Nukleotid-Polymorphismus-(SNP)-Loci innerhalb der 49 WGBS-Methylome durch, wobei wir einen Schwellenwert der absoluten Methylierungsdifferenz von >30% zwischen den Allelen verwendet und die Signifikanz mit Hilfe des exakten Tests nach Fisher auf die Zählungen geschätzt haben von methylierten und unmethylierten Cytosinen, die bei der gleichen Sequenzierung mit jedem der beiden SNP-Allele beobachtet wurden (Abb. S2A) (18). Wir haben die Identifizierung von AIs für Histonmarkierungen und die Transkription mit der AlleleSeq-Pipeline durchgeführt (Abb. S2B) (18, 19).

    Betrachtet man die AIs in allen Markierungen, waren die Ungleichgewichte bei der DNA-Methylierung bei weitem am häufigsten (Tabelle S1 und Abb. S3), hauptsächlich aufgrund der genomweiten Verteilung der DNA-Methylierung, im Gegensatz zu der ungleichmäßigen genomischen Verteilung anderer Markierungen . Unter den Histonmarkierungen hatte H3K27ac mehr Ungleichgewichtsrufe als andere (Tabelle S1), teilweise aufgrund der tieferen ChIP-Seq-Abdeckung für H3K27ac (Tabelle S1 und Abb. S3). An den Promotoren waren H3K27ac- und H3K4me3-Markierungen auf dem Allel mit weniger DNA-Methylierung häufiger ( 1A ). Umgekehrt war das H3K9me3-Signal auf dem Allel häufiger mit mehr Methylierung in den Promotoren ( 1A ). Bei Enhancern neigte H3K27ac dazu, häufiger auf dem Allel mit weniger DNA-Methylierung aufzutreten ( 1A ). Wir entdeckten auch mit hoher Spezifität eine Anreicherung von AIs bei der Methylierung und koordinierte Veränderungen in der Transkription und Histonmarkierungen innerhalb einer Mehrheit jener geprägten Loci, die einen heterozygoten SNP einschlossen (Abb. S4 und S5) (18).

    (EIN) Anzahl der AIs in Histonmarkierungen und Transkription, überlappende ASM-Loci, über Klassen von genomischen Elementen. (B zu E) Anteile der SD-ASM-Loci gegenüber den gesamten heterozygoten Loci in 200-bp-Bins in der Nähe von Promotoren, CpG-Inseln und Enhancern.

    Als nächstes bewerteten wir das Ausmaß der gemeldeten SD-ASM. Übereinstimmend mit genetischen Effekten in cis (6, 2022), war das gemeinsame Auftreten von ASM am gleichen heterozygoten Locus in verschiedenen Proben höher als zufällig unter einem permutationsbasierten Nullmodell erwartet (Abb. S6A). Der Grad des gemeinsamen Auftretens von ASM war tendenziell höher bei Probenpaaren in Geweben desselben Individuums als bei Paaren aus demselben Gewebe bei verschiedenen Individuen, was höher war als bei Proben ohne übereinstimmendes Gewebe oder Individuum (Abb. S6B). Eine geringe Konkordanz bei ASM-Anrufen zwischen Individuen kann auf den lokalen Haplotyp-Kontext, epigenetische Drift oder andere nicht-genetische Faktoren zurückzuführen sein (3, 4, 6, 20, 22, 23). Gaußsche Mischungsmodellierung (18) zeigte, dass allelische Unterschiede in der Methylierung (über der 30%-Schwelle) bei heterozygoten SNPs die Tendenz hatten, in der gleichen Richtung (dasselbe Allel zeigte eine höhere Methylierung als das andere) über Probenpaare hinweg aufzutreten (Abb. S6, C bis E). .

    Um die Fähigkeit zum Nachweis von SD-ASM mit hoher Sensitivität zu erhöhen, haben wir die Messwerte über alle 49 Methylome gepoolt und die gleiche Nachweismethode wie für einzelne Proben angewendet (Abb. S7A) (18). Die tiefe Abdeckung des kombinierten Satzes (1691-fache Gesamtabdeckung bei Bisulfit-Sequenzierungs-Reads im kombinierten Satz von 49 Methylomen) erhöhte unsere Fähigkeit, sequenzassoziierte AIs zu erkennen, die in verschiedenen Geweben und Spendern nachweisbar waren (Abb. S7, B bis ). D), wohingegen unsere Fähigkeit, gewebeabhängige und spenderabhängige SD-ASM zu erkennen, reduziert war (Abb. S8, A und B). Die Anzahl der zugänglichen heterozygoten Loci (solche mit mindestens sechs Zählungen pro Allel) für die SD-ASM-Bestimmung stieg nach dem Pooling auf 4.913.361, was unsere SD-ASM-Kartierungsauflösung – gemessen als durchschnittlicher Abstand zwischen „index hets“ – auf 600 erhöhte Basenpaare (bp). Bei der Standardschwelle für die Methylierungsdifferenz von 30 % wurden AIs bei 5 % der Indexhets erkannt, wodurch der Schwellenwert auf 20 % gesenkt wurde, insgesamt

    Die Empfindlichkeit des Methyloms gegenüber genetischer Variation variiert zwischen den Klassen der genomischen Elemente

    Als nächstes untersuchten wir, ob SD-ASM die Tendenz hat, innerhalb eines bestimmten Typs von genomischen Elementen aufzutreten. Unter Verwendung der über die 49 Methylome gepoolten Reads beobachteten wir eine Verarmung von SD-ASM in Promotoren, die CpG-Inseln enthalten (Abb. 1B), sowie innerhalb von CpG-Inseln im Allgemeinen (Abb. 1C), was mit den Beobachtungen übereinstimmt, dass ASM verarmt ist auf CpG-Inseln (4, 21) und dass mQTLs in Promotoren von Genen innerhalb von CpG-Inseln (24, 25) und dass die quantitative Expressionsmerkmal-Methylierung innerhalb der CpG-Inselküsten und nicht auf den CpG-Inseln selbst angereichert ist (26). Im Gegensatz dazu und Spiegelung früherer mQTL-Muster (25), zeigten Promotoren von Genen, die sich nicht in CpG-Inseln befanden, hohe SD-ASM-Spiegel ( 1D ). Wir beobachteten auch eine Anreicherung von SD-ASM stromabwärts vom Promotor und in den Genkörper (Abb. 1, B und D) und eine positive Assoziation zwischen allelspezifischer Expression (ASE) und ASM über Exons (Abb. 1A), die konsistent ist mit höherer Methylierung aktiv transkribierter Regionen, einschließlich derjenigen auf dem X-Chromosom (27) und mit der Anreicherung von mQTLs in Regionen, die die Transkriptionsstartstelle (TSS) flankieren (23, 28). Ein Faktor, der zur ASM beiträgt, insbesondere in der Nähe der Transkriptionsstartstellen (Abb. 1D), kann das Vorhandensein von Transkriptionsregulationssignalen (29).

    SD-ASM war auch in Enhancern stark angereichert (Abb. 1E), was mit früheren Berichten übereinstimmt (24, 28). Die Fülle an TF-Bindungsstellen in Enhancern legt nahe, dass SD-ASM aus einer Unterbrechung der TF-Bindung resultieren kann (23). Unter dieser Annahme legen unsere Daten nahe, dass die TF-Bindung an CpG-Inseln und CpG-reichen Promotoren gegen genetische Störungen gepuffert ist, während die TF-Bindung an Nicht-CpG-Promotoren und -Enhancer am empfindlichsten ist. Wir beobachteten auch eine etwas rätselhafte leichte Verarmung von SD-ASM in den flankierenden Regionen von Enhancern (Fig. 1E), was ebenfalls auf eine Pufferung in diesen Regionen hindeutet.

    SD-ASM ist auf Unterschiede zwischen allelspezifischen Epiallel-Frequenzspektren zurückzuführen

    Als nächstes fragten wir, ob das Fehlen der Pufferung an den SD-ASM-Loci zu einer übermäßigen Stochastik und Metastabilität führen kann, die durch das Vorhandensein von mehr als einem stabilen Zustand definiert ist, wobei jeder stabile Zustand einem Epiallel entspricht (Einzelchromosomen-Methylierungsmuster). Um diese Frage zu beantworten, haben wir die tiefe kombinierte WGBS-Read Coverage über 49 Methylome (Tabelle S2) verwendet und dass jeder Read eine einzelne Variante einem einzelnen Epiallel zuordnet. Wir bewerteten Epiallele, indem wir den Methylierungsstatus von vier homozygoten CpG-Stellen (4 2 = 16 mögliche Epiallele) bewerteten, die jedem Index het in einzelnen WGBS-Reads am nächsten waren (13, 14) (Abb. 2A). [Unsere Verwendung des Begriffs „Epiallele“ folgt der neuesten Verwendung (12, 13) und entspricht nicht der ursprünglichen Definition (30), was eine generationenübergreifende Vererbung impliziert. Unsere Verwendung des Begriffs „Metastabilität“ steht im Einklang mit seiner Verwendung in der Theorie dynamischer Systeme und impliziert nicht die Vererbung eines Epiallels während der Zellteilung.]

    (EIN) Beispiel für ein Epiallel-Frequenzspektrum (unten), abgeleitet von beobachteten Epiallelen in WGBS-Reads (oben). (B) Histogramme der Shannon-Entropie in Bits für die Epiallel-Frequenzspektren für die Hets mit SD-ASM (rot) und die nächstgelegenen (Kontrolle) Hets ohne SD-ASM (schwarz). (C) Die meisten heterozygoten Loci mit zwei häufigen Epiallelen zeigen SD-ASM und haben eine Entropie von mehr als 1,7 Bit (roter Teil des Balkens), wobei die beiden Epiallele in 71,7% der Fälle biphasisch (vollständig methyliert oder vollständig unmethyliert) sind. Die rechte Legende zeigt ein Beispiel für ein Het, in dem der Unterschied zwischen den Epiallel-Frequenzspektren von Allel 1 (A, orange) und Allel 2 (G, blau) SD-ASM erklärt. (D) Histogramm der Beschränkungskoeffizienten für SD-ASM-Loci mit zwei häufigen Epiallelen. Die Legenden veranschaulichen ein Beispiel het (T/C, Legende oben rechts) mit einem niedrigen Einschränkungskoeffizienten und ein weiteres (G/C, Legende unten rechts) mit einem hohen Einschränkungskoeffizienten. (E) Illustration der Pufferung im Gegensatz zur ergodischen/periodischen und mosaikartigen Metastabilität.

    Um den Betrag der Stochastik an den Index-Het-Loci zu quantifizieren, haben wir die Shannon-Entropie (18). Die Entropiewerte lagen im Bereich von 0 bis 4: Eine gleichmäßige Verteilung der Häufigkeiten über die 16 möglichen Epiallelmuster ergibt einen maximalen Entropiewert von 4 Bit, während eine völlige Abwesenheit von Stochastik aufgrund maximaler „Pufferung“ nur ein Epiallel mit einer Frequenz ungleich Null impliziert und an Entropiewert von 0 Bit. Um Unterschiede in der Pufferung (fehlende Empfindlichkeit gegenüber genetischer Variation) zwischen SD-ASM- und Kontroll-Loci quantitativ zu bewerten, identifizierten wir SD-ASM-Loci, die eine ausreichende Abdeckung und einen nahen Index het ohne ASM aufwiesen, und verglichen Entropien. Insgesamt 6619 (2,7%) von 241.360 Loci mit SD-ASM erfüllten die beiden Kriterien (18). Wir beobachteten einen auffallenden Unterschied in der Entropie, der eine quantitative Bewertung der höheren Stochastik an den SD-ASM- im Vergleich zu den Kontroll-Loci lieferte (Abb. 2B).

    Als nächstes untersuchten wir die Anreicherung für epigenetische Polymorphismen an SD-ASM-Loci. Wir schätzten die Anzahl der häufigen Epiallele für jeden Locus, indem wir die Epiallele von den am häufigsten zu den am wenigsten häufigen sortierten und identifizierten die „Top-Liste“ von Epiallelen mit minimaler Größe, die mindestens 60% aller Reads mit festgestellten Epiallelen ausmachte. Im Gegensatz zu den Kontrollloci, die typischerweise nur ein hochfrequentes Epiallel auf der „Top-Liste“ aufwiesen und daher nicht epigenetisch polymorph waren, zeigten SD-ASM-Loci mehrere häufige Epiallele – in den meisten Fällen nur zwei (Abb. 2C). . Bei der Untersuchung der oberen Epiallele-Paare stellten wir fest, dass 71,7% der Paare aus einem vollständig methylierten und einem vollständig unmethylierten Paar bestanden (Abb. 2C). Dies steht im Einklang mit früheren Berichten über zweiphasige (vollständig methylierte und vollständig unmethylierte) Methylierungsverteilungen in Amplikons mit hoher interindividueller Methylierungsvarianz und in Polymerasekettenreaktionsklonen mit bimodalen Methylierungsmustern (3, 31). AIs an SD-ASM-Loci konnten auf Verschiebungen der Epiallel-Frequenzspektren zwischen Allelen zurückgeführt werden, typischerweise Verschiebungen der relativen Häufigkeiten der vollständig methylierten und vollständig unmethylierten Epiallele ( 2C ). Wir validierten den beobachteten Stochastiküberschuss und die Anreicherung für das biphasische Muster an SD-ASM-Loci mit einem unabhängigen WGBS-Datensatz aus der Encyclopedia of DNA Elements (ENCODE) (Abb. S9, A bis C) (18).

    Als nächstes quantifizierten wir die Beziehung zwischen genetischer Variation und stochastischen Epiallelen. An jedem Locus schätzten wir die Wahrscheinlichkeiten von Epiallelen für jedes Allel (höhere Wahrscheinlichkeiten sind durch dickere Pfeile in Fig. 2, C und D angezeigt). Anschließend quantifizierten wir den Grad, in dem genetische Allele die Epiallelhäufigkeit bestimmen, unter Verwendung eines Beschränkungskoeffizienten (18), ein informationstheoretisches Maß, das eine Verallgemeinerung der R 2 Bestimmtheitsmaß, das häufig in der Genetik verwendet wird und besser geeignet ist, die genetische Bestimmung stochastischer Phänotypen zu quantifizieren. Ein größerer Wert für den Beschränkungskoeffizientenwert bedeutet, dass die epigenetische Variation stärker eingeschränkt ist und durch die genetische Variation in cis bestimmt wird. Intuitiv weist ein größerer Beschränkungskoeffizient auf einen größeren Unterschied in den Epiallel-Frequenzspektren entsprechend den beiden Allelen hin, was einen höheren Grad der Bestimmung der Epiallel-Frequenzspektren durch die genetischen Allele impliziert ( 2D ).

    Es gibt zwei allgemeine mechanistische Modelle, die den Effekt der Sequenzvariation in cis auf die Epiallel-Frequenzspektren erklären könnten. Das ergodisch-periodische Modell sieht einen ständigen Wechsel zwischen metastabilen Zuständen vor, wobei die Übergänge stochastisch mit einer möglichen Periodizitätskomponente, wie etwa zirkadianen Schwingungen, sind. Wenn eine ausreichende Anzahl stochastischer Übergänge von einem Epiallel zu einem anderen auftritt, hängt dieses Epiallel-Frequenzspektrum weitgehend von der sequenzabhängigen Form der aktuellen Energielandschaft (Zustandsübergangswahrscheinlichkeiten) und nicht vom epigenetischen Gedächtnis vergangener Ereignisse ab (Abb. 2E). . Im Gegensatz dazu sieht das Mosaikmodell vor, dass Epiallele über die Zeit und sogar während der Zellteilung stabil übertragen werden und nach einer Phase der anfänglichen Metastabilität in einen der stabilen Zustände „eingefroren“ werden. Beide Modelle beinhalten eine Periode der Metastabilität, ob vergangen (Mosaik) oder aktuell (ergodisches/periodisches Modell).

    CTCF-Bindungsorte zeigen sequenzabhängiges stochastisches Schalten und Schleifen

    Aufgrund seiner Assoziation mit DNA-Methylierung an einer großen Anzahl von Bindungsstellen untersuchten wir als nächstes die Rolle des CCCTC-Bindungsfaktors (CTCF) bei der Erzeugung der metastabilen Zustände, die Epiallelen entsprechen. Metastabilität wird bekanntermaßen durch positive (einschließlich doppelt-negative) Rückkopplungsschleifen erzeugt (32), die in unserem Fall auch Wechselwirkungen in cis beinhalten, wie den Schutz vor DNA-Methylierung durch CTCF-Bindung und die reziproke Bevorzugung von CTCF gegenüber unmethylierter DNA (33). Der erste Hinweis auf die Rolle der CTCF-Bindung bei der Metastabilität ergab sich aus der Beobachtung, dass die Heterozygote mit dem größeren Beschränkungskoeffizienten (G/C het) auch größere Unterschiede in der vorhergesagten CTCF-Bindungsaffinität zwischen den beiden Allelen aufwies als die andere (T/C het) (Abb. 2D). In Anbetracht der Tatsache, dass der Beschränkungskoeffizient proportional zu den Unterschieden in den Epiallel-Frequenzspektren für die beiden Allele ist (identische Epiallel-Frequenzspektren, die zu einem Beschränkungskoeffizienten-Wert von 0 führen), deutet diese Beobachtung auf eine positive Korrelation zwischen dem Beschränkungskoeffizienten und den Unterschieden in CTCF . hin Bindungsaffinität für die beiden genetischen Allele, die tatsächlich beobachtet wurde (Fig. 3A). In Bezug auf die epigenetische Landschaftsverzerrung aufgrund genetischer Variation sehen wir, dass Sequenzvarianten, die größere Unterschiede in der CTCF-Bindungsaffinität aufweisen, auch größere Unterschiede in ihrer epigenetischen (Energie-)Landschaft aufweisen, was sich in den deutlicheren Verschiebungen zwischen den Allelen in ihrer Besetzung von . widerspiegelt metastabile Zustände (wie durch höhere Werte des Beschränkungskoeffizienten gemessen) (Fig. 3A, oben). Da sich die CTCF-Bindung und die Demethylierung seiner Bindungsstelle gegenseitig verstärken (Bildung einer positiven Rückkopplungsschleife und eines metastabilen Zustands), sagt das Modell auch voraus, dass die mit höheren CTCF-Bindungsaffinitäten assoziierten Varianten eine geringere Methylierung aufweisen, was tatsächlich der Fall ist (Abb . 3A, unten) wie zuvor beobachtet (23, 24). Zusammengenommen legen diese Ergebnisse einen sequenzabhängigen stochastischen epigenetischen Wechsel zwischen metastabilen Zuständen nahe, der durch die CTCF-Bindung vermittelt wird.

    (EIN) (oben) Korrelation zwischen absoluten CTCF-Bindungsaffinitätsunterschieden, basierend auf Positionsgewichtsmatrix-Scores (PWMs) und dem Beschränkungskoeffizienten für vorhergesagte CTCF-Bindungsstellen mit SD-ASM, zwei häufigen Epiallelen und einem biphasischen Methylierungsmuster. (Unten) Korrelation zwischen CTCF-Bindungsaffinität und DNA-Methylierung an vorhergesagten CTCF-Bindungsstellen. (B) SD-ASM ist prädiktiver für Allel-Looping (28 richtig positiv von 44 Vorhersagen) als Motivunterbrechungs-Scores (1 richtig positiv von 44 Vorhersagen). Um die Spezifität zu kontrollieren, wurden Schwellenwerte so ausgewählt, dass beide Verfahren die gleiche Anzahl von Hets (44) vorhersagten, um Allel-Looping zu zeigen. (C) SD-ASM an Bindungsstellen von 377 TFs, die mit der SELEX-Methode definiert wurden. Das Tortendiagramm (links) und die Tabelle (rechts) zeigen sowohl Anreicherungen als auch Richtungstrends mit einem gemeinsamen Farbcode an. (D) (oben) Korrelation zwischen absoluten ELK3-Bindungsaffinitätsunterschieden und dem Beschränkungskoeffizienten für vorhergesagte Bindungsstellen mit SD-ASM, zwei häufigen Epiallelen und einem zweiphasigen Methylierungsmuster. (Unten) Korrelation zwischen ELK3-Bindungsaffinität und DNA-Methylierung an vorhergesagten ELK3-Bindungsstellen. (E) Ein mechanistisches Modell einer sequenzabhängigen Energielandschaft mit zwei metastabilen Zuständen: Allel 1 (obere Reihe), entsprechend einer Landschaft, in der der am häufigsten besetzte metastabile Zustand einem vollständig unmethylierten Epiallel entspricht, und Allel 2 (untere Reihe), entsprechend zu einer Landschaft, in der der am häufigsten besetzte metastabile Zustand einem vollständig methylierten Epiallel entspricht. Mutmaßliche positive Rückkopplungsschleifen, die Wechselwirkungen zwischen der TF-Bindung und der Methylierung der Bindungsstelle beinhalten, sind für CTCF angezeigt. Ein alternatives Modell mit kompetitiver Bindung von zwei TFs ist rechts angegeben. Die Signifikanz der Korrelationen wurde mit Student’s . getestet T Prüfung.

    Da der CTCF TF Chromatinschleifen (34) fragten wir, ob der allelische Methylierungszustand auch mit dem allelischen Looping zusammenfällt. Um dieses Ziel zu erreichen, haben wir eine Studie (35), das heterozygote SNP-Loci berichtet, die sowohl mit der allelischen CTCF-Bindung als auch mit dem allelischen Chromatin-Looping assoziieren, wie mittels Chromatin-Interaktionsanalyse durch Paired-End-Tag-Sequenzierung (ChIA-PET) bestimmt. Tatsächlich waren insgesamt 44 dieser SNP-Loci auch in unserem Datensatz vorhanden. Der Vergleich unserer Signale für den Methylierungszustand von CTCF-Bindungsstellen mit den vorhergesagten CTCF-Motiv-Unterbrechungs-Scores legte nahe, dass SD-ASM ein genauerer Indikator für allelische CTCF-Bindung und -Looping ist als der Motiv-Disruptions-Score (Fig. 3B) (18).

    TF-Bindungsstellen zeigen sequenzabhängige Verschiebungen in Epiallel-Frequenzspektren und AIs

    Analysen von ASM an regulatorischen Elementen und eQTLs zeigten Assoziationen zwischen ASM und allelspezifischen Histonmarkierungen mit nachgeschalteter allelspezifischer Transkription (Abb. S10, A bis F) (18). Diese Ergebnisse ergänzten frühere Studien (22, 23) und schlug eine Beteiligung der Allel-spezifischen TF-Bindung und Cofaktoren bei ASM vor. Um die Rolle der allelspezifischen TF-Bindung zu untersuchen, konzentrierten wir uns auf den Satz von 377 TFs, die mit der systematischen Hochdurchsatz-Evolution von Liganden durch exponentielle Anreicherung (SELEX) auf ihre Bindungsaffinität untersucht wurden (36). Für CTCF identifizierten wir die Untergruppe der Bindungsmotiv-Loci in einem heterozygoten Zustand mit zwei häufigen Epiallelen und untersuchten die Korrelation zwischen dem Beschränkungskoeffizienten und der Differenz der vorhergesagten allelischen Bindungsaffinitäten über diese Loci für jeden TF (Tabelle S3). Aufgrund der relativ geringen Anzahl solcher Loci pro TF zeigten nur 13 signifikante Individuen P Werte (Studenten- T Prüfung, P < 0,05), wobei nur CTCF die Bonferroni-Korrektur überlebt (zum Testen von 377 TFs) (Tabelle S3). However, a majority (11 of 13) of the TFs that showed individually significant correlation also showed positive correlation (P = 0.01, binomial test), which is consistent with the pattern observed for CTCF where larger differences in TF binding affinities correspond to larger distortions in the configuration of metastable states within the landscape (table S3).

    Likewise, we next examined for all 377 TFs whether disruptions of their predicted binding sites associated with methylation imbalances. A majority (241) showed SD-ASM enrichment within their binding motifs compared with flanking loci (500 bp on each side) (Fig. 3C and table S4), suggesting that TF binding associates with allelic DNA methylation. The SD-ASM outside of the examined motifs may be attributable to sequence variation within undiscovered binding loci, within motifs of noncoding RNAs, or within loci in physical proximity or contact with regions of perturbed TF activity.

    We then examined the relation between allelic differences in motif strengths and methylation levels at SD-ASM loci (18). We observed that for more than half of the TFs tested (207), there was an association between motif strength and level of methylation (Fig. 3C). Most TFs (159) showed gain in methylation on the allele with the disrupted motif, which is consistent with the TF binding either protecting a region from passive methylation (37) or causing active demethylation (Fig. 3C) (38). By contrast, a smaller number of TFs (48), including members of TF families that recruit methyltransferases such as the ETS-domain TF family members (39, 40), showed loss of methylation on the allele with the disrupted motif (Fig. 3, C and D). About a quarter of TFs that show enrichment for SD-ASM show no bias in directionality (table S4), the lack of bias being explainable by contextual behavior at different binding loci, such as for nuclear factor of activated T cells 1 (41) or because of competing TFs at overlapping motifs. Our results support that TF motif sequences are predictive of proximal CpG methylation levels (23, 42, 43).

    We sought to validate the downstream functional consequences of SD-ASM variants, with predicted allelic differences in TF binding, using a luciferase assay. We prioritized cis-overlapping motifs (CisOMs), including those of c-MYC proto-oncogene (cMYC) and tumor suppressor p53 (TP53) that show competitive binding at many loci (44), because CisOMs provide one of the mechanisms of metastability (Fig. 3E), and also those that may have consequences for human disease (table S5). All four SNP validations showed allelic effects on luciferase expression, including two SNPs within CisOMs for cMYC and TP53 and some falling within disease-associated loci (fig. S11) (18), which suggests that SD-ASM helps identify those disease-associated variants that also have functional consequences.

    SD-ASM is enriched near disease-associated loci

    We observed that heterozygous variants with SD-ASM were enriched in the neighborhood of variants previously reported as significant in genome-wide association studies (GWASs) of common disease (Fig. 4A) (22, 23, 45). The enrichment was stronger around GWAS variants that have been replicated in multiple studies versus those that have not. To explore more specifically the role of enhancers, we performed a similar enrichment analysis focusing only on GWAS and SD-ASM variants overlapping enhancer elements. Enhancers that contain replicated GWAS variants were significantly (P < 0.0001, χ 2 test) more likely to also contain a variant with SD-ASM than enhancers that did not contain replicated GWAS variants (Fig. 4B). Taken together, these results indicate that AIs provide information about the role of specific loci in common diseases, pointing to the loci that are sensitive to the effects of genetic variation and have functional effects. The enrichment of both GWAS loci and AIs at enhancers, and sensitivity of TF binding to genetic variation discussed in previous sections, provide a mechanistic link between AIs and GWAS associations.

    (EIN und B) Enrichment of ASM in the proximity of GWAS loci. ASM hets within 1 kb of GWAS loci are compared with colocalized hets without ASM. (C zu F) Evidence of purifying selection acting on rare variants with ASM. [(C) and (D)] Proportion of variants associated with ASM compared with those without ASM among the rare (DAF < 1%) variants across individual methylomes. [(E) and (F)] Proportion of loci with ASM over total heterozygous loci over windows of increasing DAF in the combined set of methylomes. (F) This bar chart summary of the data in (E) shows the excess of SD-ASM variants among those with DAF < 1%. χ 2 tests were used for significance of enrichments.

    Variants showing SD-ASM are under purifying selection

    Because the variants with large effects are under purifying selection, they tend to be rare, with frequencies below the detection threshold of association studies such as GWAS, mQTL, and eQTL. By contrast, AIs may provide evidence for functional effects even for rare variants that may be detected in only one individual. On the basis of previous studies that have used signatures of purifying selection such as shifts toward smaller derived allele frequency (DAF) to identify functional variants (46, 47), we would expect that ASM variants would also tend to have a lower DAF than those without ASM. Therefore, we obtained DAF estimates from the 1000 Genomes Project (48), ignoring variants that overlapped regions with low accessibility to variant calling. We observed that in nearly every sample in our dataset, heterozygous variants with ASM were significantly (P < 0.05, χ 2 test) more likely to have DAF smaller than 1% than were those without ASM (methylation difference between alleles < 5%) (Fig. 4C). Overall, this analysis found

    130 (median) more rare (DAF < 1%) variants than expected among those with ASM per individual methylome, providing a lower bound on the number of those under purifying selection per individual. When we repeated the analysis for enhancer regions, strong signal was again observed (Fig. 4D), suggesting a median excess of at least 26 enhancer variants under purifying selection per individual.

    The lower bounds from individual samples may underestimate the extent of purifying selection because of underdetection of SD-ASM. We therefore investigated whether an enrichment for rare variants could also be seen for those variants associated with SD-ASM from the combined dataset, using neighboring variants as controls (18). We observed that the chance of a locus having SD-ASM decreased as the derived allele frequency increased (Fig. 4E there were very few variants with DAF > 50%, causing high variance and large confidence intervals). We further tested whether there was a significant enrichment for variants with DAF < 1% among those with SD-ASM and found that such enrichment was indeed significant (odds ratio 1.18 P < 0.0001, χ 2 ) (Fig. 4F). That enrichment represents an excess of 2184 rare variants among those with SD-ASM compared with controls. Considering that this observed excess represents a set of 11 genomes (nine individuals and two cell lines), we estimate at least

    200 variants with SD-ASM under purifying selection per individual donor.


    Allele specific cloning efficiency after bisulfite treatment - (Sep/20/2005 )


    I hope my question is appropriate for this bioforum. I performed a bisulfite treatment on genomic DNA (EZ methylation kit, Zymo) and performed nested-PCR on that genomic DNA to amplify specific imprinted genes.

    I sent the PCR product to sequence and I could see on the Chroma file that some T/C peaks were juxtaposing each other. involving that I amplified both alleles in the PCR reaction (as was previously discussed here).

    I cloned the PCR product in P-Drive and sent 10 clones to sequence. and the results seems weird to me. far from the 50/50 I was expecting. I have to mention that I had a lot of trouble getting 10 clones to sequence. bacteria would not grow easily and the yield of my minipreps were very low (for some samples I had to do 20 minipeps to get 10 to sequence. but miniprep issuesare not the point here. )

    The point is: Is it possible that cloning efficiency depends on the allele inserted in the cloning vector? Can some "cloning bias" be introduced such that one bisulfite-treated allele is more easily cloned than the other?

    Anyone has an idea about that? Or got stuff that looks like mine??

    I am curious what differences are there between the two alleles, different methylation, polymorphism?

    When we deal with imprinted genes, we may expect different methylation patterns between the two alleles depending on the maternal/paternal origin of the allele. one allele may be hypermethylated and the other hypomethylated.

    Chroma files showed that I'm amplifying both alleles in my PCR. (if you refer to my first posted message)

    So is it possible that cloning efficiency is not the same for both alleles after bisulfite treatment?

    I don't know if there is a clone bias for methylated allele. It may be possible. But, the under-representation of unmethylated allele in your sequencing clones may due to sampling error because you hardly got 10 colonies in total. I usually don't have any problem obtaining more than hundreds of colonies for sampling. You may want to try Topo cloning kit. I found that result from clone sequencing is consistent to that from direct sequencing.

    Yeah I thought it might be some cloning issues. but I also thought it would not harm to investigate about other possibilities. I'll look for that Topo cloning. thanks pcrman!


    Published online:

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Figure 1 (A) Dlk1-Gtl2 imprinting cluster, including transcriptional start sites (arrows) and transcription units (hatched boxes). (B) Portion of IG-DMR analyzed in this study. The 458 bp region analyzed by bisulfite mutagenesis and DNA sequencing corresponds to positions 110,766,298-110,766,755, NC_000078.5 (black box). Polymorphisms (*) between C57BL/6J and Mus musculus castaneus are as follows: (B6/CAST): 110,766,439 (A/G), 110,776,579 (G/A), 110,766,774 (G/A), 110,766,902-110,766,904 (TTT/TT), 110,767,052 (A/G). (C) Schematic of the Gtl2-DMR, including the Gtl2 transcriptional start site (arrow) and exon 1 (hatched box) +1 corresponds to position 110,779,206. Regions analyzed correspond to positions 110,778,378-110,778,966 and 110,779,331-110,780,052. Polymorphisms are as follows: 110,779,741 (G/A), 110,779,881 (A/G), 110,780,030-110,780,031 (AA/GC).

    Published online:

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Figure 2 Paternal allele-specific methylation of the IG-DMR is inherited from sperm. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST and CAST × B6 F1 hybrid liver and B6 × CAST F1 hybrid spermatozoa. Each circle represents one of 32 potentially methylated CpG dinucleotides, the first one located at position 110,766,345 (NC_000078.5). Each row of circles represents an individual strand sequenced. Filled circles represent methylated cytosines, open circles represent unmethylated cytosines, absent circles represent positions at which methylation data was not obtained.

    Published online:

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in Figur 2.

    Figure 3 Methylation of the paternal IG-DMR is maintained during pre- and post-implantation development. Bisulfite mutagenesis and sequencing of DNA from B6 × CAST F1 hybrid embryos. Details as described in Figur 2.

    Published online:

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in Figur 2.

    Figure 4 Paternal allele-specific methylation of the Gtl2-DMR is not inherited from sperm. Each circle represents one of 29 potentially methylated CpG dinucleotides, the first one located at position 110,779,349 (NC_000078.5). Details as described in Figur 2.


    These authors contributed equally: Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye

    Mitgliedschaften

    Department of Medical Genetics, School of Basic Medical Sciences, and Guangdong Technology and Engineering Research Center for Molecular Diagnostics of Human Genetic Diseases, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Lu Zong, Linyan Ye, Junping Ye, Haiyan Ou, Bo Guo, Wenquan Liang, Jian Zhang, Yong Long, Yu Hou, Lin Zhou, Shufen Li & Cunyou Zhao

    Key Laboratory of Mental Health of the Ministry of Education, Guangdong-Hong Kong-Macao Greater Bay Area Center for Brain Science and Brain-Inspired Intelligence, and Guangdong Province Key Laboratory of Psychiatric Disorders, Southern Medical University, Guangzhou, Guangdong, China

    Qiyang Li, Zhongju Wang, Linyan Ye, Junping Ye, Bo Guo, Wenquan Liang, Shufen Li & Cunyou Zhao

    Reproductive and Genetic Hospital, The First Affiliated Hospital of USTC, Division of Life Sciences and Medicine, University of Science and Technology of China, Hefei, China

    The Third People’s Hospital of Zhongshan, Zhongshan, Guangdong, China

    Department of Psychiatry, the Affiliated Brain Hospital of Guangzhou Medical University (Guangzhou Huiai Hospital), Guangzhou, Guangdong, China

    Qiong Yang, Fengchun Wu & Xingbing Huang

    Guangdong General Hospital, Guangdong Academy of Medical Science and Guangdong Mental Health Center, Guangzhou, China


    Schau das Video: Allele-specific oligonucleotide. Immune System. Antigen. Detection. Basic Science Series (Juni 2022).