Information

15: Genregulation I - Genexpressions-Clustering - Biologie

15: Genregulation I - Genexpressions-Clustering - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

15: Genregulation I - Genexpressions-Clustering

ScPADGRN: Ein vorkonditionierter ADMM-Ansatz zur Rekonstruktion eines dynamischen Genregulationsnetzwerks unter Verwendung von Einzelzell-RNA-Sequenzierungsdaten

Krankheitsentwicklung und Zelldifferenzierung beinhalten beide dynamische Veränderungen, daher ist die Rekonstruktion dynamischer Genregulationsnetzwerke (DGRNs) ein wichtiges, aber schwieriges Problem in der Systembiologie. Mit den jüngsten technischen Fortschritten in der Einzelzell-RNA-Sequenzierung (scRNA-seq) werden große Mengen an scRNA-seq-Daten für verschiedene Prozesse gewonnen. Die meisten aktuellen Methoden zum Ableiten von DGRNs aus Massenproben sind jedoch möglicherweise nicht für scRNA-seq-Daten geeignet. In dieser Arbeit stellen wir scPADGRN vor, eine neuartige DGRN-Inferenzmethode unter Verwendung von „Zeitreihen“-scRNA-seq-Daten. scPADGRN kombiniert die vorkonditionierte Wechselrichtungsmethode von Multiplikatoren mit Zellclustering für die DGRN-Rekonstruktion. Es weist Vorteile in Genauigkeit, Robustheit und schneller Konvergenz auf. Darüber hinaus wird ein quantitativer Index namens Differentiation Genes’ Interaction Enrichment (DGIE) vorgestellt, um die Interaktionsanreicherung von Genen im Zusammenhang mit der Differenzierung zu quantifizieren. Aus den DGIE-Scores relevanter Subnetzwerke schließen wir, dass die Funktionen embryonaler Stammzellen (ES) anfangs am aktivsten sind und im Laufe der Zeit allmählich nachlassen können. Die Kommunikationsstärke bekannter beitragender Gene, die die Zelldifferenzierung erleichtern, nimmt von ES-Zellen zu terminal differenzierten Zellen zu. Wir identifizieren auch mehrere Gene, die für die Veränderungen der DGIE-Scores während der Zelldifferenzierung verantwortlich sind, basierend auf drei realen Einzelzelldatensätzen. Unsere Ergebnisse zeigen, dass Einzelzellanalysen basierend auf Netzwerkinferenz in Verbindung mit quantitativen Berechnungen wichtige Transkriptionsregulatoren aufdecken können, die an der Zelldifferenzierung und Krankheitsentwicklung beteiligt sind.


Einführung

Es gibt verschiedene Arten von Prozessen in der Zelle, die zusammenarbeiten, um verschiedene Aktivitäten auszuführen. Abhängig von den Komponenten und ihren Interaktionstypen haben wir insgesamt drei Arten biochemischer Netzwerke auf subzellulärer Ebene: metabolische Netzwerke, Signalübertragungsnetzwerke und Genregulationsnetzwerke. Ein Genregulatorisches Netzwerk (GRN) ist ein Netzwerk von Gen-Gen-Interaktionen, die ihre Expression steuern. Die Regulation der Genexpression ist wichtig, da sie die Menge der Proteinproduktion in der Zelle reguliert.

Die Inferenz von Genregulationsnetzwerken gilt als eines der Schlüsselprobleme der Systembiologie [1, 2]. In den letzten zwei Jahrzehnten gab es ein exponentielles Wachstum von Reverse Engineering-Methoden zur Netzrekonstruktion [3–7]. Auch wenn seit dem letzten Jahrzehnt Hochdurchsatztechniken wie Microarrays und RNA-seq die Verfügbarkeit von Genexpressionsdaten ermöglicht haben, wird die Netzwerkinferenz angesichts von Faktoren wie Stochastik, Messrauschen, fehlenden Expressionswerten, begrenzter Zeit immer noch als schwieriges Problem angesehen Punkte usw. in den Ausdrucksdaten [8]. Abgesehen von diesen Einschränkungen stellt auch Rauschen, das durch Hochdurchsatztechniken wie DNA-Mikroarrays eingeführt wird, bei denen die Daten ein hohes Rausch-zu-Signal-Verhältnis aufweisen, eine Hürde bei der Netzwerkinferenz dar und wird bei der Entwicklung dieser Reverse-Engineering-Methoden oft übersehen [9].

In letzter Zeit wurden verschiedene Ansätze für die Netzinferenz aus Zeitreihendaten verwendet, wie z. B. ODE-Modelle [10], Bayessche Netze [11], Gaußsche grafische Modelle [12], neuronale Netze [13] und informationstheoretische Methoden [14]. Neuere Übersichten über Methoden der Inferenz von Genregulationsnetzwerken und deren Einschränkungen sind in [15, 16] zu finden. Huynh-Thu et al. [15] präsentierten einen einführenden Überblick über das Gebiet, indem sie zunächst den Hintergrund der beteiligten biologischen Kernkonzepte lieferten und dann verschiedene Inferenzansätze in kategorisierter Weise vorstellten. Das Papier enthält auch Links zu den öffentlich verfügbaren Softwaretools für die Netzwerkinferenz. Banf et al. [16] präsentierten einen Überblick über GRN-Inferenzmethoden, ihre Grenzen und ihre Anwendung auf Pflanzenarten A. Thaliana. Der Artikel konzentriert sich auch auf verschiedene Datentypen, die für GRN-Inferenz verwendet werden können, wie Informationen über die Bindungsstelle des Transkriptionsfaktors, Daten zur Kartierung der Chromatinkonformation und die Notwendigkeit, verschiedene Datensätze zu integrieren, um angemessenere Ergebnisse zu erhalten.

Expressionsdaten könnten im Steady-State gemessen oder als Zeitreihen generiert werden. Im Allgemeinen wird bei der Erzeugung von Zeitreihendaten der stationäre Zustand des Netzwerks gestört, und die sich entwickelnden Ausdruckswerte werden aufgezeichnet, bis das Netzwerk wieder den stationären Zustand erreicht. Da Zeitreihendatensätze sich entwickelnde Expressionswerte von Genen aufweisen, die zu verschiedenen Zeitpunkten aufgezeichnet wurden, gelten sie als aussagekräftiger über die Dynamik des zugrunde liegenden Netzwerks als Steady-State-Daten. Kausale Beziehungen zwischen Genen können nur aus Zeitreihendaten abgeleitet werden. Es hat sich gezeigt, dass der Inferenzansatz GENIE3 (der auf stationären Daten basiert) bei Zeitreihendaten schlecht abschneidet [17]. Daher wird vorgeschlagen, dass der für den Inferenzprozess verfolgte Ansatz die Informationen mehrerer Zeitpunkte nutzen sollte, um die Interaktionen zwischen den Genen besser zu erfassen.

In Genregulationsnetzwerken [18, 19] interagieren Gene miteinander, um spezifische Zellfunktionen auszuführen. Gen-Gen-Interaktionen sind regulatorische Interaktionen zwischen einem Regulatorgen (auch als Transkriptionsfaktor (TF) bekannt) und einem Zielgen. Ein Zielgen wird in Abhängigkeit von der Aktivität regulierender Gene exprimiert. Die Wechselwirkung vom Regulatorgen zu einem Zielgen kann entweder aktivierend oder hemmend sein. Die aktivierende Regulation beschleunigt die Produktion des Zielgens (und das Zielgen wird exprimiert), während sie bei der Hemmung der Regulation die Produktion des Zielgens noch weniger verlangsamt, als sie in Abwesenheit dieses hemmenden regulierenden Gens produziert (exprimiert) wurde. Im Allgemeinen gibt es eine gewisse Synthesekonstante, die mit der Produktion jedes Zielgens verbunden ist. Aus diesem Grund kann ein Gen auch in Abwesenheit eines Regulatorgens (wenn auch auf sehr niedrigem Niveau) exprimiert werden [7, 20]. In ähnlicher Weise ist mit jedem Gen eine Zerfallskonstante verbunden. Der Genabbau ist jedoch ein langsamerer Prozess als die Gensynthese. Somit kann bei Vorliegen einer inhibierenden Regulation das Nettoergebnis als das des Abbaus des Zielgens angesehen werden [7, 20].

Genexpressionsdaten liegen in Form von kontinuierlichen Genexpressionsniveaus vor. Bei der Genregulation verbleibt ein Regulatorgen in seiner inaktiven Form, bis es eine Schwellenkonzentration erreicht. Erst wenn seine Konzentration über die Schwellenkonzentration ansteigt, wird es aktiv [21]. Die sigmoide Form der realen Interaktion in der Genregulation kann in ihrer logischen Abstraktion als Stufenfunktion interpretiert werden [22]. Daher kann der Regulationsmechanismus von Genen in der Schalterform, also EIN oder AUS, interpretiert werden. Aus einer logischen Abstraktionssicht heftet sich ein Regulatorgen (oder TF) in seinem ON-Zustand an die DNA und initiiert die Regulation eines Zielgens. Somit geht das Zielgen bei seiner Produktion vom AUS- in den EIN-Zustand über. Die Diskretisierung von Zeitreihendaten hilft bei der Identifizierung potenzieller Regulatorgene für ein Zielgen.

Forscher haben versucht, das Verhalten von GRNs mit diskreten Daten zu untersuchen. Ito et al. [23] analysieren qualitativ das Verhalten eines GRN unter Verwendung der logischen Abstraktion von Genexpressionsniveaus unter Verwendung von zwei Zuständen AN und AUS und nutzen das Umschalten zwischen zwei Zuständen, um das GRN-Verhalten zu erfassen. Schaub et al. [24] verwendeten viele diskrete Ebenen, um einen Genzustand darzustellen und einige Aspekte biologischer Systeme wie die negative Autoregulation zu modellieren. Somit bewahrt die logische Abstraktion der kontinuierlichen Genexpressionswerte die qualitativen Merkmale der Systemdynamik wie Oszillationsverhalten, Steady-State und Erreichbarkeit [22]. Küffneret al. [25] schlugen ein Petrinetzmodell mit Fuzzy-Logik (PNFL) für die GRN-Inferenz vor. Die PNFL ist ein diskreter regelbasierter Ansatz, der Simulationen durchführt, um die Systemdynamik zusammen mit seiner Topologie abzurufen.

In diesem Beitrag werden wir einen diskreten systembasierten Ansatz für die Inferenz von GRNs vorstellen, während wir uns mit den Themen Rauschen und Stochastik befassen. Ein diskreter systembasierter Ansatz bedeutet, dass der Ansatz auf einem diskreten System basiert, bei dem eine zählbare Anzahl von Genexpressionsniveaus in den Daten vorhanden ist.


Ergebnisse

Genomsequenzierung, -aufbau und -charakterisierung

Das Genom der harten Muschel M. Söldner wurde mit Illumina-Reads, PacBio Single Molecule Real-Time (SMRT), 10X Genomics und Hi-C-Sequenzierung (Zusätzliche Datei 2: Tabelle S1) sequenziert, was zu einer Referenzbaugruppe von 1,79 GB mit einem Contig N50 = 1,77 Mb führte (Zusätzliche Datei 2: Tabelle S2). Die grosse von M. Söldner Genom wurde auf 1,78 GB (mit 1,34% Heterozygotie) geschätzt, basierend auf k-mer-Analyse (Zusatzdatei 2: Tabelle S3), die nahe an der mittels Durchflusszytometrie geschätzten Genomgröße liegt [30]. Die Hi-C-Sequenzierung wurde verwendet, um 1541 Gerüste mit einer Größe von 1,74 GB (Gerüst N50 = 91,38 Mb) in 19 zusammenhängende Chromosomen zu positionieren und auszurichten, die mit der Haploidnummer übereinstimmen (Abb. 1a, Zusatzdatei 4: Abb. S2 und Zusatzdatei 2: Tabelle S4). Der Zusammenbau auf Chromosomenebene war von hoher Integrität und Qualität, da über 95 % der Illumina-Kurzinsert-Reads erfolgreich dem Zusammenbau zugeordnet werden konnten (Zusätzliche Datei 2: Tabelle S5). Die BUSCO-Bewertung ergab eine 90,5%ige Vollständigkeit der konservierten Kerngene (Zusatzdatei 2: Tabelle S6), die vergleichbar oder etwas niedriger ist (wahrscheinlich aufgrund des großen Genoms der Muschel, des hohen Polymorphismus und der Verwendung eines nicht inzuchtierten Individuums). als die von veröffentlichten zweischaligen Genomen.

Charakterisierung und phylogenetische Analyse des Genoms der harten Muschel. ein Genomische Landschaft der harten Muschel. Von äußeren zu inneren Kreisen: a, die 19 Chromosomen auf der Mb-Skala b, IAP-Gennummer auf jedem Chromosom c, chromosomale Verteilung von 159 IAPs, wobei äußere und innere Linien Sense- bzw. Antisense-Stränge anzeigen. Jeder Bindestrich am Kreisrand steht für eine IAP-Genkopie d

h, DNA-Transposonsdichte, TE-Dichte, Wiederholungsdichte, Gendichte bzw. GC-Dichte über das Genom, gezeichnet in nicht überlappenden 1-Mb-Fenstern. B Zeitkalibrierter phylogenetischer Baum der Hartmuschel innerhalb von Metazoen. Zahlen auf den Zweigen geben die Anzahl der gewonnenen (+, grün) und verlorenen (−, rot) Gene an. Pfu, Pinctada fucata Lebenslauf, Crassostrea virginica Meilen pro Stunde, Modiolus philippinarum Afa, Azumapekten farreri Frau, Mercenaria mercenaria Rph, Ruditapes philippinarum Csq, Chrysomallon squamiferum Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aka, Aplysia californica Adu, Architeuthis dux Obi, Oktopus bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ein Ich, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. C Die Top 10 der erweiterten und die Top drei der zusammengezogenen Pfade, die in der harten Muschel angereichert wurden

Annotation mit EVidenceModeler, die Ab-initio-Vorhersage, Homologie zu anderen Spezies und RNA-Seq-Daten kombiniert, identifiziert 34.283 Gene [31, 32] (Zusatzdatei 2: Tabelle S7). Der Gensatz der Hartmuschel ist etwas größer als der der meisten bisher sequenzierten Muscheln, aber ähnlich dem der Östlichen Auster Crassostrea virginica (34.596) und kleiner als die der Muschel Modiolus philippinarum (36.549). Im Allgemeinen kodieren zweischalige Genome mehr Gene und zeigen einen höheren Polymorphismus als das menschliche Genom (Zusatzdatei 2: Tabelle S8). Transposable Elemente (TEs) machten 49,11% des Genoms mit DNA-Transposon (34,24%), langen terminalen Wiederholungen (LTRs, 10,04%) und langen eingestreuten Elementen (LINEs, 7,17%) aus, die die 3 Haupttransposonklassen umfassen (Zusätzliche Datei 2 : Tabelle S9).

Erweiterung der Apoptose-bezogenen Domänen und des Co-Expressionsnetzwerks

Um die phylogenetische Position der Muschel zu bestimmen, wurden neunzehn Metazoen-Genome (Abb. 1b) von Cnidaria, Annelida, Mollusca, Arthropoda, Chordata und Vertebrata für die Genfamilien-Clusterung ausgewählt, die 43.245 Genfamilien identifizierte, darunter 237 Single-Copy-Genfamilien . Die Single-Copy-Gene der 19 Metazoen-Genome wurden für die phylogenetische Analyse mit einer Maximum-Likelihood-Methode verwendet. Wir datierten die Divergenzzeit der harten Muschel von ihrem nächsten Knoten (Ruditapes philippinarum) bis ca. 178,9 Mio. (Abb. 1b). Vom gemeinsamen Heteroconchia-Vorfahren zu M. Söldner, 229 Genfamilien mit signifikanter Anreicherung von Genen, die mit Immunantwort- und Apoptosewegen verbunden sind, wie NOD-ähnlicher Rezeptorsignalisierung, Ubiquitin-vermittelter Proteolyse und TNF-kappa B-Signalisierung ( 1c , zusätzliche Datei 3: Tabelle S10), erweitert. Die Erweiterung von Immun- und Apoptose-verwandten Genfamilien legt nahe, dass diese Genfamilien für die Anpassung der Muschel wichtig sind.

Da die Apoptose einer der am stärksten erweiterten Wege in M. Söldner, konzentrierten wir die weitere Analyse auf den Apoptoseweg einschließlich regulatorischer Signalwege wie NOD-ähnlicher Rezeptorsignalweg und TNF-kappa B-Signalweg. Wir suchten nach Apoptose-bezogenen Domänen im Genom von M. Söldner und verglichen unsere Ergebnisse mit denen anderer Spezies (Abb. 2), um die Expansion von Genen im Zusammenhang mit Apoptose weiter zu charakterisieren. Sieben kanonische Domänen im Zusammenhang mit Apoptose, BIR, TNF, DEATH, CARD2, TIR2 (Toll/Interleukin-Rezeptor 2), RING und Hsp70 wurden stark erweitert in M. Söldner und andere Muscheln (Abb. 2). Insbesondere die Co-Expansion von TNFs und BIRs unterstützt eine verbesserte Regulation der Apoptose, da beim Menschen TNF und IAP (BIR-enthaltendes Protein) zusammenarbeiten, um das Zellschicksal zu regulieren. Zum Beispiel moduliert TNF verschiedene zelluläre Reaktionen, einschließlich Apoptose und Nekroptose, über mehrere Signalkomplexe, die aus der TNFR-Superfamilie stammen, mit cIAPs als integraler Komponente, die die Rekrutierung von nachgeschalteten Signalwandlern beinhaltet [11,12,13]. Die Zahl der BIR-Domänen-enthaltenden Gene in Hard Clam ist mit 177 Kopien die höchste (P < 0,001) unter allen untersuchten Metazoen (Abb. 2). Die signifikante Erweiterung von Domänen im Zusammenhang mit Apoptose bei Muscheln und anderen Muscheln legt nahe, dass Muscheln einen starken und komplexen Gensatz zur Regulierung von Apoptose und zellulärem Stress aufweisen können.

Verteilung von Protein-Pfam-Domänen im Zusammenhang mit Apoptose in Weichtieren und anderen Metazoen. Frau, Mercenaria mercenaria Rph, Ruditapes philippinarum Afa, Azumapekten farreri Meilen pro Stunde, Modiolus philippinarum Lebenslauf, Crassostrea virginica Pfu, Pinctada fucata Csq, Chrysomallon squamiferum Lgi, Lottia gigantea Bgl, Biomphalaria glabrata Aka, Aplysia californica Adu, Architeuthis dux Obi, Oktopus bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ein Ich, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. Domänenabkürzungen: Bcl-2, Apoptose-Regulatorproteine, Bcl-2-Familie CARD, Caspase-Rekrutierungsdomäne DED, Todeseffektordomäne IAP, Inhibitor der Apoptosedomäne NACHT, eine Domäne, die in NAIP-, CIITA-, HET-E- und TEP1-Proteinen vorkommt NB-ARC , ein Nukleotid-bindender Adapter, der von APAF-1, bestimmten R-Genprodukten und CED-4 TIR, Toll/Interleukin-1-Rezeptordomäne TNF, Tumornekrosefaktor TNFR, Tumornekrosefaktorrezeptor zf-C3HC4_3, Zinkfinger, C3HC4-Typ . geteilt wird (Ringfinger). Erweiterung in M. Söldner oder Muscheln wird durch ein signifikantes, korrigiertes . angezeigt P Wert (P < 0,001), aus Chi-Quadrat-Tests auf Überrepräsentation, unter Verwendung aller annotierten Gene als Hintergrund. Farbe, von grau bis rot, zeigt die Rangfolge von unten nach oben an

Um die Rolle von IAPs bei der angeborenen Immunantwort der Muschel zu untersuchen, führten wir eine gewichtete Gen-Co-Expressions-Netzwerkanalyse (WGCNA) an 39 Transkriptomen aus 10 Organen durch, wobei wir uns auf Gene konzentrierten, die eine erhöhte Konnektivität in Hämolymphe, Hepatopankreas und Kiemen, den primären Organen, zeigen zur ersten Abwehr von Krankheitserregern. Zuerst identifizierten wir 19.548 organassoziierte Gene, die zwischen zwei beliebigen Organen unterschiedlich exprimiert wurden. Unsere Analyse identifizierte 11 Genmodule mit braunen, roten und türkisfarbenen Modulen, die eine signifikante Korrelation mit Hämolymphe, Hepatopankreas bzw. Kiemen zeigten (Abb. 3a, b). Die Hartmuschel wies klare organspezifische transkriptomische Signaturen auf. Gene, die in Hämolymphe prominent exprimiert werden, sind mit Komplement- und Gerinnungskaskaden und dem TNF-Signalweg verbunden, und diese transkriptomischen Signaturen wurden mit anderen Weichtieren geteilt (Zusatzdatei 5: Abb. S3). Insbesondere Apoptose-assoziierte Gene wurden in Transkriptomen von Hämolymphe und Kieme extensiv angereichert (Zusatzdatei 5: Abb. S3 und Zusatzdatei 6: Abb. S4). Im Co-Expressionsnetzwerk der 20 KEGG-Signalwege, die mit Hämolymphe-spezifisch exprimierten Genen (braune Modulgene) angereichert sind, waren die apoptotischen Signalwege mit NF-kappa-B-Signalwegen, TNF-Signalwegen, NOD-ähnlichen Rezeptor-Signalwegen und Krebswegen verbunden. Diese Ergebnisse weisen darauf hin, dass Wechselwirkungen zwischen diesen Signalwegen ein Netzwerk bilden, das Zelltod und -überleben, zelluläre Homöostase und Immunität bei der Muschel (der braune Schatten in Zusatzdatei 6: Abb. S4) reguliert. In den Top 20 der angereicherten KEGG-Wege des braunen Moduls wurden viele Gene als IAPs annotiert und in apoptotischen Wegen angereichert (29/45). IAPs zeigten auch eine umfangreiche und robuste Koexpression mit anderen Genen im braunen Modul bei einem gewichteten Korrelationskoeffizienten-Cutoff von > 0,35 (oberste 3%) (Zusatzdatei 7: Abb. S5). Dieser Befund weist darauf hin, dass die Apoptose-Regulierung eine wichtige Rolle bei der Immunantwort bei Muscheln spielen kann.

Co-Expressionsnetzwerkanalyse von organspezifischen Genen in der Muschel mit Fokus auf Kandidatengene für die Immunantwort in Hämolymphe. ein Modulaufbau eines Genexpressionsnetzwerks für 39 Proben. Te, Hoden Ov, Eierstock Ma, Mantel Gi, Kieme Fo, Fuß In, Darm Hep, Hepatopankreas St, Magen Ad, Adduktoren Hem, Hämolymphe. B Korrelationsmatrix zwischen Modulen und Organen. P Der Wert wird in jeder Zelle angezeigt und die Farbe zeigt den Korrelationskoeffizienten an

IAP-Erweiterung durch Tandemduplikation und Retroposition

Einige der BIR-Domänen-enthaltenden Gene (Fig. 2) waren unvollständig, und eine weitere Analyse identifizierte 159 echte IAPs (Fig. 1a und 4b), was der Muschel das größte bisher identifizierte IAP-Genrepertoire gab. Die Erweiterung der IAP-Familie in der harten Muschel beinhaltete mehrere Ereignisse lokaler Tandemduplikation und Retroposition. Massive Tandemduplikationen wurden auf den Chromosomen (Chr) 5, 6 und 7 beobachtet. Von den 159 IAPs waren 59 (37,1%) dicht in Tandem-Arrays auf Chr 5 verknüpft, während 22 (13,8%) und 12 (7,6%) waren Tandem dupliziert auf Chr 6 bzw. 7 (Abb. 1a). Ein Beispielarray enthält 6 tandemartig replizierte IAPs, die sich bei 12.280–12.370 Kilobasen (kb) auf Chr 5 befinden und in die gleiche Richtung transkribiert wurden, ohne dass andere Gene dazwischen eingestreut wurden (Fig. 5a).

Domänenarchitekturen von IAPs der harten Muschel (links, in dieser Studie identifiziert) und des Menschen (rechts, modifiziert nach Kocab et al. 2016) (ein) phylogenetischer Stammbaum von 159 IAPs der harten Muschel (B) Verteilung von Domänenarchitekturen (C) und Intronzahl aus verschiedenen phylogenetischen Kladen (D)

Divergenz im Expressionsprofil von duplizierten IAPs in der harten Muschel. ein Tandemduplikation von sechs IAPs in a

90-kb-Region, mit Expressionsdivergenz zwischen verschiedenen Organen und Stadien während der Luftexposition. B Selektiver Druck auf die sechs duplizierten IAPs. C Die Genmodellvorhersage für die sechs duplizierten IAPs-Linien repräsentieren Introns und Kästchen repräsentieren Exons. Regionen, die unterschiedliche Domänen codieren, werden entsprechend eingefärbt. Zahlen über Introns geben die Phase jedes Introns an. D In Hard-Clam-IAPs gefundene Domänengrenzen

Zusätzlich zur Tandemduplikation war ein signifikanter Anteil der IAPs (51, 32,1%) intronlos und schien zufällig über die Chromosomen verteilt zu sein (Zusatzdatei 8: Tabelle S11), was auf eine Retroposition hinweist. Phylogenetische Analysen der 159 IAPs ergaben 6 diskrete Kladen mit geringen genetischen Abständen und 4 weitere Gene außerhalb dieser Kladen. Klade 1 enthielt 49 IAPs (Abb. 4b), von denen 42 intronlos waren und ähnliche Domänenarchitekturen aufwiesen (ein Exon kodierte BIR ohne Intron), was auf einen Retropositions-Burst von einem gemeinsamen „elterlichen“ Gen hindeutet. Daher spekulieren wir, dass sowohl Tandemduplikation als auch Retroposition die evolutionäre Expansion von IAPs im Genom der Hartmuschel befeuert haben.

Mechanistisch kann die Genduplikation durch assoziierte TEs erleichtert werden. Die Analyse der TE-Verteilung ergab, dass DNA-Transposons signifikant angereichert waren (P < 0,01) um IAP-Gene (durchschnittliche Dichte = 0,12) im Vergleich zu anderen Genen im Genom (durchschnittliche Dichte = 0,05), während andere Arten von TEs (einschließlich LINE, LTR und SINE) keinen signifikanten Unterschied zeigten (Zusatzdatei 9: Abb.) S6). Dieser Befund weist darauf hin, dass DNA-Transposons möglicherweise eine Rolle bei der massiven Expansion der IAP-Gene im Genom der harten Muschel gespielt haben.

Häufiges Domain-Shuffling führte zu Diversität in der IAP-Struktur

Um die Entwicklung von IAPs nach der Duplizierung zu verstehen, haben wir die Domänenarchitektur von Clam-IAPs in sieben Typen A–G (Abb. 4a) eingeteilt, basierend auf der Kopienzahl der BIR- und RING-Domänen, die für die Funktion von IAPs entscheidend sind. Bei Hard-Clam-IAPs wurde umfangreiches Domain-Shuffling festgestellt. Wie durch die Klassifizierung der Domänenarchitektur und die phylogenetische Analyse ( 4b ) gezeigt wurde, können zusammengeclusterte IAPs von demselben Vorfahrengen abgeleitet sein und die Domänenarchitektur variiert innerhalb desselben Clusters. Clam-IAPs in derselben Klade (2–5) bestanden aus 3 bis 6 verschiedenen Domänenarchitekturtypen, wobei jede Klade eine dominante Domänenarchitektur (> 50%) und unterschiedliche Anteile abgeleiteter Typen (36% bis 43%) aufwies (Abb 4c). Die vielfältige Domänenstruktur wird von Domänen-Shuffling abgeleitet, d. h. durch Gewinnen oder Verlust der BIR/RING-Domänen. Zum Beispiel zeigten die 6 tandemartig duplizierten IAPs in einer 90-kb-Region auf Chr 5 (Abb. 5a, Zusätzliche Datei 8: Tabelle S11) drei Arten von Domänenarchitekturen, C, F und G (Abb. 4a), was darauf hindeutet, dass Während oder nach der Tandem-Duplizierung ist ein Domain-Shuffling aufgetreten.

Um zu untersuchen, wie sich die Umordnung von Domains ausgewirkt hat IAP Genstruktur untersuchten wir die Intron-Exon-Struktur der BIR-, RING-, BIRC6- und UBA-Domänen (Fig. 5d). Bemerkenswerterweise zeigte jede Domäne hochkonservierte Intron-Exon-Strukturen. Während die RING-Domäne innerhalb eines einzelnen Exons am Ende des Gens gebunden war, hatten die meisten Hard-Clam-IAPs (außer denen, die aus der Retroposition stammten) eine anfängliche BIR-Domäne, die die ersten beiden Exons überspannte. Auf die ersten beiden BIR-kodierenden Exons folgte immer ein weiteres Exon, flankiert von Phase 0 und Phase 1 (oder 2) Introns (in 5c, d eingeklammert). Dieser Befund legt nahe, dass eine BIR-Domäne zusammen mit dem sukzessiven Exon als Multi-Exon-Modul in ein IAP eingefügt werden könnte, oder ähnliche flankierende und interne Intron-Phasen ermöglichten es, die Domänen aus einem Pool von Einzel-Exon-Gebäuden „gemischt und aufeinander abgestimmt“ zu machen Blöcke.

Um zu bestimmen, ob duplizierte IAPs einem unterschiedlichen Selektionsdruck ausgesetzt waren, berechneten wir das nicht-synonyme zu synonyme Substitutionsverhältnis (Ka/Ks) für die 6 tandemartig duplizierten IAPs auf Chr 5 (Abb. 5a). Der Ka/Ks aller 6 duplizierten IAPs war signifikant kleiner als 1 (P Werte reichen von 0

9.74E−47, Abb. 5b), was darauf hinweist, dass sie durch reinigende Selektion funktionell eingeschränkt waren. Die Variation von Ka/Ks von 0,0817 bis 0,4456 legt nahe, dass die duplizierten Gene unterschiedliche Stufen der reinigenden Selektion erfahren haben, was für die Sequenz- und funktionelle Divergenz wichtig sein könnte.

Funktionelle Divergenz duplizierter IAPs

Um zu verstehen, wie IAPs auf Umweltstressoren reagieren, führten wir RNA-seq an den Tagen 0, 8 und 16 durch, nachdem erwachsene Muscheln der Luftexposition ausgesetzt waren. An Tag 8 waren 632 Gene hochreguliert und 343 herunterreguliert, während am Tag 16 506 hochreguliert und 532 herunterreguliert waren. Bemerkenswerterweise war der apoptotische Weg einer der am stärksten angereicherten Wege in Transkriptomen von Muscheln, die einer 8- oder 16-tägigen Luftexposition ausgesetzt waren (Abb. 6c, d). Dies weist darauf hin, dass die Apoptose für die Aufrechterhaltung der Homöostase funktionell wichtig war, da die Exposition aus der Luft zu einer Abnahme des pH-Werts und des Sauerstoffgehalts führt, was zu einer Dysfunktion der zellulären Homöostase führt. Die Anreicherung an Apoptose-assoziierten Genen wurde hauptsächlich der Expression der IAP-Familie zugeschrieben: 17 der 27 differentiell exprimierten Gene (DEGs) aus dem apoptotischen Signalweg waren IAPs am Tag 8 und 12 von 23 am Tag 16 (Abb. 6a .). , B). Neben der Luftexposition verglichen wir auch Transkriptome von Hartmuscheln, die hohen Temperaturen, niedrigem Sauerstoffgehalt und niedrigem Salzgehalt ausgesetzt waren. Insgesamt wurden 134 IAPs unter mindestens einem Umweltstressor unterschiedlich exprimiert, und von 27 DEGs, die alle Stressoren teilten, waren drei IAPs (Zusatzdatei 10: Abb. S7). Diese Ergebnisse zeigen, dass über 84% der erweiterten IAPs (134 von 159) mit bemerkenswerter Spezifität an der Stressreaktion bei der harten Muschel beteiligt sind, was die Bedeutung der Erweiterung und Diversifizierung von IAPs bei der Stressreaktion und -anpassung unterstreicht.

Transkriptomantwort von harten Muscheln, die Luftbelastungsstress und Divergenz der IAP-Expression ausgesetzt waren. ein, B Vulkanplots von differentiell exprimierten Genen (DEGs) (8 Tage vs. 0 Tage und 16 Tage vs. 0 Tage). C, D, KEGG-Wege angereichert in DEGs (8 Tage vs. 0 Tage und 16 Tage vs. 0 Tage). e, F Koordinierte Expression von harten Muschel-IAPs zwischen Organen und während der Luftexposition. IAPs mit einem durchschnittlichen FPKM< 0,1 wurden als still betrachtet und ausgeschlossen

Die duplizierten IAPs zeigten unterschiedliche Expressionsprofile, sowohl räumlich in verschiedenen Organen als auch zeitlich während des Umweltstresses, was auf funktionelle Divergenz und Koordination schließen lässt. Funktionelle Divergenz wird nicht nur durch die dedizierte organspezifische Expression verschiedener IAPs (Abb. 6c) impliziert, sondern auch durch unterschiedliche Reaktionen oder Expressionsmuster von IAP-Mitgliedern auf spezifische Umweltstressoren, beispielhaft dargestellt durch die differenzierte Reaktion auf Luftexposition (Abb. 6d .). ) und unterschiedliche Sensitivität oder Reaktionsfähigkeit auf verschiedene Umweltstressoren (Zusatzdatei 11: Abb. S8), wobei die Hämolymph-exprimierten IAPs (braunes Modul von WGCNA) eine deutliche Expressionsdivergenz als Reaktion auf verschiedene Stressoren zeigten. Die IAPs in der grünen Klade reagieren empfindlich auf Luftbelastungsstress, während die in der violetten Klade empfindlich auf niedrigen Salzgehalt reagieren und die in der blauen Klade empfindlich auf Hitzestress reagieren.

Sowohl auf Klade-Ebene als auch hinsichtlich des Strukturtyps (Zusatzdatei 12: Abb. S9 und Zusatzdatei 13: Abb. S10) war die Ausprägung von IAPs als Reaktion auf Umweltstress sehr variabel. Im Allgemeinen zeigten IAPs in den Kladen 2, 3 und 5 eine ähnliche Expressionsdynamik, da sie alle hochreguliert wurden, wenn Muscheln thermischen, osmotischen oder Luftbelastung ausgesetzt waren, jedoch mit unterschiedlichen Expressionsniveaus und Organspezifität. Im Vergleich zu den IAPs in den Kladen 2, 3 und 5 waren diejenigen in Klade 4 weniger empfindlich gegenüber Umweltvariablen und Klade 6 zeigte fast entgegengesetzte Expressionsmuster. IAPs mit unterschiedlichen Strukturtypen (A

E) zeigte auch unterschiedliche Expressionsmuster, beispielsweise zeigten D-Typ-IAPs, die gegenüber Umweltstressoren besonders empfindlich waren, eine klare Organspezifität: hohe Expression im Mantel und geringe Expression in der Hämolymphe. Im Gegensatz dazu zeigten IAPs vom B-Typ eine ähnliche Reaktion auf Umweltstress, hatten jedoch die höchste Expression in der Hämolymphe. IAPs vom E-Typ zeigten einen entgegengesetzten Trend zu den B- und D-Typen bei der Reaktion auf mehrere Stressoren.

Die Vorstellung von orchestrierter Expression nach Duplikation wird durch die sechs tandemartig duplizierten IAPs auf Chr 5 (Abb. 5a) verstärkt, die eine konstitutive Reaktion auf Luftexposition und divergente Organexpressionsbias zeigten: Die Gene 5.357 und 3.578 erreichten die höchsten Expressionsniveaus 8 Tage nach Luftexposition, 5,359 und 3,360 waren nach 16 Tagen stark exprimiert, und 3,61 und 3,62 zeigten keine signifikanten Veränderungen. In Bezug auf die unterschiedliche Expression zwischen den Organen zeigte 5.357 die höchste Expression in den Kiemen, 5.357

5,360 wurden in Hämolymphe deutlich überexprimiert, während 5,361 und 5,362 einheitlich exprimiert wurden.

Entwicklung des IAP-Repertoires unter mehreren Stämmen

Um den evolutionären Ursprung vorhandener IAPs zu erforschen, wurde ein phylostratigraphischer Ansatz mit einem E < e −10 Cutoff angewendet, um das Alter von IAPs und organspezifischen Genen abzuschätzen. Wir haben 10 phylogenetische Ränge (Phylostrata) auf der Grundlage der NCBI-Taxonomiedatenbank definiert und das erste Phylostratum (PS1) als Ursprungsort des zellulären Lebens (dh die ältesten Gene) und das letzte Phylostratum (PS10) als harte Muschellinie in der Untersuchung verwendet (dh jüngste Gene). Organspezifische Gene in Hämolymphe, Hepatopankreas und Kieme zeigten ein ähnliches Gen-Alter-Muster, wobei nur hepatopankreasspezifische Gene einen erhöhten Anteil an ältesten (+ 11 %) und einen geringeren Anteil an jüngsten (− 9 %) Genen enthielten. Die meisten erweiterten IAPs der Hartmuschel datieren vor dem Ursprung von Metazoen (50%) und Bilateria (47%), während ein IAP (ID, Mme.02 g01599.1, angezeigt durch ein blaues Dreieck in Abb. 7a) zuerst auftrat mit dem Aufkommen der Eukaryoten. Dieses Gen war einzigartig in Struktur und Größe bei einer Länge von 90,83 kb (Zusatzdatei 8: Tabelle S11) und enthielt eine BIR6-Domäne (G2-Typ in Fig. 4a). In ähnlicher Weise unterscheidet sich ein Säuger-IAP mit der Bezeichnung Apollon (4,88 kb und ebenfalls mit einer BIR6-Domäne) strukturell von klassischen Metazoen-spezifischen IAPs und weist Homologie zu einem Protein in Hefe auf [33]. Unsere Ergebnisse stützen die Existenz von zwei Linien von IAPs, eine ist die BIR6-enthaltende IAP, die uralt ist und ihren Ursprung in Eukaryoten hat, und die andere Linie sind die BIR-enthaltenden IAPs, die von mehrzelligen Organismen geteilt werden [33].

Ursprung von harten Muschel-IAPs und IAP-Evolution in verschiedenen Metazoen-Linien. ein Evolutionärer Ursprung von IAPs und organspezifischen Genen bei Muscheln. Phylostratigraphische Analysen von IAPs (blau), hämolymphspezifischen (braun), hepatopankreasspezifischen (rot) und kiemenspezifischen (türkis) Genen über 10 Phylostrata. Es wurden nur Gene eingeschlossen, für die mindestens ein signifikanter BLAST-Treffer (< e−10) zurückgegeben wurde. B Erweiterung und Kontraktion des IAP-Repertoires über 18 Arten aus verschiedenen Metazoen-Linien. Gengewinn- und Genverlustereignisse werden dem Artenbaum zugeordnet, angezeigt durch grüne bzw. rote Zahlen. Zahlen in gelben Kästchen geben die vorhergesagte Vorfahren-IAP-Nummer jedes Knotens an. Der blaue Block zeigt Bivalvia an. Meilen pro Stunde, Modiolus philippinarum Pfu, Pinctada fucata Lebenslauf, Crassostrea virginica Afa, Azumapekten farreri Frau, Mercenaria mercenaria Rph, Ruditapes philippinarum Aka, Aplysia californica Bgl, Biomphalaria glabrata Lgi, Lottia gigantea Csq, Chrysomallon squamiferum Adu, Architeuthis dux Obi, Oktopus bimaculoides Cte, Capitella teleta Hro, Helobdella robusta Ein Ich, Apis mellifera Dme, Drosophila melanogaster Hsa, Homo sapiens Bfl, Branchiostoma floridae Nve, Nematostella vectensis. C Verteilung von IAPs mit unterschiedlichen Domänenarchitekturen in 19 Arten von Metazoa. Asterisk zeigt zweischalige Domänenarchitekturen mit einem signifikanten korrigierten . an P Wert (P < 0,0001) aus Chi-Quadrat-Tests auf Überrepräsentation, wobei alle annotierten Gene als Hintergrund verwendet werden

Wir identifizierten weiterhin intakte IAPs unter 19 Arten und verwendeten einen phylogenetischen Rahmen, um das evolutionäre Schicksal dieser IAPs über mehrere Tierstämme hinweg zu verfolgen (Abb. 7b). Der jüngste gemeinsame Vorfahre (MRCA) aller Metazoen hatte schätzungsweise 13 IAPs, während die sukzessive Erweiterung der IAP-Familie wahrscheinlich im gemeinsamen Mollusken-Vorfahren und nachfolgenden Abstammungslinien stattfand. Es gab eine signifikante Ausweitung bei Muscheln, die bei anderen Taxa nicht vorkam (blauer Block in Abb. 7b). Die Expansion von zweischaligen IAPs war hauptsächlich linienspezifisch (Abb. 8), da Paraloge innerhalb derselben Art sich zusammenballten, was darauf hindeutet, dass ihre Expansion nach der Artbildung erfolgte. Die signifikante Verbreitung von IAPs in mehreren Muschellinien impliziert eine konvergente Evolution einer verbesserten Apoptose-Regulierung in stationären Muscheln, die mit Umweltstress ohne die Fähigkeit zur Vermeidung fertig werden müssen.

Phylogenetische Analyse von IAPs aus Mercenaria mercenaria (Frau), Crassostrea virginica (Cvi), Crassostrea gigas (Cgi), Biomphalaria glabrata (Bgl), und Homo sapiens (Hsa) Das Dendrogramm wurde unter Verwendung der Bayes-Analyse mit dem WAG-Substitutionsmodell erzeugt. Die Domänenarchitektur ist in Abb. 4a definiert

Die massiv expandierten zweischaligen IAPs wurden von den Strukturtypen der B-, C-, F- und G1-Domänen dominiert (Fig. 7c), die aus einer oder zwei BIR-Domänen bestehen, die mit einer RING-Domäne gekoppelt oder entkoppelt sind. Sie unterschieden sich erheblich von anderen IAP-Typen (d. h. A, D, E, G2 und G3), die in allen Tierstämmen weniger Kopien (< 5) aufweisen. Darüber hinaus kann die Domänenanordnung der D-, E- und G3-Typen über Domänengewinn (eine zusätzliche BIR), Verlust (fehlende RING-Domäne) und Kooptation (kooptierter PC4) aufgetreten sein, während H- und I-Typen beim Menschen sind wahrscheinlich strukturelle Innovationen, die die Domänen CARD, NACHT, NOD2_WH und NLRC4_HD übernommen haben.


Resultate und Diskussionen

Die Unterdrückung metabolischer transkriptionaler Masterregulatoren geht der Lipidakkumulation während des ER-Stresses voraus

Die Lipidakkumulation kann in der Leber durch Exposition gegenüber dem Inhibitor der N-gebundenen Glykosylierung Tunicamycin (TM) oder dem proteasomalen Inhibitor Bortezomib oder durch Überexpression eines fehlgefalteten ER-Client-Proteins wie dem Gerinnungsfaktor VIII induziert werden [GenBank: <"Typ": "entrez-nucleotide","attrs":<"text":"NM_001161373.1","term_id":"238624181","term_text":"NM_001161373.1">> NM_001161373.1] (Rutkowski et al., 2008 Zhang et al., 2011 Chikka et al., 2013). Jede dieser Behandlungen aktiviert entweder die UPR oder die integrierte Stressreaktion und führt jeweils zu qualitativ ähnlichen Veränderungen in der Expression wichtiger Stoffwechselgene in der Leber. Zu diesen Genen gehören sowohl Transkriptionsfaktoren und Cofaktoren, die an der Kontrolle des Stoffwechsels beteiligt sind, als auch die nachgelagerten Ziele dieser Faktoren, die die wichtigsten funktionellen Enzyme codieren, die am Lipidkatabolismus, -anabolismus, -speicherung und -sekretion beteiligt sind (Rutkowski et al., 2008).

Die zeitliche Organisation dieser Genregulationsänderungen vor und nach dem Einsetzen der Lipidakkumulation wurde nicht analysiert. Es ist wahrscheinlich, dass das früheste dieser regulierten Ereignisse direkt mechanistisch mit dem UPR und/oder der integrierten Stressreaktion verbunden ist. Daher haben wir den zeitlichen Verlauf der hepatischen Lipidakkumulation bei Wildtyp-Mäusen als Reaktion auf TM untersucht, die ein robusterer Induktor von ER-Stress und Steatose als andere Stimuli ist (Chikka et al., 2013). Wir überwachten die Lipidakkumulation nach drei verschiedenen Kriterien: Akkumulation von Oil Red O in Lipidtröpfchen von frisch gefrorenen Leberschnitten (Abbildung ​ (Abbildung 1A) 1A ) immunhistochemischer Nachweis des Lipid-Tröpfchen-assoziierten Proteins Adipophilin (ADRP) [GenBank: <" type":"entrez-nucleotide","attrs":<"text":"NM_007408.3","term_id":"116235488","term_text":"NM_007408.3">> NM_007408.3] (Abbildung & #x200B (Abbildung 1B) 1B) und direkte biochemische Bestimmung der hepatischen Triglyceridspiegel (Abbildung ​ (Abbildung 1C). 1C). Die Ergebnisse aus allen drei Assays waren ähnlich: Der Leberlipidgehalt stieg am stärksten zum Zeitpunkt 8 h an. Daher treten die wichtigsten genetischen regulatorischen Ereignisse, die für die Veränderung des Lipidstoffwechsels verantwortlich sind, wahrscheinlich vor 8 Stunden auf, während diejenigen, die später als 8 Stunden nach der Exposition auftreten, eher Sekundäreffekte sind, die tangential zur Lipidstörung beitragen, wenn überhaupt.

ER-Stress verursacht innerhalb von 8 h eine erhebliche Lipidakkumulation in der Leber. (EIN) C57BL/6J-Mäuse wurden für die angegebenen Zeiten mit 1 mg/kg TM provoziert, die Leber wurde in OCT eingefroren und die Lipide wurden mit Oil Red O gefärbt. Skalenbalken = 50 &mgr; (B) Gleich wie (EIN), außer dass der Lipidgehalt durch immunhistochemische Färbung für das Lipidtröpfchenmarkerprotein ADRP bestimmt wurde. Maßstabsbalken = 50 μm. (C) Gleich wie (EIN), außer dass der Triglyceridgehalt durch einen kolorimetrischen Assay nach Extraktion von neutralen Lipiden gemessen wurde. P < 0,001 nach Einweg-ANOVA. n = 3 Proben pro Zeitpunkt. Fehlerbalken zeigen hier und anderswo bedeutet ± SDM.

Als nächstes untersuchten wir den Zeitpunkt der UPR-Aktivierung und der Regulation metabolischer Gene.TM führte zu einem maximalen IRE1α-abhängigen Spleißen von Xbp1 mRNA innerhalb von 2 h dieses Spleißen dauerte 8 h an, wurde jedoch zu späteren Zeitpunkten verringert (Abbildung ​ (Abbildung 2A). 2A). Ebenso wurde jedes UPR-regulierte Zielgen nach 2 h signifikant hochreguliert, erreichte seinen Höhepunkt bei 4𠄸 h und nahm danach ab (Abbildung ​ (Abbildung2B). 2B). Diese Gene hängen in unterschiedlichem Maße von der Aktivität jedes der drei UPR-Wege ab (Harding et al., 2003 Lee et al., 2003 Wu et al., 2007). Dass sie nach 2 h gleichmäßig hochreguliert sind, legt nahe, dass jeder der drei kanonischen UPR-regulierten Transkriptionsaktivatoren𠅊TF6α, ATF4 und XBP1— zu diesem sehr frühen Zeitpunkt funktionell aktiv ist.

Gestaffelte Suppression metabolischer Gene während ER-Stress. (EIN) Die gespleißten (spl) und ungespleißten (us) Formen von Xbp1 mRNA wurde durch RT-PCR von Gesamt-RNA nachgewiesen, die aus den Lebern von Mäusen isoliert wurde, die mit Vehikel (Vehikel) oder 1 mg/kg TM für die angegebenen Zeiten behandelt wurden. Jede Spur zeigt ein separates Tier. Das Bild wird in umgekehrter Schwarz-Weiß-Form angezeigt, um eine größere visuelle Klarheit zu gewährleisten. (B) Die Expression der angegebenen UPR-Zielgene wurde durch qRT-PCR von den in gezeigten Tieren bestimmt (EIN), mit Btf3 und Ppia als normalisierende Kontrollen verwendet. Der Ausdruck hier und in den nachfolgenden Abbildungen erfolgt auf einem Protokoll2 Maßstab relativ zum fahrzeugbehandelten Zustand. Hier und anderswo, sofern nicht anders angegeben: * P < 0,05 # P < 0.1 von zweischwänzigen Studenten T-Prüfung. (C𠄿) Die Expression metabolischer Gene wurde durch qRT-PCR wie in (B), und Gene wurden nach dem Zeitpunkt gruppiert, zu dem die Herunterregulierung (P < 0.1) wurde zuerst beobachtet. Der Prozess, an dem jedes Gen beteiligt ist, ist aufgelistet.

Anschließend analysierten wir die Expression von Genen, die am Fettstoffwechsel beteiligt sind, darunter sowohl transkriptionale Regulatoren als auch geschwindigkeitsbestimmende Stoffwechselenzyme. Wir haben die Gene nach dem Zeitpunkt gruppiert, zu dem sie zum ersten Mal herunterreguliert wurden. Wir haben sofort festgestellt, dass die Regulation von Stoffwechselgenen im Gegensatz zu herkömmlichen UPR-Zielgenen stufenweise erfolgt. Die früheste regulierte Gruppe umfasste ausgewählte Transkriptionsfaktoren und Cofaktoren. Der Koregulator Pgc1b [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_133249.2","term_id":"118131021","term_text":"NM_133249.2">> NM_133249. 2] wurde um 2 h herunterreguliert, jedoch nicht nach 4 h (Abbildung ​ (Abbildung2C), 2C ), was den tatsächlichen Zeitpunkt der Unterdrückung mehrdeutig macht. Im Gegensatz dazu ist nach 4 h der Koregulator Pgc1a [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_008904.2","term_id":"238018130","term_text":"NM_008904.2">> NM_008904. 2] und die Transkriptionsaktivatoren Cebpa [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_007678.3","term_id":"131886531","term_text":"NM_007678.3">> NM_007678. 3] und Ppara [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_001113418.1","term_id":"164663879","term_text":"NM_001113418.1">> NM_001113418. 1] wurden unterdrückt (Abbildung ​ (Abbildung2C). 2C). PGC-1β trägt zur Lipogenese, Fettsäureoxidation und VLDL-Produktion und -Sekretion bei (Lee et al., 2003, Lin et al., 2003, 2005a,b Wolfrum und Stoffel, 2006) und PGC-1α trägt zu die beiden letztgenannten Prozesse (Louet et al., 2002 Lin et al., 2005a Rhee et al., 2006). C/EBPα spielt eine allgemeine Rolle bei der Energiehomöostase, einschließlich des Lipid- und Glukosestoffwechsels, während PPARα ein Hauptregulator der Fettsäureoxidation ist (Desvergne et al., 2006).

Die Gene, die zu einem späteren Zeitpunkt herunterreguliert wurden, d. h. nach dem Einsetzen einer ausgeprägten Lipidakkumulation, umfassten sowohl transkriptionale Regulatoren als auch nachgeschaltete Gene, die geschwindigkeitsbestimmende Enzyme in Stoffwechselprozessen kodieren, wie in Abbildung 2D dargestellt. Diese Ergebnisse legen nahe, dass PGC-1α, C/EBPα und PPARα (und möglicherweise PGC-1β) höchstwahrscheinlich die ersten Lipidstoffwechselgene sind, die durch ER-Stress reguliert werden. Darüber hinaus werden die diesen Faktoren nachgeschalteten Prozesse, nämlich die Fettsäureoxidation und die Lipoproteinbiogenese und der Transport, die ersten durch Genregulationsmechanismen beeinflusst. Da lipogene Gene erst viel später (18 h) verändert werden, legen sie außerdem nahe, dass die Hemmung der Lipogenese eine sekundäre Folge von ER-Stress ist, möglicherweise als Folge einer negativen Rückkopplung, wenn sich Lipide ansammeln. Auch wenn das XBP1-Spleißen durch ER-Stress induziert wird, fanden wir keine Hinweise darauf, dass die lipogene Genexpression stimuliert unter diesen Umständen.

Die Deletion von ATF6α verschlimmert die metabolische Gensuppression

Mäuse, denen ATF6 α fehlt, zeigen, obwohl sie ansonsten scheinbar normal und gesund sind, bei Provokation mit TM eine dramatische Steatose (Rutkowski et al., 2008 Yamamoto et al., 2010). Dieser Phänotyp wird durch die ADRP-Färbung in Abbildung ​ illustriert. Daher kamen wir zu dem Schluss, dass diese Mäuse verwendet werden könnten, um die stressregulierten Veränderungen der Genexpression aufzudecken, die wirklich der Lipiddysregulation zugrunde liegen, da diese Veränderungen in verstärkt werden sollten Atf6α −/− Tiere. Ein zweiter Vorteil dieser Tiere besteht darin, dass sie verwendet werden können, um wirklich auf Stress reagierende Expressionsänderungen zu identifizieren, von denen man nicht erwarten würde, dass sie sich zwischen Wildtyp und unterscheiden, die aus ER-Stress-unabhängigen Eigenschaften von TM resultieren Atf6α −/− Tiere, da nicht angenommen wird, dass ATF6α außerhalb des Kontextes von ER-Stress wirkt und seine Deletion die offensichtliche pharmakologische Aktivität von TM nicht verändert (Rutkowski et al., 2008).

Verlust von Atf6α verschlimmert die Steatose und die langfristige metabolische Gensuppression. (EIN) Wildtyp oder Atf6α −/− Mäuse wurden mit 1 mg/kg TM oder Vehikel für 48 h provoziert, und die ADRP-Immunfärbung wurde wie in Abbildung ​ Abbildung 1 durchgeführt. 1. Maßstabsbalken = 50 μm. (B𠄿) Wildtyp oder Atf6α −/−-Mäuse wurden 34 h lang mit 1 mg/kg TM oder Vehikel gereizt, und die globale mRNA-Expression wurde mit einem Affymetrix-Mikroarray bestimmt. Array-bestimmte Expression der angegebenen Gene wird gezeigt. Gene wurden in den gleichen Gruppierungen wie in Abbildung ​ Abbildung2 angeordnet. 2. Die statistische Signifikanz wurde durch zweiseitige Schüler- berechnet T-Test, Vergleich der Expression in TM-behandelten Atf6α −/− Tiere gegen TM-behandelte Wildtyp-Tiere. n = 3 Tiere pro Gruppe. (G) Mäuse wurden wie in 48 h mit TM oder Vehikel behandelt (EIN), und die Expression der angegebenen Gene wurde durch qRT-PCR bestimmt. Die Bedeutung wurde bestimmt wie in (B𠄿).

Wir haben dieses Ziel erreicht, indem wir Wildtyp- und Atf6α −/− Tiere über einen längeren Zeitraum (34 h) mit TM und anschließend Profilierung der globalen Genexpression durch Microarray. Wir haben diesen Ansatz teilweise gewählt, weil wir zuvor Microarray-Profiling verwendet hatten, um die Genexpression in denselben Mausstämmen nach 8 Stunden TM-Challenge zu charakterisieren (Rutkowski et al., 2008). Die Durchführung einer zweiten Microarray-Studie mit einem identischen Genchip zu einem späteren Zeitpunkt würde uns die einzigartige Möglichkeit bieten, für jedes Gen auf dem Array seine Expression in zwei verschiedenen Genotypen unter zwei verschiedenen Behandlungsschemata (Vehikel und TM) zu bestimmen zwei verschiedene Zeiten.

Durch 8 verschiedene Kombinationen von experimentellen Bedingungen erwarteten wir, dass wir damit beginnen könnten, Cluster von koordiniert regulierten Genen zu identifizieren, einschließlich der metabolischen Gene, die am stärksten auf ER-Stress reagieren. Dies beruhte auf der Annahme, dass Gene, die Teil eines gemeinsamen funktionellen Weges (in diesem Fall des Fettstoffwechsels) sind, ähnlich reguliert werden sollten. Dieser Ansatz wurde in Hefe und in jüngerer Zeit in kultivierten Säugerzellen mit großer Wirkung verwendet, um zuvor verborgene Komponenten des Sekretionsapparats und andere interessierende Wege freizulegen (Schuldiner und Weissman, 2013). Hier war unser Ziel, versteckte Transkriptionsregulatoren abzuleiten, indem wir zeitliche Muster der Genexpression als Output verwenden.

Unter den untersuchten Stoffwechselgenen wurde nach 34 h keines durch ER-Stress in beiden Genotypen hochreguliert. Zwei Gene, die lipogenen und cholesterinogenen Regulatoren Srebf1 [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_011480.3","term_id":"146134488","term_text":"NM_011480.3">> NM_011480. 3] und Srebf2 [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_033218.1","term_id":"73661203","term_text":"NM_033218.1">> NM_033218. 1]—wurden in beiden Genotypen gleichermaßen herunterreguliert (Abbildungen 3D, E). Die große Mehrheit der Gene wurde jedoch in Wildtyp-Tieren in normalen oder nahezu normalen Mengen exprimiert, in jedoch stark unterdrückt Atf6α −/− Tiere (Abbildungen 3C𠄿). qRT-PCR-Profiling einer Probe dieser Gene aus einem unabhängigen Experiment bestätigte diese Ergebnisse (Abbildung ​ (Abbildung3G). 3G). Diese Daten stimmen mit der Idee überein, dass akuter ER-Stress die Fettsäureoxidation und Lipoproteinbiogenese auf der Ebene der Genexpression hemmt und nicht die lipogene Genexpression stimuliert.

Funktionell verwandte Gengruppen gruppieren sich zeitlich

Diese 8 unterschiedlichen experimentellen Bedingungen ermöglichten es uns, das globale Verhalten der hepatischen Genexpression als Reaktion auf ER-Stress zu frühen vs. späten Zeitpunkten bei normalen Tieren mit denen mit einer beeinträchtigten UPR zu vergleichen. Eine Heatmap mit TM-regulierten Genen macht zwei Beobachtungen deutlich: Erstens waren die Unterschiede in der Genexpression zwischen den beiden Genotypen nach 34 h deutlich größer als nach 8 h. Zweitens haben viele Gene nach 34 Stunden bei Wildtyp-Tieren zu einer normalen oder nahezu normalen Expression zurückgekehrt, blieben jedoch reguliert oder wurden noch stärker in die gleiche Richtung reguliert, in Atf6α −/− Tiere.

Jedes Gen wurde dann kategorisiert, basierend darauf, ob es durch ER-Stress im Wildtyp hochreguliert, herunterreguliert oder unverändert war Atf6α −/− Tiere nach 8 oder 34 Stunden Stress. Somit könnte ein Gen in eines von 81 (3 × 3 × 3 × 3) Expressionsprofilen fallen. Die Zuordnungen für alle Probesets sind in Tabelle S1 angegeben. Wir konnten die Gene teilweise auf diese Weise analysieren, weil sich nur sehr wenige Gene in ihrer basalen (dh ungestressten) Expression zwischen den Genotypen unterschieden, fast alle genotypabhängigen Expressionsänderungen wurden durch TM verursacht, so dass basale Expressionsunterschiede nicht verwechselt et al., 2008).

Weil Atf6α −/− Tiere wurden steatotischer als Wildtyp-Tiere, Gene, die nach 34 h Behandlung mit TM nicht unterschiedlich zwischen den beiden Genotypen exprimiert wurden, wurden nicht weiter verfolgt, da diese wahrscheinlich nicht wesentlich zu der steatotische Phänotyp. Obwohl 54 verbleibende Expressionskombinationen möglich waren (3 × 3 × 3 × 2), fielen 90 Prozent der Gene in nur 9 Kategorien (A–I, Abbildung ​ Abbildung 4B). 4B). Jede Kategorie von Genen erhielt dann eine grafische Darstellung des Expressionsmusters ihrer Mitglieder (Abbildungen 4C–G). Die beiden am stärksten besiedelten Gruppen von Genen (Gruppen A und B) waren diejenigen, die nach 8 h bei beiden Genotypen nicht von Stress betroffen waren, oder bei Wildtyp-Tieren nach 34 h, aber bei 34 hoch- bzw. herunterreguliert waren h in Atf6α −/− Tiere (Abbildung ​ (Abbildung4E). 4E). Unter den metabolischen Genen, die in den Abbildungen ​ Abbildungen2, 2, ​,3, 3 dargestellt sind, bevölkern eine Reihe von ihnen Gruppe B, und sie umfassen Gene, die geschwindigkeitsbestimmende Enzyme in jedem Stoffwechselweg der Fettsäureoxidation codieren—Acox1, Cpt1a, und Cyp4a10 [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_015729.3","term_id":"429484482","term_text":"NM_015729.3">> NM_015729. 3, <"type":"entrez-nucleotide","attrs":<"text":"NM_013495.2","term_id":"162287141","term_text":"NM_013495.2">> NM_013495.2 , und <"type":"entrez-nucleotide","attrs":<"text":"NM_010011.3","term_id":"227116293","term_text":"NM_010011.3">> NM_010011.3 ], die die peroxisomale, mitochondriale bzw. mikrosomale Oxidation kontrollieren. Da die Expression dieser Gene erst zu einem späteren Zeitpunkt verändert wird, ist es unwahrscheinlich, dass sie proximal mit dem UPR verbunden sind, sondern eher indirekte Effekte, z. B. die Suppression von PPAR, darstellen. Die nächsten beiden am stärksten bevölkerten Gruppen (Gruppen C und D) umfassten die Gene, die in beiden Genotypen entweder früh hoch- oder herunterreguliert wurden und deren Expression bei Wildtyp-Tieren nach 34 Stunden auf normale Werte zurückkehrte, die jedoch in reguliert blieben Atf6α −/− Tiere. Unter den metabolischen Genen umfasste Gruppe D die Koregulatoren Pgc1a und Pgc1b. Eng verwandt mit diesen Gruppen waren die Gruppen E und F, die Gene umfassten, die in beiden Genotypen früh hoch- oder herunterreguliert wurden und für die diese Regulation in verstärkt wurde Atf6α −/− Tiere um 34 Uhr. Die anderen beiden schnell regulierten Stoffwechselgene, Cebpa und Ppara, wurden in Gruppe F gefunden.

Clustering von Genen nach zeitlicher Regulation in Wildtyp und Atf6α −/− Tiere. (EIN) Die Expression jedes Sondensets auf dem in Abbildung ​ Abbildung3 3 beschriebenen Affymetrix-Mikroarray wurde mit Expressionsdaten aus einem zuvor veröffentlichten identischen Array aggregiert, in dem die Genexpression in Wildtyp und verglichen wurde Atf6α −/− Tiere 8 h nach Exposition mit Vehikel oder 2 mg/kg TM (Rutkowski et al., 2008). Für jeden Zeitpunkt wurde der Ausdruck mit einem log . bestimmt2 Maßstab relativ zu mit Vehikel behandelten Wildtyp-Tieren zu diesem Zeitpunkt. Nur Probesets, die signifikante (P < 0,05) Ausdrucksunterschiede (1,5-fach oder ଐ,58 im Protokoll)2 Skala) in einer oder mehreren der vier der vier Bedingungen (Wildtyp oder Atf6α −/− um 8 oder 34 Uhr) werden von der Heatmap angezeigt, die entfielen

45.000 Probesets auf dem Array. Das Ausmaß der Hoch- bzw. Herunterregulierung wird durch die Intensität der Rot- bzw. Blaufärbung angezeigt. Jede Spalte zeigt das Expressionsniveau, das zwischen den drei Tieren pro Gruppe gemittelt wurde. (B, C) Jeder Sondensatz auf dem Array wurde durch seine Expression auf die folgenden vier Arten charakterisiert, wobei die Unterschiede als > 1,5-fach definiert wurden, P < 0,05: (1) nach oben, unten oder unverändert bei Wildtyp-TM-behandelten Tieren nach 8 h im Vergleich zu mit Vehikel behandeltem Wildtyp (2) nach oben, unten oder unverändert in Atf6α −/− TM-behandelte Tiere nach 8 h im Vergleich zum TM-behandelten Wildtyp (3) wie (1), aber 34 h und (4) wie (2), aber 34 h. Die Gene, die einen Unterschied nach Kriterium (4) zeigten, wurden aufgrund ihres Verhaltens in Bezug auf diese Kriterien in Gruppen eingeteilt, und die Anzahl der Gene in den neun bevölkerungsreichsten Gruppen ist in . angegeben (B). Die Gruppe von Genen, die bei Wildtyp-Tieren zu beiden Zeitpunkten durch ER-Stress hochreguliert waren, aber weniger hochreguliert in Atf6α −/− Tiere𠅍.h. Gene, die als direkt ATF6α-abhängig verstanden werden könnten, werden ebenfalls berücksichtigt. (C) liefert einen Schlüssel zur Veranschaulichung von Genexpressionsmustern. (D–G) Expressionsmuster für jede der in gezeigten Gengruppen (B). Dazu gehören Gene, die in Abbildung ​ Abbildung 2 2 dargestellt sind (die nicht in eine dieser Gruppen fallen, sind in Abbildung S1 dargestellt) sowie Gene, die an der ER-Proteinprozessierung beteiligt sind, die in Gruppe E zu finden sind. Für Gene, die durch mehr als einen Sondensatz repräsentiert werden , wird das Verhalten gezeigt, das mit qRT-PCR-Daten am häufigsten repräsentiert und/oder am konsistentesten ist.

Die Gruppen D und F waren für uns von größtem Interesse, weil sie die Gene repräsentierten, die am wahrscheinlichsten proximal mechanistisch mit der UPR-Signalgebung verbunden sind, da sie schnell durch ER-Stress reguliert wurden und da ihre langfristige Expression mit dem anhaltenden ER-Stress und der Verschlechterung zusammenfiel. Lipidakkumulation gesehen in Atf6α −/− Tiere. Insbesondere Gruppe F war bemerkenswert, weil ihre Gegenstückkohorte hochregulierter Gene —Gruppe E— eine Reihe von Genen umfasste, von denen bekannt ist, dass sie direkte Ziele von UPR-Transkriptionsfaktoren sind und die daher proximal mit der UPR-Signalgebung verbunden sind (Abbildung ​ (Abbildung2D 2D).

Die Validität des Ansatzes wurde auch durch die Gruppe von Genen gestützt, die bei Wildtyp-Tieren zu beiden Zeitpunkten durch ER-Stress hochreguliert waren, aber nicht so hochreguliert in Atf6α −/− Tiere zu beiden Zeitpunkten (Abbildung ​ (Abbildung4G). 4G). Diese Gene würden dem erwarteten Profil der direkten Ziele von ATF6α entsprechen. Obwohl es in dieser Gruppe relativ wenige Gene gab, umfassten sie diejenigen, die bereits als direkte ATF6α-Ziele beschrieben wurden, einschließlich Erp72, P58 IPK , Erdj3, und Derl3 (Wu et al., 2007 Yamamoto et al., 2007). Dieser Befund unterstützt die Idee, dass koregulierte Gene anhand ihres Expressionsprofils in diesem Setup unterschieden werden können.

Diese Idee wurde durch die Pfadanalyse verstärkt. Die Gene aus jeder der zehn Gruppen (A–I und ATF6) wurden mit FunNet (Prifti et al., 2008) auf funktionelle Anreicherung der Gene Ontology (GO)-Pfade analysiert. Als Proof-of-Concept ergab die Pathway-Analyse der ATF6-Gene der Gruppe die “unfolded protein response” als den am stärksten angereicherten Prozess, der von einer Gruppe mit direkten ATF6α-Zielen erwartet würde (Abbildung ​ (Abbildung 5A). 5A). Gene, die für den Fettstoffwechsel relevante Prozesse repräsentieren, waren in allen herunterregulierten Gruppen 𠅋, D, F und G— angereichert, jedoch nicht in den hochregulierten Gruppen A, C, E, H und I (Abbildungen 5B,C). Umgekehrt war jede der hochregulierten Gruppen mit Genen angereichert, die für die Proteinsynthese, -transport und -abbau relevante Signalwege darstellen. Es ist bekannt, dass die UPR-Aktivierung während ER-Stress die zelluläre Proteinbiogenesemaschinerie durch die Wirkung der wichtigsten UPR-regulierten Transkriptionsaktivatoren XBP1, ATF4 und ATF6 transkriptionell verstärkt (Harding et al., 2003 Lee et al., 2003 Wu et al., 2007).Diese Pathway-Analyse legt somit nahe, dass zumindest in der Leber die Suppression von Genen, die am Lipidstoffwechsel beteiligt sind, einen konzertierten Schwerpunkt der UPR-Aktivierung darstellt.

Funktionell verwandte Gene werden durch zeitliche Regulation geclustert. (A𠄼) Jede der Gengruppen in Abbildung ​ Abbildung 4 4 wurde einer Pathway-Analyse der Gene Ontology mit FunNet unterzogen. Die sieben wichtigsten Signalweganreicherungen wurden dann nach der Anzahl der Gene aus dieser Gruppe neu geordnet, die “hits waren, ”, wobei die Pfade die meisten “hits” höher aufgelistet hatten. Aus Platzgründen sind fünf dieser sieben Pfade aus jeder Gruppe dargestellt. In keinem Fall war ein Fettstoffwechselprozess zwischen den hochregulierten Gengruppen angereichert. In (B), für den Fettstoffwechsel relevante Stoffwechselwege sind schwarz und andere Stoffwechselwege grau aufgeführt. In (C), sind die für die Proteinverarbeitung relevanten Wege schwarz aufgelistet.

Funktionelle Genomanalyse identifiziert HNF4α als proximalen Regulator der metabolischen Genexpression während ER-Stress

Wir wollten die statistische Aussagekraft unserer Mikroarray-Vergleiche nutzen, um regulatorische Transkriptionsfaktoren vorherzusagen, deren Aktivität durch ER-Stress verändert wurde, diese würden am wahrscheinlichsten proximal mechanistisch mit dem UPR verbunden sein. Um dies zu erreichen, haben wir die Gene in jeder Gruppe einer Analyse mit oPOSSUM (Ho Sui et al., 2005) unterzogen, das die Promotor/Enhancer-Region jedes Gens nach Konsensus-Transkriptionsfaktor-Bindungsstellen aus der JASPAR CORE-Datenbank durchsucht. Um die Gültigkeit dieses Ansatzes zu belegen, lieferten die Gene der Gruppe ATF6 den Transkriptionsfaktor NFYA [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_001110832.1","term_id": "161016830","term_text":"NM_001110832.1">> NM_001110832.1] als einzigen statistisch signifikanten Treffer (Abbildung ​ (Abbildung6A). 6A ). Es ist bekannt, dass ATF6α mit NFYA dimerisiert, um die Transkription von Promotoren zu regulieren, die ERSE- und ERSE II-Elemente enthalten (Yoshida et al., 2000, 2001, Kokame et al., 2001). NFYA wurde in keiner anderen Gruppe angereichert, was die Spezifität des Algorithmus unterstreicht.

Die Vorhersage des Transkriptionsfaktors impliziert ELK4, HNF1α, NR2F1 und HNF4α als versteckte regulatorische Knoten in der hepatischen Stress-abhängigen Genregulation. (A𠄼) Jede der Gengruppen in Abbildung ​ Abbildung 4 4 wurde einer oPOSSUM-Single-Site-Analyse unterzogen, die regulatorische Regionen (in diesem Fall � bp von der Transkriptionsstartstelle) nach potentiellen Bindungsstellen von Transkriptionsfaktoren durchsucht, die in der JASPAR CORE-Datenbank. Die Ergebnisse beschränkten sich auf a Z-Score > 10 und ein Fisher-Score < 0,01. (D) Die Daten von (C) wurden mit dem BINGO-Plug-in für die Cytoscape-Software visualisiert, wobei nur Gene berücksichtigt wurden, die für den Fettstoffwechsel relevant sind, wie aus der GO-Analyse annotiert. oPOSSUM-vorhergesagte Bindungsstellen sind durch gestrichelte Linien dargestellt, während Gene mit bestätigten HNF4α-Bindungsstellen durch durchgezogene Linien dargestellt sind.

Da am Fettstoffwechsel beteiligte Gene in den Gruppen B, D, F und G gefunden wurden, suchten wir nach Treffern in diesen Gruppen und nicht in anderen, mit besonderem Schwerpunkt auf den Gruppen D und F, da diese Gruppen die früh reagierenden Gene enthalten. Bemerkenswerterweise Bindungsstellen für zwei Transkriptionsfaktoren—HNF4α und NR2F1 [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_010151.2","term_id":"111185901" ,"term_text":"NM_010151.2">> NM_010151.2]—wurden in den Gruppen B, D und F angereichert, jedoch in keiner anderen Gruppe (Abbildungen 6B,C). Diese Faktoren haben ähnliche Konsensus-Bindungsstellen (Kimura et al., 1993 Ellrott et al., 2002 Schmidt et al., 2010), was erklärt, warum sie sich in dieser Analyse voneinander trennen. Dieser Befund legt nahe, dass die Aktivität dieser beiden Transkriptionsaktivatoren während des ER-Stresses verändert wird, da Gene, die Bindungsstellen für diese Faktoren enthalten, durch den ER-Stress herunterreguliert werden und ihre Herunterregulierung durch den anhaltenden Stress, der in beobachtet wird, verstärkt wird Atf6α −/− Mäuse. Umgekehrt wurden die Gruppen A, C und E um Gene mit potentiellen Bindungsstellen für ELK4 angereichert, auch bekannt als SRF Accessory Protein (SAP)-1 [GenBank: <"type":"entrez-nucleotide","attrs":< "text":"NM_007923.2","term_id":"153792361","term_text":"NM_007923.2">> NM_007923.2].

Gruppe I, die Gene umfasst, die durch langfristigen ER-Stress in Wildtyp-Tieren hochreguliert und in weiter hochreguliert werden Atf6α −/− Tiere, wurde für die Bindung durch CREB1 angereichert [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_001037726.1","term_id" :"158966706","term_text":"NM_001037726.1">> NM_001037726.1], die eine Konsensus-Bindungssequenz mit dem ER-lokalisierten Transkriptionsfaktor CREBH teilt (Zhang et al., 2006). CREBH wird durch Proteolyse aktiviert, die unter anderem durch ER-Stress induziert wird, und reguliert die Expression von Akute-Phase-Antwortgenen und metabolischen Genen (Zhang et al., 2006, 2012 Luebke-Wheeler et al., 2008). Dementsprechend haben die Gene in Gruppe I ein für CREBH-Targets erwartetes Profil, nämlich dass sie durch ER-Stress hochreguliert werden und weiter hochreguliert werden in Atf6α −/− Tiere, bei denen der ER-Stress verstärkt wird. Jedoch waren die Lipidstoffwechselgene in Gruppe I nicht angereichert, und die CREB1-Bindungsstelle war in den Gruppen, die Lipidstoffwechselgene enthalten, nicht angereichert. Außer dem Gen, das die Serum-Amyloid-P-Komponente (Apcs) [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_011318.2","term_id":"226958496","term_text":"NM_011318.2">> NM_011318 .2], waren die meisten Gene, die für Proteine ​​der akuten Phase (SAA-Proteine, CRP, Gerinnungs- und Gerinnungsproteine ​​usw.) kodieren, zu keinem Zeitpunkt in beiden Genotypen signifikant hochreguliert, was darauf hindeutet, dass die CREBH-Aktivität während Bona Fide ER-Stress (im Gegensatz zu Endotoxin, proinflammatorischen Zytokinen oder anderen Stimuli) könnte minimal sein, und die Gene in Gruppe I könnten stattdessen durch einen anderen Faktor aus der CREB-Familie reguliert werden.

ELK4 ist Teil der Familie der Ternary Complex Factor (TCF) von Transkriptionsfaktoren, die mit dem Serum Response Factor (SRF) interagieren (Dalton und Treisman, 1992). Eine Rolle für ELK4 bei der hepatischen Genexpression wurde weder beschrieben, noch wurde ELK4 direkt mit ER-Stress in Verbindung gebracht. Es wurde gezeigt, dass ELK4 durch JNK-abhängige Phosphorylierung aktiviert wird (Janknecht und Hunter, 1997) und JNK [GenBank: <"type":"entrez-nucleotide","attrs":<"text":"NM_016700.4" ,"term_id":"225637490","term_text":"NM_016700.4">> NM_016700.4] wird durch ER-Stress aktiviert (Urano et al., 2000). Daher spekulieren wir, dass die ELK4-Aktivität während des ER-Stresses in der Leber durch JNK oder andere MAP-Kinasen reguliert werden könnte, um die Expression von Genen in den Gruppen A, C und E zu fördern. NR2F1, auch bekannt als COUP-TF, ist ein Orphan-Rezeptor. Die Deletion führt zu perinataler Letalität mit ausgedehnter Dysregulation der neuronalen Differenzierung (Qiu et al., 1997). Seine Funktion in der Leber ist weniger klar, obwohl gezeigt wurde, dass es die Transkription synergistisch mit HNF4α koaktiviert (Ktistaki und Talianidis, 1997, Yanai et al., 1999).

HNF4α wird am stärksten in Leber, Darm, Niere und Bauchspeicheldrüse exprimiert. Die Deletion ist während der Gastrulation tödlich (Chen et al., 1994). Mäuse mit einer leberspezifischen Deletion von HNF4α entwickeln eine Steatose gleichzeitig mit beeinträchtigtem ApoB und Mttp Expression und VLDL-Produktion (Hayhurst et al., 2001). Der hepatische Knockdown von HNF4α durch adenovirale Abgabe führte zu Steatose und zu einer beeinträchtigten VLDL-Produktion, zusammen mit einer im Wesentlichen gleichmäßig verminderten Expression einer Vielzahl von Genen, die am Fettstoffwechsel beteiligt sind, einschließlich vieler der hier beschriebenen Gene (Yin et al., 2011). Somit phänokopiert der Verlust von HNF4α viele der genetischen Veränderungen des Lipidstoffwechsels, die durch ER-Stress induziert werden. Die Überexpression von HNF4α in primären Hepatozyten führte zu einer Hochregulierung vieler dieser Gene, jedoch nicht von Srebf1 Noch Srebf2 (Yin et al., 2011). Diese Ausnahme ist bemerkenswert, weil Srebf1 und Srebf2 fallen unter den hier analysierten Stoffwechselgenen dadurch auf, dass ihre Herunterregulation nicht verschlimmert bei 34 h in Atf6α −/− Mäuse (Abbildungen 3D,E). HNF4α-Bindungsstellen im Lebergenom der Maus wurden durch ChIP-seq charakterisiert (Schmidt et al., 2010), und Gene in den Gruppen B, D und F sind bestätigte HNF4α-Ziele (Abbildung ​ (Abbildung 6D 6D .). ).

Unsere Ergebnisse sagen zusammen mit der bekannten Aktivität von HNF4α voraus, dass ER-Stress zu einer verminderten Aktivität von HNF4α führt und dass dies als ein frühes Ereignis in der metabolischen Genregulation durch ER-Stress auftritt. Um diese Vorhersage zu testen, analysierten wir die Bindung von HNF4α an ChIP-seq-definierte Stellen in den Promotor-/Enhancer-Regionen von drei der vier am frühesten regulierten metabolischen Gene, den Transkriptionsregulatoren Cebpa, Pgc1a, und Ppara (das proximale Pgc1b Promotor/Enhancer enthielt keine vorhergesagte oder validierte HNF4α-Bindungsstelle). Wir fanden, dass die Behandlung von Tieren mit TM für 8 h weder die Gesamtexpression (Abbildung ​ (Abbildung 7A) 7A ) noch die Kernlokalisation (Abbildung ​ (Abbildung 7B) 7B) von HNF4 veränderte. In Übereinstimmung mit unserer Vorhersage stellten wir jedoch fest, dass die Chromatinbindung von HNF4α an mehreren Stellen im Cebpa und Pgc1a Promotoren bei der Behandlung von Tieren mit TM (Abbildung ​ (Abbildung 7C). 7C). Diese Abnahme war nicht einheitlich, mehrere Stellen innerhalb der drei Promotoren zeigten eine unveränderte HNF4α-Bindung (Abbildung ​ (Abbildung 7A). 7A). Zusammengenommen legen diese Ergebnisse nahe, dass ER-Stress die Aktivität von HNF4α an bestimmten Stellen im Genom durch einen Mechanismus reduziert, der unabhängig vom HNF4α-Expressionsniveau ist.

Verminderte HNF4α Bindung bei Cebpa und Pgc1a Promotoren bei ER-Stress. (A,B) Wildtyp-Mäuse wurden 8 h lang mit 1 mg/kg TM provoziert und die Expression von HNF4α wurde durch Immunoblot bestimmt (EIN) oder Immunhistochemie (B). Maßstabsbalken = 50 μm. (C) Die HNF4α-Bindung an die regulatorischen Regionen der angegebenen Gene wurde durch Chromatin-IP bestimmt. Regionen sind relativ zur Transkriptionsstartstelle angegeben und entsprechen Regionen, die durch ChIP-seq-Analyse identifiziert wurden (Schmidt et al., 2010). n = 3𠄴 Tiere pro Gruppe. Die typische Wiederfindung von genomischem Material in Proben, die HNF4α-Antikörper enthielten, lag im Bereich von 0,1𠄱 Prozent des Gesamtinputs. * P < 0,05 von T-Prüfung.


Methoden

Phylogenetische Analyse und Genstrukturvorhersage

Abgeleitete Peptidsequenzen für Mitglieder der Insulin-Superfamilie umfassten 20 von Mollusca, 30 von Ecdysozoa und 51 von Deuterostomie (Ergänzende Daten 1). Mutmaßliche Orthologe zwischen Mensch und Auster wurden durch reziproke Best-Hit-Blast mit einem E-Wert Cutoff von 1e−5 56 . Pdx-Sequenzen wurden von NCBI abgerufen (ergänzende Fig. 3). Mehrfachausrichtung wurde mit MAFFT 7.221 57 unter Verwendung des L-INS-I-Algorithmus durchgeführt und mit TrimAl unter Verwendung der Parameter –gt 0,9 –st 0,001 –cons 40 58 getrimmt. Phylogenetische Bäume wurden mit RAxML 59 unter Verwendung des Evolutionsmodells LG + Gamma + Invariant und 1000 Bootstrap-Replikate konstruiert. Zur Visualisierung der Ausrichtung wurde UGENE 60 verwendet. Für Austern-ILP-Sequenzen 23 wurden Signalpeptide durch SignalP 4.1 61 vorhergesagt, reife Peptidketten aus benachbarten Paaren von basischen Resten 62 vorhergesagt. Für die Visualisierung der Pdx-Ausrichtung wurden die Farben der Aminosäuren nach ihrem evolutionären Konservierungsgrad und ihren physikalisch-chemischen Eigenschaften unter Verwendung des Farbschemas Zappo von Jalview 63 codiert.

Tiermaterial

Dreijährige pazifische Austern (C. gigas), die für qPCR und in-situ-Hybridisierung verwendet wurden, stammten RNA-seq, ATAC-seq und Genklonen aus dem Oxford Covered Market, wurden Berichten zufolge an der schottischen Küste gesammelt und vor der Verwendung 7 Tage lang in künstlichem Meerwasser bei 16 °C akklimatisiert. Austern wurden gefüttert mit Spirulina Pulver während der Kultur. Die Identifizierung der Spezies wurde durch Sequenzieren des mitochondrialen Cytochromoxidase I-Gens bestätigt. Gewebe von drei Individuen wurden präpariert, um Labialpalpen, Kiemen, Mantel, weißen Adduktorenmuskel, transparenten Adduktorenmuskel, Neuron, Herz, Hämolymphe, männliche Gonade, weibliche Gonade, Hepatopankreas, Magen und Darm zur sofortigen RNA-Extraktion zu erhalten.

RNA-Extraktion und qPCR

Gesamt-RNA wurde nach einem Standard-TRIzol-Protokoll (Invitrogen, USA) extrahiert und mit DNase I (Promega, USA) behandelt. RNAs von drei Individuen wurden vor der Synthese der Erststrang-cDNA mit GoScript™ RT (Promega, USA) gemäß den Anweisungen des Lieferanten gleichmäßig gemischt. Primer für qPCR an Austern insulinartig Gene, Pdx und als interne Kontrolle cgEF1a sind in den ergänzenden Daten 4 angegeben. Echtzeit-qPCR wurde auf dem Prime Pro 48 Echtzeit-qPCR-System (Techne, UK) durchgeführt. Die 2-ΔΔt-Methode wurde verwendet, um die relative Quantifizierung (RQ) von Zielgenen zu berechnen. R-Software 64 wurde für Statistik und Plotten verwendet.

Assay für Transposase zugängliches Chromatin

Um die Osmolarität aufrechtzuerhalten, wurde modifizierte Dulbecco-Phosphat-gepufferte Kochsalzlösung (MDPBS) verwendet, um die Austernzellen durchgehend zu inkubieren. Frische Hepatopankreas-Gewebefragmente wurden in 0,8 mg/ml Collagenase P (Sigma, 11213857001) bei Raumtemperatur für 20 Minuten inkubiert und alle 5 Minuten vorsichtig pipettiert, um einzelne Zellen freizusetzen. Die Zellsuspension wurde durch ein 40 μm Zellsieb (BD Falcon, USA) filtriert, in ein neues Röhrchen überführt und 5 min bei 500 × zentrifugiert g. Der Überstand wurde verworfen und das Pellet in MDPBS zur Zelllebensfähigkeitsanalyse und Zellzählung suspendiert. Für jede Reaktion wurden 50.000 Zellen bei 1000 × gesammelt g 5 Minuten, 4 °C. Die Transpositionsreaktion, Reinigung, Bibliothekskonstruktion und Quantifizierung folgten etablierten Methoden 65 , einschließlich der Markierung mit einem Nextera DNA-Kit (Illumina FC-121-1030) für 30 Minuten bei 37 °C, Amplifikation von markierter DNA mit NEB Next High-Fidelity 2X PCR Master-Mix für 11 Zyklen. Die Qualität der Bibliothek wurde mit Agilent Tapestation bewertet.

Zwei Proben wurden mit 40 bp Paired-End-Reads auf der Illumina NextSeq 500-Plattform sequenziert, was 43 bzw. 17,5 Millionen Read-Paare ergab. Reads wurden mit Bowtie 2 (v. 2.1.0) auf C. gigas Genom v.9, das von NCBI erhalten wurde, was 79,8% bzw. 74,8% der sequenzierten Reads ergab, die auf das Kerngenom kartiert wurden. Peaks wurden für jede Probe unter Verwendung von MACS2 (v. 2.1.1) unter Verwendung der Parameter ‚—nomodel—shiftsize 250—nolambda‘ aufgerufen. Nur Peaks, die in beiden Replikaten wiedergefunden wurden und länger als 100 bp waren, wurden beibehalten. Die Peaks wurden weiter gefiltert, um Regionen zu entfernen, die sich mit repetitiven Sequenzen überlappen, die von einem kombinierten Wiederholungs-Annotationsmodellierer (RepeatModeler 66, DUST 67 und TRF 68-Filter) abgeleitet wurden, was insgesamt 168.206 offene Konsensus-Chromatin-Regionen genomweit ergab. Konsenspeaks wurden Genen zugeordnet, die mit bezeichnet sind C. gigas Genmodelle, die von NCBI unter Verwendung des Skripts annotatePeaks.pl von Homer (v.4.9) erhalten wurden. Aus dieser Anmerkung wurden offene Chromatinregionen abgeleitet, die proximalen und distalen mutmaßlichen cis-regulatorischen Elementen entsprachen. Die TFBS-Analyse wurde unter Verwendung der Gimme-Motivsuite (v.0.11.1) 69 durchgeführt. Positionsgewichtete Matrizen (PWMs) für einzelne TFBSs, die PDX1 entsprechen (humane PDX1-Sites: M5712_1.02, M5713_1.02, M6415_1.02 und Maus-Pdx1-Sites: M0976_1.02, M1952_1.02) wurden aus der CIS-BP Online-Bibliothek von Transkriptionsfaktoren und ihre DNA-Bindungsmotive unter http://cisbp.ccbr.utoronto.ca 70 . Maus- und Human-PWMs wurden mit dem Gimme-Cluster-Befehl geclustert, um ein gemitteltes Cluster-Motiv (Konsensus-Site) 'Pdx_Average_2' zu ergeben, das aus der Clusterung von 3 Sites resultierte (Human M5713_1.02, Mouse M1952_1.02, Human M6415_1.02), ein zweiter Cluster bestehend aus einem einzelnen Motiv, das einer doppelten Stelle zweier TAAT-Motive nebeneinander entspricht (Mensch M5712_1.02) und einem dritten Einzelmotiv, das einer weniger prominenten TAAT-Stelle (Maus M0976_1.02) entspricht. Hintergrundbereiche wurden mit dem Befehl 'gimme background -random' mit . generiert C. gigas Genom als Referenz. Schwellenwerte wurden basierend auf Hintergrundsequenzen unter Verwendung des Gimme-Schwellenbefehls mit „fpr = 0,01“ für jede der einzelnen PWMs und dem Pdx_Average_2 TFBS erhalten. TFBS wurden mithilfe eines Gimme-Scans unter Verwendung von Cutoff-Werten identifiziert, die aus dem „Gimme-Schwellenwert“-Schritt für alle Konsensus-Peaks erhalten wurden. Sowohl Pdx_Average_2 als auch Pdx_M1952_1.01 PWMs identifizierten die experimentell validierten Pdx1-Stellen bei −1806 (TTCTAATTAC) auf Gerüst737:266144-266153, erkannten jedoch die flankierenden Basen (5′-T bzw. C-3′). Darüber hinaus wurde ein vorgeclusterter Satz von 623 Motiven aus CIS-BP-Motiven generiert (http://dx.doi.org/https://doi.org/10.6084/m9.figshare.1555851) 71 , TFBS-Sites (v .3), wurde zum Scannen des Konsensus-Peak-Sets wie oben beschrieben verwendet. Spezifische Pdx1-Stellen wurden durch keine anderen geclusterten Homeodomäne-PWMs wiedergefunden, was die Spezifität der Analyse bestätigt.

RNA-Sequenzierung und differentielle Expressionsanalyse

Die RNA-Sequenzierung (RNAseq) wurde unter Verwendung von 75 bp Paired-End (PE)-Sequenzierung auf der Illumina HiSeq 4000-Plattform (Illumina, Inc., San Diego, CA, USA) aus einer Hepatopankreas-TruSeq-Bibliothek desselben Individuums wie für ATAC verwendet. sek. Insgesamt wurden 33,11 Millionen PE-Reads mit einer Q20-Ausbeute von 4880 Mb erhalten. Die Daten wurden zusammen mit veröffentlichten Sequenzierungs-Reads von zusätzlichen Organen (einschließlich „Verdauungsdrüse“, möglicherweise identisch mit Hepatopankreas) analysiert 23 . Rohe Sequenzierungs-Reads wurden mit HISAT2 auf das Austerngenom kartiert und mit den Tools StringTie und Ballgown 72 weiterverarbeitet. Kartierte Read-Zählungen wurden verwendet, um differenziell exprimierte Gene unter Verwendung von edgeR 73 zu identifizieren, und Genexpressionsniveaus wurden als Fragmente pro Kilobase pro Million kartierter Reads (FPKM) quantifiziert. Hepatopankreas-angereicherte Gene wurden als Gene mit höheren Expressionsleveln definiert (P < 0,05) sowohl in der „Verdauungsdrüse“ als auch in der neu entnommenen „Hepatopankreas“-Probe im Vergleich zu anderen Organen (Adduktormuskel, Schamlippen, Kiemen, Hämolymphe, Mantel, männliche Gonaden und weibliche Gonaden).

Plasmidkonstrukte

Für die Ribosondenerzeugung werden amplifizierte Fragmente von cgPdx (489 bp), cgMIP123 (608 bp), cgMIP4 (679 bp), cgMILP7 (359 bp) und cgILP (332 bp) wurden in pGEM-T easy (Promega, USA) kloniert. Zur Beurteilung der subzellulären Lokalisation, cgPdx kodierende Sequenz wurde mit Primern amplifiziert, die XhoI Seiten und ligiert in XhoI-verdauter pEGFP-N1-Vektor (Clontech, USA), um eine In-Frame-Fusion mit EGFP zu erzeugen (Konstrukt pEGFP-Pdx). Für Luciferase-Assays, nicht markiert mPdx1, cgPdx (LOC105327390 74 ) und cgNeuroD (LOC105336755 75 ) Plasmide wurden durch Klonieren in XhoI und MluI Stellen im pSI-Expressionsvektor (Promega, USA, Konstrukt pSI-mPdx1, pSI-cgPdx, pSI-cgNeuroD). Als Firefly-Luciferase-Reporterkonstrukte werden entsprechende genomische Regionen stromaufwärts von cgILP wurden in das pGL4.23[luc2/minP]-Vektor (Promega, USA konstruiert pGL-B1). Drei kurze Versionen (zwei mit veränderten TAAT-Stellen) wurden durch in vitro-Mutagenese erzeugt (konstruiert pGL-B2, pGL-B2M1 und pGL-B2M2, Fig. 4). Veränderte TAAT-Stellen wurden erzeugt, indem fehlgepaarte Basen in Primern entworfen wurden, die die Stellen bedecken. Primer wurden in Supplementary Data 4 angegeben.

Antikörpersynthese und ChIP-qPCR

Die kodierende Sequenz des cgPdx-Peptids 1–160 wurde in den pET-28a-SUMO-Vektor kloniert und in BL21(DE3)-Zellen exprimiert. Das SUMO-markierte rekombinante Protein wurde durch Ni-NTA-Affinitätschromatographie (Qiagen) gereinigt. Kaninchen-anti-cgPdx-polyklonale Antikörper, E9112 und E9113, wurden von Abclonal (Wuhan, China) entwickelt. Die Validierung der Antikörper wurde durch Western-Blotting an Gewebelysaten von Austernhepatopankreas durchgeführt (ergänzende Fig. 11). Die vollständige kodierende Sequenz von cgPdx wurde im Leseraster (siehe ergänzende Daten 4 für Primer) mit einem V5-Tag am C-Terminus (pSF-CMV-Puro-COOH-V5, Oxford Genetics) kloniert und in HEK293T-Zellen exprimiert. Mit dem Zelllysat wurde dann Western-Blotting durchgeführt, um das Molekulargewicht von cgPdx zu bestimmen. Die Spezifität der Antikörper wurde durch Western-Blotting auf Austern-Hepatopankreas-Lysat getestet. Anti-PARP1-Antikörper (ab32138, abcam, Shanghai, China) wurde als positive Kontrolle verwendet. ChIP-Assays wurden gemäß einem Standardprotokoll (Abcam) mit geringfügigen Modifikationen durchgeführt. Kurz gesagt, Austern-Hepatopankreas-Gewebestücke wurden seziert, in flüssigem Stickstoff eingefroren und bis zur Verwendung bei –80 °C gelagert. Einzelne Zellen wurden unter Verwendung von Verfahren isoliert, die für ATAC beschrieben sind. Die geernteten Zellen wurden mit 1% Formaldehyd 10 min bei Raumtemperatur vernetzt und das nach der Beschallung erhaltene lösliche Chromatin wurde mit Anti-cgPdx-Antikörpern inkubiert. Zwei ChIP-Experimente wurden mit verschiedenen Individuen durchgeführt.

Es wurden 150 mg Hepatopankreasgewebe mit 10 µg Antikörpern verwendet. Protein A (Millipore, 16–661) wurde verwendet, um Chromatin-Immunkomplexe auszufällen, die gewaschen und dann mit dem QIAquick PCR Purification Kit (Qiagen) DNA gereinigt wurden. Primer (Ergänzende Daten 4) wurden für die qPCR-Untersuchung entwickelt, die auf potenzielle Pdx-Bindungsstellen stromaufwärts von drei Genen abzielen. ChIP-DNA wurde dann als Matrize für die qPCR-Analyse verwendet, wobei die Ergebnisse durch die Eingangs-DNA normalisiert wurden. Die Faltenanreicherung wurde nach der gängigen „Signal over Background“-Methode (ThermoFisher) berechnet. Die Signifikanz des Mittelwerts der fachen Anreicherung des Ziels auf 1 wurde mit einer Probe berechnet T-test (einseitig).

In-situ-Hybridisierung

Digoxygenin-markierte Sonden wurden aus linearisierten Konstrukten in Sense- und Antisense-Richtung synthetisiert, die für alle Experimente parallel verwendet wurden. Ganzes Weichkörpergewebe von juvenilen Austern (Schalenlänge 1–3 cm) wurde in 4% Paraformaldehyd in PBS über Nacht bei 4°C fixiert. Die Gewebe wurden zweimal in PBS gewaschen und durch eine abgestufte Alkoholreihe dehydratisiert, bevor sie in 70 % Ethanol bei -20 °C gelagert wurden. Für die Wachseinbettung wurden die Gewebe in 85 % Ethanol (15 min), 100 % Ethanol (3 × 15 min), Methylbenzoat (3 × 15 min) und Benzol (1 min) gewaschen, bevor sie in geschmolzenes Paraffin (3 × 30 min) überführt wurden ). Die Blöcke wurden bei 4 °C für mindestens 2 h verfestigt, beschnitten, montiert und über Nacht (4 °C) gelagert, bevor sie bei 10 μm geschnitten wurden. Die Schnitte wurden dann mit Xylol entwachst und vor der Hybridisierung mit Proteinase K (1 μg/ml, 15 min) behandelt (50 % deionisiertes Formamid, 5 × Kochsalzlösung Natriumcitrat, 0,1 % Tween-20, 10 % Natriumdodecylsulfat, 0,3 mg /ml Torula-RNA, 50 μg/ml Heparin) mit 50 ng/μl Sonde bei 65 °C über Nacht. Nach Waschen mit 0,2x Kochsalzlösung Natriumcitrat und Maleinsäurepuffer wurden Ribosonden durch Inkubation mit alkalischer Phosphatase-konjugierten Anti-DIG-Fab-Fragmenten (1:4000 Roche Diagnostics, USA) in Roche-Blockierungspuffer in 100 mM Maleinsäure (2 h, Zimmertemperatur). Die Farbentwicklung wurde durch Inkubation in NBT/BCIP (US Biological, Swampscott, MA) durchgeführt. Die Schnitte wurden mit destilliertem Wasser gewaschen, in Glycerin montiert und unter Verwendung eines Leica MZ10F Lichtmikroskops mit freundlicher Genehmigung von Microscope Services Ltd, Oxford untersucht.

Luciferase-Assay

HeLa (ATCC, USA) und COS7 (freundlicherweise zur Verfügung gestellt von Dr. Qingfeng Yan, Zhejiang University, Zhejiang, China) wurden in modifiziertem RPMI-1640-Medium (HyClone, USA) kultiviert, das mit 10 USA) und Penicillin-Streptomycin (Solarbio, China), in einer befeuchteten Atmosphäre mit 5% CO2 bei 37 °C. Plasmide wurden mit Lipofectamine 3000 Reagenz (Life Technologies, USA) gemäß den Anweisungen des Lieferanten in Zellen transfiziert. Luciferase-Assays wurden in 24-Well-Platten mit

250.000 Zellen und 500 μl Medium/Vertiefung Insgesamt wurden 0,5 μg pSI-Expressionsplasmid-DNA (durch Zugabe der leeren pSI-Vektoren, um für jede Transfektion konstant zu bleiben) mit 0,2 μg pGL-Serie-Reporterplasmiden und 1 ng pRL-CMV-Kontrollplasmid Renilla . transfiziert Luciferase-Plasmid (Promega, USA). 24 h nach der Transfektion wurden Glühwürmchen- und Renilla-Luciferase-Aktivitäten unter Verwendung eines Dual-Luciferase-Reporter-Assay-Systems (Promega, USA) in einem Varioskan Flash-Multimode-Lesegerät (Thermo Scientific, USA) gemessen. Jede Transfektion wurde für biologische Replikate in dreifacher Ausführung durchgeführt und die Vertiefungen wurden in zwei Teile geteilt, um technische Replikate zu erzeugen. Studenten T Test (zweiseitig) wurde verwendet, um die Signifikanz der Unterschiede zu bestimmen. Das 95 %-Konfidenzintervall (KI) der Summe zwischen cgNeuroD und cgPdx/mPdx1 wurde basierend auf dem Pool aller möglichen Kombinationen zwischen den relativen Luciferase-Werten der cgNeuroD- und cgPdx/mPdx1-Gruppen geschätzt. Die Signifikanz wurde dann durch Bootstrapping berechnet (n = 100.000), wobei Summenwerte mit gleicher Stichprobengröße wie die Gruppe (cgPdx/mPdx1+cgNeuroD) zufällig aus dem Summenpool gezogen wurden.

Berichtszusammenfassung

Weitere Informationen zum Forschungsdesign finden Sie in der zu diesem Artikel verlinkten Nature Research Reporting Summary.


Druker BJ, Talpaz M, Resta DJ, Peng B, Buchdunger E, Ford JM, Lydon NB, Kantarjian H, Capdeville R, Ohno-Jones S, Sawyers CL. Wirksamkeit und Sicherheit eines spezifischen Inhibitors der BCR-ABL-Tyrosinkinase bei chronischer myeloischer Leukämie. N Engl J Med. 2001344: 1031-7.

Koivunen JP, Mermel C, Zejnullahu K, Murphy C, Lifshits E, Holmes AJ, Choi HG, Kim J, Chiang D, Thomas R, et al. EML4-ALK-Fusionsgen und Wirksamkeit eines ALK-Kinase-Inhibitors bei Lungenkrebs. Clin Cancer Res. 200814:4275–83.

Storm EE, Durinck S, de Sousa und Melo F, Tremayne J, Kljavin N, Tan C, Ye X, Chiu C, Pham T, Hongo JA, et al. Das Targeting von PTPRK-RSPO3-Kolontumoren fördert die Differenzierung und den Verlust der Stammzellfunktion. Natur. 2016529:97–100.

Tomlins SA, Rhodes DR, Perner S, Dhanasekaran SM, Mehra R, Sun XW, Varamally S, Cao X, Tchinda J, Kuefer R, et al. Wiederkehrende Fusion von TMPRSS2- und ETS-Transkriptionsfaktor-Genen bei Prostatakrebs. Wissenschaft. 2005310:644–8.

K. Yoshihara, Q. Wang, W. Torres-Garcia, S. Zheng, R. Vegesna, H. Kim, RG Verhaak. Die Landschaft und therapeutische Relevanz von Krebs-assoziierten Transkriptfusionen. Onkogen. 201534:4845–54.

Mertens F, Johansson B, Fioretos T, Mitelman F. Die aufkommende Komplexität von Genfusionen bei Krebs. Nat. Rev Krebs. 201515:371–81.

Kuppers R, Dalla-Favera R. Mechanismen chromosomaler Translokationen in B-Zell-Lymphomen. Onkogen. 200120:5580–94.

CF Davis, CJ Ricketts, M. Wang, L. Yang, AD Cherniack, H. Shen, C. Buhay, H. Kang, SC Kim, CC Fahey et al. Die somatische Genomlandschaft des chromophoben Nierenzellkarzinoms. Krebszelle. 201426:319–30.

J. Vinagre, A. Almeida, H. Populo, R. Batista, J. Lyra, V. Pinto, R. Coelho, R. Celestino, H. Prazeres, L. Lima et al. Häufigkeit von Mutationen des TERT-Promotors bei menschlichen Krebserkrankungen. Nat. Komm. 20134:2185.

Groschel S, Sanders R., Hoogenboezem R, de Wit E, Bouwman BAM, Erpelinck C, van der Velden VHJ, Havermans M, Avellino R, van Lom K, et al. Eine einzelne onkogene Verstärkerumlagerung verursacht bei Leukämie eine gleichzeitige Deregulierung von EVI1 und GATA2. Zelle. 2014157:369–81.

Zhang Y, Chen F, Fonseca NA, He Y, Fujita M, Nakagawa H, Zhang Z, Brazma A, Gruppe PTW, Gruppe PSVW, et al. Eine umfassende Genomanalyse von 1220 Krebsarten zeigt Hunderte von Genen, die durch Umlagerungs-vermittelte cis-regulatorische Veränderungen dereguliert sind. Nat. Komm. 202011:736.

Yang L, Luquette LJ, Gehlenborg N, Xi R, Haseley PS, Hsieh CH, Zhang C, Ren X, Protopopov A, Chin L, et al. Diverse Mechanismen somatischer Strukturvariationen in menschlichen Krebsgenomen. Zelle. 2013153:919–29.

Chen K, Wallis JW, McLellan MD, Larson DE, Kalicki JM, Pohl CS, McGrath SD, Wendl MC, Zhang Q, Locke DP, et al. BreakDancer: ein Algorithmus zur hochauflösenden Kartierung genomischer Strukturvariationen. Nat-Methoden. 20096:677–81.

Alaei-Mahabadi B, Bhadury J, Karlsson JW, Nilsson JA, Larsson E. Globale Analyse somatischer struktureller genomischer Veränderungen und deren Einfluss auf die Genexpression bei verschiedenen menschlichen Krebsarten. Proc Natl Acad Sci U S A. 2016113: 13768–73.

Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, Chaudhuri S, Guan Y, Janakiraman V, Jaiswal BS, et al. Rezidivierende R-Spondin-Fusionen bei Dickdarmkrebs. Natur. 2012488:660–4.

Stransky N, Cerami E, Schalm S, Kim JL, Lengauer C. Die Landschaft der Kinasefusionen bei Krebs. Nat. Komm. 20145:4846.

Tomlins SA, Mehra R, Rhodes DR, Smith LR, Roulston D, Helgeson BE, Cao X, Wei JT, Rubin MA, Shah RB, Chinnaiyan AM. TMPRSS2:ETV4-Genfusionen definieren einen dritten molekularen Subtyp von Prostatakrebs. Krebs Res. 200666:3396–400.

Q. Gao, WW Liang, SM Foltz, G. Mutharasu, RG Jayasinghe, S. Cao, WW Liao, SM Reynolds, MA Wyczalkowski, L. Yao et al. Treiberfusionen und ihre Auswirkungen auf die Entwicklung und Behandlung von Krebserkrankungen beim Menschen. Cell Rep. 201823:227–38 e223.

Y. Zhang, L. Yang, M. Kucherlapati, F. Chen, A. Hadjipanayis, A. Pantazi, CA Bristow, EA Lee, HS Mahadeshwar, J. Tang et al. Ein Pan-Krebs-Kompendium von Genen, die durch somatische genomische Umlagerung in mehr als 1.400 Fällen dereguliert wurden. Cell Rep. 201824:515–27.

Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. Eine 3D-Karte des menschlichen Genoms mit Kilobasen-Auflösung zeigt Prinzipien des Chromatin-Looping. Zelle. 2014159:1665–80.

Barros-Silva JD, Paulo P, Bakken AC, Cerveira N, Lovf M, Henrique R, Jeronimo C, Lothe RA, Skotheim RI, Teixeira MR. Neuartige 5′-Fusionspartner von ETV1 und ETV4 bei Prostatakrebs. Neoplasie. 201315:720–6.

Cancer Genome Atlas N. Umfassende molekulare Charakterisierung des menschlichen Dickdarm- und Mastdarmkrebses. Natur. 2012487:330–7.

Johansen JS, Christensen IJ, Riisbro R, Greenall M, Han C, Price PA, Smith K, Brunner N, Harris AL. Hohe YKL-40-Serumspiegel bei Patientinnen mit primärem Brustkrebs stehen im Zusammenhang mit einem kurzen rezidivfreien Überleben. Brustkrebs Res Treat. 200380:15–21.

Cintin C, Johansen JS, Christensen IJ, Price PA, Sorensen S, Nielsen HJ. Serum YKL-40 und Darmkrebs. Br.J. Krebs. 199979:1494–9.

Pelloski CE, Mahajan A, Maor M, Chang EL, Woo S, Gilbert M, Colman H, Yang H, Ledoux A, Blair H, et al. Die YKL-40-Expression ist mit einem schlechteren Ansprechen auf Strahlung und einem kürzeren Gesamtüberleben beim Glioblastom verbunden. Clin Cancer Res. 200511:3326–34.

Kang EJ, Jung H, Woo OH, Park KH, Woo SU, Yang DS, Kim AR, Lee JB, Kim YH, Kim JS, Seo JH. Die YKL-40-Expression könnte ein schlechter prognostischer Marker im Brustkrebsgewebe sein. Tumorbiol. 201435:277–86.

Padro M, Cobler L, Garrido M, de Bolos C. Die Herunterregulierung von FUT3 und FUT5 durch shRNA verändert die Expression von Lewis-Antigenen und reduziert die Adhäsionskapazitäten von Magenkrebszellen. Biochim Biophys Acta. 18102011:1141–9.

Liang L, Gao C, Li Y, Sun M, Xu J, Li H, Jia L, Zhao Y. miR-125a-3p/FUT5-FUT6-Achse vermittelt die Proliferation, Migration, Invasion und pathologische Angiogenese von Darmkrebszellen über PI3K-Akt Weg. Zelltod Dis. 20178:e2968.

Potapenko IO, Luders T, Russnes HG, Helland A, Sorlie T, Kristensen VN, Nord S, Lingjaerde OC, Borresen-Dale AL, Haakensen VD. Glykan-bezogene Genexpressionssignaturen bei Brustkrebs-Subtypen in Bezug auf das Überleben. Mol Oncol. 20159:861–76.

Slebe F, Rojo F, Vinaixa M, Garcia-Rocha M, Testoni G, Guiu M, Planet E, Samino S, Arenas EJ, Beltran A, et al. FoxA und LIPG endotheliale Lipase kontrollieren die Aufnahme extrazellulärer Lipide für das Brustkrebswachstum. Nat. Komm. 20167:11199.

Rippe V, Drieschner N, Meiboom M, Murua Escobar H, Bonk U, Belge G, Bullerdiek J. Identifizierung eines Gens, das durch 2p21-Aberrationen in Schilddrüsenadenomen umgeordnet wird. Onkogen. 200322:6111–4.

Cancer Genome Atlas Research N. Integrierte genomische Charakterisierung des papillären Schilddrüsenkarzinoms. Zelle. 2014159:676–90.

Kloth L, Belge G, Burchardt K, Loeschke S, Wosniok W, Fu X, Nimzyk R, Mohamed SA, Drieschner N, Rippe V, Bullerdiek J. Die Abnahme der Schilddrüsenadenom-assoziierten (THADA) Expression ist ein Marker für die Dedifferenzierung von Schilddrüsengewebe . BMC Clin Pathol. 201111:13.

Panebianco F, Kelly LM, Liu P, Zhong S, Dacic S, Wang X, Singhi AD, Dhir R, Chiosea SI, Kuan SF, et al. Die THADA-Fusion ist ein Mechanismus der IGF2BP3-Aktivierung und der IGF1R-Signalübertragung bei Schilddrüsenkrebs. Proc Natl Acad Sci U S A. 2017114: 2307–12.

D. Bujold, D. A. Morais, C. Gauthier, C. Cote, M. Caron, T. Kwan, K.C. Chen, J. Laperle, AN Markovits, T. Pastinen et al. Das Datenportal des International Human Epigenome Consortium. Zellsyst. 20163:496–9 e492.

Konsortium EP. Eine integrierte Enzyklopädie der DNA-Elemente im menschlichen Genom. Natur. 2012489:57–74.

Hou H, Yu X, Cong P, Zhou Y, Xu Y, Jiang Y: Six2 fördert die Stammheit von nicht-kleinzelligen Lungenkrebszellen durch transkriptionelle und epigenetische Regulierung von E-Cadherin. Zellprofil 201952:e12617.

Wang CA, Drasin D, Pham C, Jedlicka P, Zaberezhnyy V, Guney M, Li H, Nemenoff R, Costello JC, Tan AC, Ford HL. Homeoprotein Six2 fördert die Metastasierung von Brustkrebs durch transkriptionelle und epigenetische Kontrolle der E-Cadherin-Expression. Krebs Res. 201474:7357–70.

Wu DW, Lin PL, Wang L, Huang CC, Lee H. Die YAP1/SIX2-Achse ist für die DDX3-vermittelte Tumoraggressivität und Cetuximab-Resistenz bei KRAS-Wildtyp-Kolorektalkrebs erforderlich. Theranostik. 20177:1114–32.

Lederer M, Bley N, Schleifer C, Huttelmaier S. Die Rolle des onkofetalen IGF2 mRNA-bindenden Proteins 3 (IGF2BP3) bei Krebs. Semin Cancer Biol. 201429:3–12.

Kamburov A, Pentchev K, Galicka H, ​​Wierling C, Lehrach H, Herwig R. ConsensusPathDB: Hin zu einem umfassenderen Bild der Zellbiologie. Nukleinsäuren Res. 201139:D712–7.

Tag E, Poulogiannis G, McCaughan F, Mulholland S, Arends MJ, Ibrahim AE, Lieber PH. IRS2 ist ein mögliches Treiber-Onkogen auf 13q34 bei Darmkrebs. Int J Exp Pathol. 201394:203–11.

Jia Y, Xie Z, Li H. Intergenisch gespleißte chimäre RNAs bei Krebs. Tendenzen Krebs. 20162:475–84.

Matsumoto H, Koo SL, Dent R, Tan PH, Iqbal J. Rolle von entzündlichen Infiltraten bei dreifach negativem Brustkrebs. J Clin Pathol. 201568:506–10.

Yang L, Lee MS, Lu H, Oh DY, Kim YJ, Park D, Park G, Ren X, Bristow CA, Haseley PS, et al. Analyse von somatischen Genomumlagerungen bei menschlichen Krebserkrankungen unter Verwendung von Whole-Exom-Sequenzierung. Bin J Hum Genet. 201698:843–56.

Wang K, Singh D, Zeng Z, Coleman SJ, Huang Y, Savich GL, He X, Mieczkowski P, Grimm SA, Perou CM, et al. MapSplice: genaues Mapping von RNA-Seq-Reads für die Erkennung von Splice Junctions. Nukleinsäuren Res. 201038:e178.

Iyer MK, Chinnaiyan AM, Maher CA. ChimeraScan: ein Werkzeug zur Identifizierung der chimären Transkription in Sequenzierungsdaten. Bioinformatik. 201127:2903–4.

McPherson A, Hormozdiari F, Zayed A, Giuliany R, Ha G, Sun MG, Griffith M, Heravi Moussavi A, Senz J, Melnyk N, et al. deFuse: ein Algorithmus zur Entdeckung von Genfusionen in Tumor-RNA-Seq-Daten. PLoS Comput Biol. 20117:e1001138.

Robinson JT, Thorvaldsdottir H, Winckler W, Guttman M, Lander ES, Getz G, Mesirov JP. Integrativer Genomik-Viewer. Nat. Biotechnologie. 201129:24–6.

Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, Paulovich A, Pomeroy SL, Golub TR, Lander ES, Mesirov JP. Gene Set Enrichment Analysis: ein wissensbasierter Ansatz zur Interpretation genomweiter Expressionsprofile. Proc Natl Acad Sci U S A. 2005102:15545–50.

Gu Z, Eils R, Schlesner M. Komplexe Heatmaps zeigen Muster und Korrelationen in mehrdimensionalen Genomdaten. Bioinformatik. 201632:2847–9.

Canisius S, Martens JW, Wessels LF. Ein neuartiger Unabhängigkeitstest für somatische Veränderungen bei Krebs zeigt, dass die Biologie die gegenseitige Ausschließlichkeit fördert, aber der Zufall das meiste gleichzeitige Auftreten erklärt. Genom Biol. 201617:261.

Der Krebsgenom-Atlas: Datenbank von Genotypen und Phänotypen. Referenzen herunterladen


Verfügbarkeit von Daten und Materialien

Die während der aktuellen Studie generierten Datensätze sind als BioProjekt beim National Center for Biotechnology Information unter der Zugangsnummer PRJNA616061 (https://dataview.ncbi.nlm.nih.gov/object/PRJNA616061) verfügbar. Die in Tabelle 1 aus Referenz [37] gezeigten Microarray-Datensätze zur täglichen Genexpression von Arabidopsis sind bei ArrayExpress unter der Zugangsnummer E-MEXP-1304 (https://www.ebi.ac.uk/arrayexpress/experiments/E-MEXP-1304/) erhältlich. ). DNA-Sequenzen entsprechend cis-regulatorische Motive wurden aus der PLACE-Datenbank Version 30.0 (Dateien place.dat (https://www.dna.affrc.go.jp/PLACE/place_dat.shtml) und place.seq (https://www.dna. affrc.go.jp/PLACE/place_seq.shtml)). Protein-Aminosäuresequenzen wurden von Uniprot Release 2015.01 (ftp://ftp.uniprot.org/pub/databases/uniprot/ previous_releases/release-2015_01/) erhalten. Proteindomänen wurden basierend auf Prosite Version 6.1 (ftp://ftp.expasy.org/databases/prosite/old_releases/prosite06_1.tar.bz2) und Pfam Version 9.0 (ftp://ftp.ebi.ac.uk/pub .) vorhergesagt /databases/Pfam/releases/Pfam9.0/).

Arabidopsis-Gene/Proteine ​​aus der Arabidopsis-Informationsquelle (https://www.arabidopsis.org), Anmerkungsversion TAIR10 (Name (eindeutige Gen-ID Uniprot-Zugangsnummer)): LHY (AT1G01060 Q6R0H1), CCA1 (AT2G46830 P92973), RVE1 ( AT5G17300 F4KGY6 AT5G60100 F4JXG7), PRR4 (AT5G49240 Q9FJ16), PRR5 (AT5G24470 Q6LA42), PRR7 (AT5G02810 Q93WK5), PRR9 (AT2G46790 Q8L500), GI (AT1G22770 Q9SQI2), ELF3 (AT2G, 25802F8) ), EF4L2 (AT1G72630 Q94BS8), EF4L3 (AT2G06255 Q8S8F5), EF4L4 (AT1G17455 Q570U6), LUX)/PCL1 (AT3G46640 F4J959), BOA (AT5G59570 F4J959), ZTL/ADO1 (AT5G57420) , FKF1/ADO3 (AT1G68050 Q9C9W9).

Gene/Proteine ​​von MaizeGDB (https://maizegdb.org/) für Mais-Annotation Version 5b und von Phytozome (https://phytozome.jgi.doe.gov/) für Sorghum-Annotation Version v3.1 und Fuchsschwanz Hirse-Annotation Version v2.2 (Name (Maissorghum-Fuchsschwanzhirse einzigartige Gen-ID)): LYL1 (GRMZM2G175227 + GRMZM2G175265 + GRMZM2G474769 Sobic.007G047400 Seita.6G055700), LYL2 (GRMZM2G014902 Sobic.007G047400) Seita. 4G288100), RE6L1 (GRMZM2G135052 Sobic.010G004300 Seita.4G004600), RE6L2 (GRMZM2G170148 Sobic.010G223700 Seita.4G266800), RE6L3 (GRMZM2G057408 Sobic.010G223700 Seita.4G26680030ZM1 Sobic.004G281800 Seita.1G272700, RE7L1 (GRMZM2G029850, Sobic.004G279300 Seita.1G275400), RE7L2 (GRMZM2G170322 Sobic.004G279300 Seita.1G275400), RE7L3 (GRMZM2G42125630 Sobica.006 SeitG 7G212900), RE8L2 (GRMZM2G115070 Sobic.001G143100, Si038786m) RE8L1 (GRMZM2G415077 Sobic.001G143100 Si038786m), T1L1 (GRMZM2G148453 Sobic.004G216700 Seita.1G236100), T1L2 (GRMZM2G020081 Sobic.004G216700. Seita.2G444300), P59L2 (GRMZM2G488465 + GRMZM2G013913 Sobic.005G044400 Seita.8G040100), P59L1 (GRMZM2G135446 Sobic.005G044400 Seita.8G040100), P73L (GRMZM2001G095711400) Sobic. , P95L2 (GRMZM2G367834 Sobic.002G275100 Seita.2G286100), GI1 (GRMZM2G107101 Sobic.003G040900 Seita.5G129500), GI2 (GRMZM5G844173 Sobic.003G040900_19EFAC.5G129500), GI1 (GRMZM2G107101 Sobic.009G257300 Seita.3G121000), EF4R1 (GRMZM2G382774 Sobic.001G340700 Seita.9G368100), EF4R2 (GRMZM2G359322 Sobic.001G340700 Seita.9G368100), EF4R3 (GRMZ. 2G 195800), LXL (GRMZM2G067702 Sobic.003G443600 Seita.5G468100), ZLL1 (GRMZM2G115914 Sobic.010G243900 Seita.4G249100), ZLL2 (GRMZM2G113244 Sobic.010G243900 Seita.4G2 Sobic.004G042200 Seita.1G087300), FFL1 (GRMZM2G106363, Sobic.005G145300 Seita.8G146900), FFL2 (GRMZM2G107945 Sobic.005G145300 Seita.8G146900).


Methoden

Materialien und Stressbehandlungen

Die B. rapa Die Sorte Chiffu wurde in einer Wachstumskammer des Oil Crops Research Institute der Chinese Academy of Agricultural Sciences in Wuhan bei 20 ± 2°C mit 12 h Licht und 12 h Dunkelheit gepflanzt. Die Wurzeln wurden von jungen Sämlingen entnommen. Frische Blütenknospen wurden erhalten und von den anderen Geweben wurden ungefähr 25 Tage nach der Blüte Proben genommen, einschließlich Stängel, Blätter, Schoten und Samen. Drei biologische Replikate jedes getesteten Gewebes wurden hergestellt, indem Proben von drei verschiedenen Individuen entnommen wurden. Die Proben wurden schnell in flüssigem Stickstoff eingefroren und bei –80°C bis zur RNA-Isolierung gelagert.

EIN B. rapa Landrasse (Wuxianzangcaizi) wurde für die Schwermetallbehandlung verwendet. Gesunde Samen ähnlicher Größe wurden oberflächensterilisiert, getrocknet und dann in sterilisiertem feuchtem Filterpapier zum Keimen gebracht. Die Samen wurden mit frischem Medium behandelt, das mit 20 ml 15 mg/l CdCl&sub2;2 oder 50 mg/L Pb (NO3)2 [36]. Mit einer gleichen Menge destilliertem Wasser behandelte Samen dienten als Kontrollen. Drei Wiederholungen von 50 Samen wurden für jede Behandlung verwendet. Die Behandlungs- und Kontrollsamen wurden 24 h bei 22 °C im Dunkeln kultiviert und dann während der Photoperiode (16 h Licht/8 h Dunkelzyklus) sieben Tage lang kultiviert. Die Triebe und Wurzeln von Sämlingen ähnlicher Größe wurden getrennt geerntet und dreimal mit entionisiertem Wasser gewaschen. Die Proben wurden bis zur RNA-Extraktion in flüssigem Stickstoff eingefroren.

Identifizierung und Analyse von Glyoxalase-Proteinen in B. rapa

Pfam (http://pfam.sanger.ac.uk/) Accessions PF00903 für GLYI und PF00753 für GLYII wurden für eine Suche nach dem Hidden Markov Model (HMM) verwendet [34]. Die gesamte genomische Sequenz von B. rapa wurde von der Brassica Datenbank (BRAD, http://brassicadb.org/brad/) [35]. Die GLYI und GLYII Gene wurden aus der gesamten genomischen Sequenz gemäß den Beschreibungen von Wang et al. extrahiert. [37].

Analysen von Chromosomenorten, Genstrukturen und Genduplikationen im BrGLYI und BrGLYII Gene

Die genomischen Positionen der BrGLYI und BrGLYII Gene an B. rapa Chromosomen wurden unter Verwendung einer BLASTn-Suche analysiert. Die BrGLYI und BrGLYII Genstrukturen wurden mit dem Gene Structure Display Server Program (GSDS, http://gsds.cbi.pku.edu.cn/index.php) analysiert [38]. Vervielfältigung von BrGLYI und BrGLYII und ihre Positionen wurden zwischen den Arabidopsis und B. rapa Subgenome wie zuvor beschrieben [39].

Sequenzanalyse und Konstruktion des phylogenetischen Baumes

Clustal X-Software (ftp://ftp-igbrmc.u-strasbg.fr/pub/clustalX/) wurde für Aminosäure-(aa)-Alignments verwendet. Die phylogenetische Analyse wurde mit der MEGA 5.05-Software unter Verwendung der Neighbor-Joining (NJ)-Methode und 1.000 Bootstrap-Tests erstellt [40].

Subzelluläre Lokalisation der vorhergesagten GLYI-Proteine

Die subzellulären Lokalisationen aller vorhergesagten BrGLYI- und BrGLYII-Proteine ​​wurden mit verschiedenen Online-Tools analysiert, d. h. Wolf pSORT [41], TargeP und ChloroP [42].

Promotorsequenzanalyse

Um die regulatorischen Elemente in der BrGLYI und BrGLYII Promotoren wurden die 1,5 kb 5'-stromaufwärts gelegenen Sequenzen des ATG-Initiationscodes von BRAD erhalten und mithilfe von PlantCARE-Datenbanken analysiert (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) [40, 43] .

Genexpressionsanalyse

Die BrGLY Expression in Wurzel-, Stängel-, Blatt-, Blüten- und Schuppengewebe von 7 Wochen altem Chinakohl und Kallus-Chinakohl (Chiifu-401-42) wurden anhand der Transkriptomdaten online analysiert (http://www.ncbi.nlm.nih.gov .). /geo/query/acc.cgi?acc=GSE43245) [44]. Die Daten wurden verwendet, um eine Heatmap mit dem Heatmap Illustrator-Paket (HemI, http://hemi.biocuckoo.org/down.php) zu erstellen [45].

Um die Reaktion der BrGLY Gene für biotischen Stress im Chinakohl, dem Ausdruck aller BrGLYI und BrGLYII Gene als Reaktion auf eine Pathogeninfektion wurde anhand der berichteten RNA-Seq-Daten analysiert (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE74044) [46].

Die Rohdaten, die mit dem Tag-basierten Transkriptom-Sequenzierungsansatz gewonnen wurden, wurden verwendet, um die Reaktion des zu bestätigen BrGLY Gene zum Schwermetallstress, die über die GEO-Datenbank (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE55264) zugänglich war [47].

RT-qPCR-Analysen

Gesamt-RNA wurde unter Verwendung eines Isolationskits (BioTeke, RP3201) isoliert. Die cDNA wurde unter Verwendung eines Synthesekits (TransGen Biotech) synthetisiert und die RT-qPCR wurde wie von Li et al. [39]. Der relative Ausdruck von BrGLY wurde mit dem . analysiert Aktin als Housekeeping-Gen unter Verwendung einer zuvor beschriebenen Methode [48]. Die spezifischen Primer, die entwickelt wurden, sind aufgelistet in S1 Tabelle.


ZUKÜNFTIGE RICHTUNGEN UND KLINISCHE AUSWIRKUNGEN

Die DNA-Methylierung variiert nicht nur zwischen Geweben, sondern auch zwischen Hirnregionen, zwischen grauer und weißer Substanz und möglicherweise sogar zwischen Zellen (Ladd-Acosta et al, 2007 Ghosh et al, 2010). Obwohl die derzeitige Technologie unsere Fähigkeit zur Unterscheidung zellspezifischer Methylierungsmuster einschränkt, hat das Aufkommen der DNA-Sequenzierung der nächsten Generation leistungsstarke Werkzeuge zur Untersuchung des genomweiten DNA-Methylierungsmusters mit Einzelnukleotidauflösung bereitgestellt (Meissner et al, 2008 Liste et al, 2009 Popp et al, 2010). Wenn sich die Technologie verbessert, werden die Kosten für die Durchführung von Sequenzanalysen sinken, wodurch die Technologie leichter zugänglich wird. Jüngste technische Entwicklungen haben es ermöglicht, eine genomweite DNA-Methylierungsanalyse selbst mit einer Probenmenge von nur 150 ng (Popp et al, 2010). Aberrante DNA-Methylierungsmuster werden bei einer Vielzahl von psychiatrischen und neurologischen Erkrankungen beobachtet. Mit sinkenden Kosten und der Möglichkeit, genomweite Methylierungsanalysen an begrenzten Gewebemengen durchzuführen, wird es bald möglich sein, genomweite DNA-Methylierungsmuster aus verschiedenen Hirnregionen von Patienten mit neurologischen und psychiatrischen Erkrankungen abzubilden. Die Analyse von Nervengewebe von psychiatrischen Patienten wird zu neuen Erkenntnissen über die Ätiologie psychiatrischer Erkrankungen führen und neue Wege der Wirkstoffforschung und zielgerichteten Therapien eröffnen.

Obwohl aktuelle Protokolle es Wissenschaftlern ermöglichen, die DNA-Methylierung mit Einzelnukleotidauflösung unter Verwendung von zunehmend kleineren Gewebemengen präzise zu quantifizieren, sind viele der am häufigsten verwendeten Methoden zur Profilerstellung und Quantifizierung der DNA-Methylierung, wie die Bisulfit-Sequenzierung und methylierungssensitive enzymbasierte Assays, nicht in der Lage zwischen 5hmC und 5mC zu unterscheiden (Tahiliani et al, 2009 Huang et al, 2010). Einige Protokolle sind in der Lage, 5hmC von 5mC im Genom zu unterscheiden: CpG-Endmarkierung gefolgt von Dünnschichtchromatographie (Tahiliani et al, 2009) und Hochleistungsflüssigkeitschromatographie (HPLC) mit entweder UV-Detektion (Liutkeviciute et al, 2009) oder Tandem-Massenspektrometrie (Globisch et al, 2010 Le et al, 2011). Hydroxymethylierte DNA kann mit Antikörpern angereichert werden, die spezifisch an 5hmC binden, oder durch Biotinylierung von modifiziertem 5hmC, und präzipitierte Sequenzen können mit Microarray-Chips oder durch DNA-Sequenzierung identifiziert werden (Szwagierczak et al, 2010 Ficz et al, 2011 et al, 2011 Pastor et al, 2011 Wu und Zhang, 2011). Obwohl diese Verfahren 5hmC quantifizieren und DNA-Sequenzen identifizieren können, mit denen es assoziiert ist, wurde keine Einzelbasenpaar-Auflösung erreicht. Um die genomische Verteilung und die epigenetische Rolle von 5hmC im Gehirn aufzuklären, muss eine lokusspezifische Methode zur Identifizierung von 5hmC entwickelt werden.

Da andere Hochdurchsatztechniken, einschließlich der RNA- und Chromatin-Immunopräzipitations-(ChIP)-Sequenzierung, für Forscher immer zugänglicher werden, besteht ein wachsender Bedarf an der Integration von Hochdurchsatzdaten. Derzeit werden DNA-Methylierung, Histon-Modifikation und miRNA relativ isoliert untersucht. Um vollständig zu verstehen, wie die Genexpression im Nervensystem reguliert wird, muss die zukünftige Forschung das Epigenom als Ganzes betrachten. Durch die Analyse der biologischen Mechanismen, die das Übersprechen zwischen diesen biologischen Mechanismen vermitteln, und die Integration von Hochdurchsatzdaten können wir damit beginnen, das Epigenom als Ganzes zu untersuchen. Um schließlich zu verstehen, wie das Epigenom die Genexpression reguliert, müssen zukünftige Forschungen die biologischen Mechanismen aufdecken, die aktivitätsabhängige Veränderungen in der epigenomischen Landschaft des Säugetiergehirns vermitteln.


Schau das Video: Kræft og Genregulering (Juni 2022).


Bemerkungen:

  1. Einhard

    Ich trete bei. Ich stimme mit allem über den oben genannten Gesamt zu.

  2. Laban

    uraaaaaaa waited for a thank you even for such quality

  3. Standa

    Also what as a result?

  4. Paegastun

    Nicht nur du



Eine Nachricht schreiben