Information

Wie funktioniert alternatives Spleißen?

Wie funktioniert alternatives Spleißen?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich versuche herauszufinden, was kontrolliert, welche Exons ausgespleißt werden, und ich stoße immer wieder auf den Begriff cis-Regulator, aber ich scheine keine klare Erklärung dafür zu finden, was passiert ...

Vielen Dank im Voraus :)

BEARBEITEN: Zur Verdeutlichung habe ich versucht, den Wikipedia-Artikel über alternatives Spleißen zu lesen, und ich verstehe die Hauptidee (einige Exons werden mit den Introns aus der mRNA herausgeschnitten, um die reife mRNA zu produzieren, denke ich ... ), aber ich verstehe es nicht der Abschnitt "Mechanismus", dh Was steuert, welche Exons herausgeschnitten werden? Und welche Enzyme „spleißen“ die mRNA – wie tun sie es an der richtigen Stelle und kleben die mRNA wieder zusammen?


21joanna12, schau dir snRNPs an. Dies sind Teile des Splicosomapparates und einige von ihnen (die U1 und U2, U11 und U12 snRNPs) sind auch die Leitpfosten, die in der Nähe der Spleißverbindungen am Ende der Introns binden. Diese helfen, die Spleißvorrichtung zu den Spleißstellen zu führen. Es gibt auch Proteine, die RNA binden und mit dem Spleißapparat interagieren, um alternatives Spleißen zu schalten, wie zum Beispiel SP-Proteine.
https://en.wikipedia.org/wiki/SnRNP
https://en.wikipedia.org/wiki/SR_protein
https://en.wikipedia.org/wiki/Exonic_splicing_enhancer

Hier ist eine aktuelle Übersicht, die als Einstieg in die Literatur dienen könnte: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4232567/


Ein Review von Penalva und Sánchez erklärt ein Beispiel dafür, wie alternatives Spleißen auf molekularer Ebene reguliert wird. Es gibt noch andere mögliche Mechanismen, die mir nur vage bekannt sind.

https://www.ncbi.nlm.nih.gov/pmc/articles/pmid/12966139/

Die Geschlechtsbestimmung bei Drosophila melanogaster wird weitgehend durch eine Kaskade alternierender Spleißereignisse gesteuert.

In einer kurzen (und zugegebenermaßen unvollständigen) Zusammenfassung erkennen die Produkte eines Gens (RNA-Bindungsprotein) eine bestimmte Spleißstelle in einem nachgeschalteten Transkript. Beim Binden ist diese Stelle nicht mehr als Spleiß-Akzeptor-Stelle verfügbar und der Spleiß-Mechanismus wird "gezwungen", mit der nächsten verfügbaren Akzeptor-Stelle zu arbeiten. Dies führt zur Exzision des ehemaligen Exons, das nun zu einem Intron geworden ist.

Dieser Prozess ist in der oben zitierten Übersicht in Fig. 3A grafisch dargestellt, wo das weibliche/funktionelle Sxl-Produkt (sofern vorhanden) ein anderes RNA-bindendes Protein (U2AF) blockiert, das am Standard-Spleißen beteiligt ist, und es anweist, zum nächsten verfügbaren Akzeptor überzugehen Seite? ˅. (Ich würde gerne Abb. 3A hier einfügen, weiß aber nicht wie. Vielleicht hilft das: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC193869/figure/f3/)

Sextödliches Genprodukt existiert in männlich- und weiblich-spezifischer Form, produziert durch (wer hätte das gedacht?) abwechselndes Spleißen des Sxl-Transkripts. Das männlich-spezifische Transkript hat ein frühes Stopcodon und ergibt ein nicht-funktionelles Protein. Die weibliche Form modifiziert das Spleißen des Transformator-Genprodukts, um eine weibliche-spezifische (funktionelle) Version der Transformator-mRNA herzustellen. Die unmodifizierte (männliche) Version produziert wiederum ein nicht-funktionelles Protein. Die weiblich-spezifische Version des tra-Genprodukts (warte darauf!) modifiziert das Spleißen des doppelgeschlechtlichen Transkripts, um ein weiblich-spezifisches doppelgeschlechtliches Protein zu produzieren. Das unmodifizierte/Standard-Spleiß-dsx-Transkript produziert ein männlich-spezifisches Protein. Diese männlich- und weiblich-spezifischen Proteine ​​führen zur männlich- und weiblich-spezifischen Expression einer Reihe von Genen weiter stromabwärts. Übrigens beeinflusst das Sxl-Genprodukt nicht nur das Tra-Transkript, sondern modifiziert auch das Spleißen seines EIGENEN TRANSKRIPTS, um die Sxl-Expression nach seinem anfänglichen Beginn aufrechtzuerhalten. Es spielt auch eine Rolle bei der Einstellung des Gesamtniveaus der X-Chromosom-Transkription, um eine "Dosiskompensation" zu erreichen.

Hoffe das hilft.


Wie beeinflusst alternatives RNA-Spleißen die Genexpression?

Genexpression bezeichnet einen Vorgang, bei dem die genetische Information eines Gens auf eine Aminosäuresequenz eines funktionellen Proteins übertragen wird. Der Fluss der genetischen Information von DNA zu RNA erfolgt durch Transkription. Die RNA wird dekodiert, um durch Translation die Aminosäuresequenz eines Polypeptids zu erzeugen. Bei Eukaryoten erfolgt die Regulation der Genexpression über viele Schritte zwischen Transkription und Translation. Im Allgemeinen sind eukaryotische Gene komplexer als prokaryotische Gene, da sie zusätzliche Sequenzen enthalten, die die kodierende Sequenz unterbrechen. Die kodierende Sequenz kann in Exons gefunden werden, während die unterbrechenden Sequenzen die Introns sind. Diese Introns werden während posttranskriptioneller Modifikationen in einem als RNA-Spleißen bekannten Prozess entfernt. Alternatives RNA-Spleißen ist an der Produktion verschiedener Proteine ​​über die Rekombination von Exons in unterschiedlichen Mustern beteiligt.

Abgedeckte Schlüsselbereiche

1. Was ist RNA-Spleißen?
– Definition, Mechanismus des RNA-Spleißens
2. Wie beeinflusst alternatives RNA-Spleißen die Genexpression?
– Die Produktion verschiedener funktioneller Proteine ​​beim alternativen Spleißen

Schlüsselbegriffe: Exons, Introns, multiple Proteine, RNA-Spleißen, posttranskriptionelle Modifikationen, Spleißosom A


Es gibt mehr als einen Weg, ein Gen zu spleißen

UConn-Forscher untersuchen, wie alternatives Spleißen eine Schlüsselrolle bei Entzündungen spielt, einem wichtigen Teil der Immunantwort.

Entzündungen sind Teil der natürlichen Reaktion des Körpers auf Verletzungen oder Infektionen. Es hilft, die Ursache von Zellverletzungen zu beseitigen, abgestorbene Zellen zu entfernen und die Gewebereparatur einzuleiten. Während Entzündungen im Allgemeinen von Vorteil sind, können sie, wenn sie nicht kontrolliert werden, wichtige Systeme, einschließlich des Herz-Kreislauf-Systems, schädigen.

Wenn die Entzündungsreaktion fehlschlägt, kann sie zu Gefäßläsionen beitragen. Diese Läsionen spielen eine Rolle bei Aneurysmen, Krampfanfällen, Schlaganfällen, Arteriosklerose und anderen Krankheiten.

UConn Health-Forscher Patrick Murphy, Assistenzprofessor am Center for Vascular Biology, und Anthony „Tony“ Vella, Professor und Vorsitzender der Abteilung für Immunologie, haben von den National Institutes of Health einen Zuschuss in Höhe von 2,7 Millionen US-Dollar erhalten, um die Rolle der RNA-Bindung zu untersuchen Proteine ​​und alternatives Spleißen bei der Regulierung von Entzündungen.

Während seiner Postdoc-Arbeit am MIT entdeckte Murphy, dass die Endothelzellen, die die Arterien auskleiden, auf die Rekrutierung von Immunzellen in den frühen Stadien einer Gefäßverletzung reagierten, indem sie die Zusammensetzung der mRNA durch einen als alternatives Spleißen bekannten Prozess veränderten.

Die von einem einzelnen Gen abgeleitete Prä-mRNA-Botschaft kann auf viele verschiedene Arten zerschnitten werden und verschiedene Exons oder kodierende RNA-Stücke enthalten. Je nachdem, welche Exons im endgültigen Transkript enthalten sind, wird ein anderes Protein produziert. Durch alternatives Spleißen kann ein einzelnes Gen für mehrere Proteine ​​kodieren.

Endothelzellen sind Torwächter der Immuninfiltration in Gewebe, wie die Arterienwand. Murphy fand heraus, dass das Blockieren des alternativen Spleißens eines Gens das Risiko von Arteriendissektionen und einer veränderten Immunzellfunktion erhöht. Dies führte Murphy zu der Hypothese, dass alternatives Spleißen die Art der Interaktion zwischen dem Immunsystem und der Arterienwand reguliert.

Unterstützt durch Gelder der National Institutes of Health, der American Heart Association und Startup-Gelder der UConn School of Medicine, gründete Murphy in vitro Screening-Ansätze und in vivo Modelle, um dieser Frage in seinem neuen Labor nachzugehen.

Ein talentiertes Team unter der Leitung der Doktoranden der biomedizinischen Wissenschaften Jessica Hensel und Sarah-Anne Nicholas sowie der Forschungsassistentin Amy Kimble verwendete CRISPR-KO-Screenings, um eine Reihe von RNA-bindenden Proteinen – Spleißfaktoren – zu identifizieren, die diese Spleißreaktionen regulieren und unerwarteterweise die entzündliche Aktivierung von Endothelzellen.

Überraschenderweise banden viele dieser RNA-bindenden Proteine ​​auch Transposonsequenzen in Introns, Bereiche des prä-mRNA-Transkripts, die normalerweise ausgespleißt wurden, um die endgültige mRNA-Botschaft zu erzeugen. Transposons sind sich selbst replizierende DNA-Stücke, die von einer Stelle im Genom zu einer anderen hüpfen. Obwohl jetzt nur noch wenige Transposons aktiv sind, ist das Genom mit ihren Überresten übersät, die etwa 50% unserer Genome ausmachen.

Murphy glaubt, dass dieser kleine Satz von Spleißfaktoren die Entwicklung unserer Entzündungsreaktionen vorangetrieben hat, indem er bestimmt, wie viel von dieser von einem Transposon abgeleiteten Sequenz in eine mRNA-Botschaft eingebaut wird.

Die Schlüsselfrage lautete dann: Modulieren Transposon-bindende Spleißfaktoren Entzündungsreaktionen? in vivo? Hier erhielt Murphy kritische Hilfe von Vella.

„Bei meiner Fakultätssuche habe ich mich auf Forschungsumgebungen mit Stärken in der Immunologie konzentriert“, sagt Murphy. „Ich freue mich, sagen zu können, dass ich das richtig gemacht habe. Diese Arbeit wäre mit den Erkenntnissen und der Hilfe der Immuno-Cardiovascular Group und insbesondere von Tony Vella nicht möglich gewesen.“

Die von Dr. Annabelle Rodriquez-Oquendo organisierte und von Vella und Beiyan Zhou geleitete Immuno-Cardiovascular Group hat Spitzenforscher im kardiovaskulären Bereich angezogen, darunter Zhichao Fan und Alison Kohan. Sie setzen ihr kollektives Know-how und ihre Fähigkeiten ein, um ein grundlegendes Problem bei Herz-Kreislauf-Erkrankungen anzugehen – dass die meisten Menschen, die an Herzinfarkt oder Schlaganfall leiden, bereits einen gut kontrollierten Lipidspiegel haben.

Atherosklerotische Plaques, die Herzinfarkt und Schlaganfall verursachen, entstehen durch eine Ansammlung von Lipiden, Fettmaterial in der Arterienwand. Während Lipidsenker wie Statine erhebliche Fortschritte bei der Reduzierung des Risikos dieser Läsionen gemacht haben, bleiben vaskuläre „Narben“ auch nach der Senkung des Lipidspiegels zurück. Herzinfarkt und thrombotischer Schlaganfall sind die häufigsten Todesursachen in den Vereinigten Staaten.

Ermutigenderweise haben neuere Arbeiten gezeigt, dass diese Läsionen durch direkte Modulation der Entzündung gezielt werden können, was darauf hindeutet, dass dies wahrscheinlich die nächste Grenze bei der Behandlung sein wird.

Der kleine Satz von Transposon-bindenden Spleißfaktoren, die Murphy identifizierte, korreliert mit dem Krankheitsrisiko in menschlichen Koronararterien.

Murphy arbeitet mit Vella zusammen, um die Hypothese zu testen, dass Transposon-bindende Spleißfaktoren eine wichtige Rolle bei der Bestimmung des Ergebnisses von Entzündungsreaktionen in der Plaque spielen. Sie werden modernste Einzelzellanalysetools anwenden, um atherosklerotische Plaques in Tiermodellen mit Inaktivierung dieser Gene zu untersuchen – Techniken, die in ihrer kürzlich veröffentlichten Arbeit hervorgehoben werden.

Ihre Arbeit wird Forschern und Klinikern helfen, besser zu verstehen, warum einige atherosklerotische Läsionen jahrzehntelang langsam schwelen können, während andere Plaques instabil entzündet werden, was zu Herzinfarkt und Schlaganfall führt. Letztlich könnte dieses Wissen genutzt werden, um Risikopatienten sowie neue Therapieansätze zu identifizieren.

Patrick Murphy hat einen Ph.D. in Biomedizin an der University of California, San Francisco. Er absolvierte eine Postdoc-Ausbildung am Massachusetts Institute of Technology. Sein Labor untersucht die Interaktionen zwischen rekrutierten Immunzellen und den Arterienwänden mit induzierbaren genetischen Modellen.

Tony Vella absolvierte eine Postdoc-Ausbildung am National Jewish Center for Immunology and Respiratory Medicine. Sein Labor beschäftigt sich mit T-Zell- und Entzündungsbiologie mit Schwerpunkt auf Impfstoff-Adjuvanzien, T-Zell-Kostimulation und entzündlichen Darmerkrankungen bei Kindern.


Alternatives Spleißen von SNARE-Proteinen

Die SNARE-Maschinerie steuert die Interaktion zwischen vesikulären v-SNAREs (VAMPs) und Ziel-t-SNAREs (wie SNAPs und Syntaxine) während der Vesikelfusion ( 3A ). Mehrere Komponenten der SNARE-Maschinerie werden einem alternativen Spleißen unterzogen, wie unten beschrieben.

Alternatives Spleißen von SNARE-verwandten Proteinen. (A) Schritte der vesikelvermittelten Exozytose, die den Zusammenbau des SNARE-Komplexes erfordern. Die SNARE-Maschinerie steuert die Interaktion zwischen vesikulären v-SNAREs und Ziel-t-SNAREs während der Vesikelfusion. (B-D) Mehrere Komponenten der SNARE-Maschinerie durchlaufen ein alternatives Spleißen, einschließlich Synaptosom-assoziiertes Protein-25 (SNAP25) (B), Syntaxin-3 (STX3) (C) und Vesikel-assoziiertes Membranprotein-7 (VAMP7) (D). CELF, CUGBP Elav-ähnliches Familienmitglied-1 LD, Longin-Domäne SM, SNARE-Motiv TM, Transmembrandomäne.

Alternatives Spleißen von SNARE-verwandten Proteinen. (A) Schritte der vesikelvermittelten Exozytose, die den Zusammenbau des SNARE-Komplexes erfordern. Die SNARE-Maschinerie steuert die Interaktion zwischen vesikulären v-SNAREs und Ziel-t-SNAREs während der Vesikelfusion. (B-D) Mehrere Komponenten der SNARE-Maschinerie werden einem alternativen Spleißen unterzogen, darunter Synaptosom-assoziiertes Protein-25 (SNAP25) (B), Syntaxin-3 (STX3) (C) und Vesikel-assoziiertes Membranprotein-7 (VAMP7) (D). CELF, CUGBP Elav-ähnliches Familienmitglied-1 LD, Longin-Domäne SM, SNARE-Motiv TM, Transmembrandomäne.

SNAPs

Synaptosom-assoziiertes Protein-25 (SNAP25) verbindet während der Exozytose synaptische Vesikel mit der Plasmamembran. Bei höheren Wirbeltieren führen zwei sich gegenseitig ausschließende Exons, 5a und 5b, zu den SNAP25-a- und SNAP25-b-Isoformen (Bark und Wilson, 1994) (Fig. 3B). Diese Varianten unterscheiden sich durch neun zentral lokalisierte Reste, von denen zwei die relative Positionierung von Cluster-Cysteinen verändern, deren Palmitoylierung die Membranverankerung steuert (Vogel und Roche, 1999). Snap25 Null-Mäuse weisen Defekte in geprimten Vesikelpools und eine schnelle durch Calcium ausgelöste Freisetzung in chromaffinen Zellen auf. Hier führt die Reexpression von SNAP25-b zu größeren Pools geprimter Vesikel im Vergleich zu denen, die bei der Reexpression von SNAP25-a beobachtet werden, was darauf hindeutet, dass alternatives Spleißen die Fähigkeit von SNAP25 reguliert, geprimte Vesikel zu stabilisieren (Sørensen et al., 2003). Im Gehirn tritt ein Entwicklungswechsel von der fetalen SNAP25-a-Isoform zu adultem SNAP25-b auf (Bark et al., 1995), und seine Beeinträchtigung induziert bei Mäusen drei bis fünf Wochen nach der Geburt Letalität (Bark et al., 2004). Die ausschließliche Expression der SNAP25-a-Isoform durch den Ersatz von Exon 5b durch eine Kopie von Exon 5a führt zu Entwicklungsdefekten, spontanen Krampfanfällen, beeinträchtigter kurzfristiger synaptischer Plastizität, morphologischen Veränderungen im adulten Hippocampus, Veränderungen der Neuropeptidexpression und Beeinträchtigung des räumlichen Lernens (Johansson et al., 2008). Darüber hinaus entwickeln diese Mäuse bei einer fettreichen Ernährung ein metabolisches Syndrom mit Gewichtszunahme, wodurch der neuronale Defekt in der Exozytosemaschinerie mit Dyslipidämie und gestörter Glukosehomöostase in Verbindung gebracht wird (Valladolid-Acebes et al., 2015). Ein Mangel der SNAP25-b-Isoform in endokrinen β-Zellen erhöht die Insulinsekretion und verändert die Calciumdynamik (Daraio et al., 2017). Kürzlich haben Hippocampus-Lysate gezeigt, dass SNAP25-a weniger effizient ist als SNAP25-b bei der Komplexbildung mit Munc18-1 und den Gβ1- und Gβ2-Untereinheiten von heterotrimeren G-Proteinen. Da diese Wechselwirkungen eine wichtige Rolle bei der präsynaptischen Hemmung spielen, deuten die Ergebnisse auf eine weniger hemmende Rolle von SNAP25-a hin (Daraio et al., 2018).

SNAP23 ist ein fast ubiquitär exprimiertes SNAP25-Homolog, das an der Insulinsensitivität (Boström et al., 2007), Lipid-Raft-Wirkungen (Puri und Roche, 2006 Yoon et al., 2016) und der endothelialen Exocytose des von Willebrand . beteiligt ist Faktor (Zhu et al., 2015). Der Mensch SNAP23 Gen enthält acht Exons und verschiedene Spleiß-Isoformen wurden berichtet, zum Beispiel unterscheidet sich SNAP23-a von SNAP23-b in 53 Resten, die von Exon 6 kodiert werden (Mollinedo und Lazo, 1997). Diese Region enthält Stellen für die posttranslationale Fettsäureacylierung, was auf Unterschiede in der Membranwechselwirkung zwischen den Isoformen schließen lässt. In vitrobinden beide Isoformen an Syntaxin-6 (STX6), aber SNAP23-b hat anscheinend eine höhere Affinität (Lazo et al., 2001). Außerdem fehlen der SNAP23-c-Variante die Exons 5 bis 7, was zu einem verkürzten Protein mit 50 Resten führt. Einer anderen Isoform, SNAP23-d, fehlen die Exons 6 und 7, und hier verändert eine Rasterverschiebung den C-Terminus des Proteins. Der SNAP23-e-Isoform fehlen auch die Exons 6 und 7, aber sie verwendet eine alternative 5'-Spleißstelle innerhalb von Exon 8 und teilt die gleichen letzten acht Reste wie SNAP23-a und SNAP23-b (Shukla et al., 2001). Alle Isoformen außer SNAP23-c enthalten die Cystein-reiche Domäne, die palmitoyliert ist. Transfiziertes SNAP23-a und SNAP23-b lokalisieren hauptsächlich an der Plasmamembran, während die anderen Isoformen auch intrazelluläre Lokalisationen aufweisen (Shukla et al., 2001).

Syntaxinen

Im Gehirn wird das alternative Spleißen von Syntaxinen durch die CUGBP Elav-like Family (CELF) von RBPs reguliert. In Caenorhabditis elegans, fördert das CELF-Homolog UNC-75 die Expression der neuronalen Syntaxin-Isoform UNC-64A, die Exon 8a enthält, und reprimiert die nicht-neuronale Variante UNC-64B, die Exon 8b enthält. Diese Isoformen unterscheiden sich in ihren C-terminalen hydrophoben Membranankern (Ogawa et al., 1998 Saifee et al., 1998). Die Mutanten fehlen unc-75 exprimieren nur UNC-64B und zeigen Axon-Regenerations- und Bewegungsdefekte, die denen ähnlich sind, die in beobachtet wurden unc-64 Mutanten mit Funktionsverlust. Während die Überexpression von entweder UNC-64A- oder UNC-64B-Isoformen Defekte der Axonregeneration rettet, rettet nur UNC-64A Bewegungsdefekte (Chen et al., 2016 Norris et al., 2014). CELF-Proteine ​​steuern auch die Axonregeneration bei Nagetieren. Die Celf2-Knockout-Maus weist Axon-Regenerationsdefekte und Fehlspleißen mehrerer Syntaxine (Stx1a, Stx2, Stx16 und Stx18) und Syntaxin-bindender Proteine ​​(Stxbp1, Stxbp2 und Stxbp5) auf, was darauf hindeutet, dass das CELF-regulierte Spleißen von Syntaxinen ein evolutionär konservierter Mechanismus ist bei der Axonregeneration (Chen et al., 2016 Norris et al., 2014).

STX3 wird in Milz, Lunge, Niere, Netzhaut und Gehirn stark exprimiert und spielt beim Vesikelhandel eine Rolle. Die Maus Stx3 Das Gen enthält mehrere sich gegenseitig ausschließende Exons: 3ab und 3c, 9a und 9b, 10a und 10b sowie 11a und 11b, wodurch vier Spleißvarianten (gezeigt in Abb. 3C) erzeugt werden, die sich in ihrer Domänenorganisation und biochemischen Eigenschaften unterscheiden (Ibaraki et al., 1995). STX3-A und STX3-B teilen sich die n-Terminus, unterscheiden sich jedoch in der zweiten Hälfte der SNARE-Domäne und der C-terminalen Transmembrandomäne. In STX3-D führt der Einschluss der beiden Exons 3ab und 3c ein vorzeitiges Stoppcodon ein und produziert somit ein verkürztes Protein (Curtis et al., 2008). STX3-A ist die einzige in der Niere nachgewiesene Isoform mit vorgeschlagenen Funktionen beim Transport von Epithelzellmembranen, während STX3-B die exklusive Variante ist, die in retinalen Bandsynapsen gefunden wird (Curtis et al., 2008), wo sie für die Exozytose der synaptischen Vesikel benötigt wird ( Curtis et al., 2010). Kürzlich hat eine Translationsstudie an Netzhautzellen von Mäusen gezeigt, dass Axone und Soma unterschiedliche letzte Exons in der Stx3 Gen, was zu Unterschieden im C-Terminus der kodierten STX3-Proteine ​​und der 3′UTR führt. Insbesondere reicht das axonspezifische Exon aus, um die axonale mRNA-Translation zu fördern, was Hinweise auf einen möglichen Mechanismus liefert, der der selektiven und dynamischen mRNA-Translation in Axonen zugrunde liegt (Shigeoka et al., 2016).

VAMPs

Menschlich VAMP7 (früher bekannt als SYBL1) kodiert für das v-SNARE-Protein VAMP7, das den intrazellulären Verkehr steuert (Galli et al., 1998). In der VAMP7-a-Isoform voller Länge kodieren die Exons 2 bis 4 die N-terminale Longin-Domäne, die die Membranfusion und das Neuritenwachstum negativ reguliert (Martinez-Arca et al., 2000, 2001), während die Exons 5 bis 8 die Transmembranregion und das SNARE-Motiv (Fig. 3D). Das Überspringen von Exon 3 und die Verwendung einer alternativen 5'-Spleißstelle in Exon 2 führen zu den verkürzten Proteinen VAMP7-d bzw. VAMP7-h (Vacca et al., 2011). VAMP7-c verwendet die gleiche 5'-Spleißstelle in Exon 2 wie VAMP7-h, aber es fehlt Exon 3. Somit fehlen VAMP7-c im Vergleich zu VAMP7-a 40 Reste innerhalb der Longin-Domäne, wodurch die Interaktion mit dem Adapter verloren geht Protein AP3 und sein Targeting auf späte Endosomen (Martinez-Arca et al., 2003). Das Spleißen der Exons 5 und 6 erzeugt drei zusätzliche Isoformen mit intakten Longin-Domänen, aber veränderten SNARE-Domänen. VAMP7-b fehlt Exon 6 und hat somit einen anderen C-Terminus als VAMP7-a. In VAMP7-i führt das Überspringen von Exon 5 ein vorzeitiges Stop-Codon ein und somit wird nur die Longin-Domäne exprimiert. In VAMP7-j behält das Überspringen beider Exons den ursprünglichen Leserahmen bei, daher enthält VAMP7-j zusätzlich zur Longin-Domäne eine kurze Hinge-Region und die ursprünglichen Transmembran- und intravesikulären Schwanzregionen (Vacca et al., 2011) (Abb. 3D). Die verschiedenen VAMP7-Isoformen weisen unterschiedliche subzelluläre und Gewebelokalisationen auf. VAMP7-b ist weit verbreitet, während VAMP7-i die einzige nukleäre Isoform ist. Darüber hinaus ist VAMP7-a die Hauptisoform in den meisten Geweben, während andere Varianten eine gewisse Gewebespezifität aufweisen (Vacca et al., 2011).

Basierend auf allen oben diskutierten Studien ist klar, dass alternatives Spleißen verschiedene Mitglieder der SNARE-Maschinerie reguliert und so zur Kontrolle der Exozytose beiträgt.


Lösliche vs. membrangebundene Immunglobuline

Immunglobuline treten in zwei Hauptformen auf: lösliche Antikörper und membrangebundene Antikörper. (Letztere enthalten eine hydrophobe Transmembranregion.) Alternatives Spleißen reguliert die Produktion von sezernierten Antikörpern und oberflächengebundenen B-Zell-Rezeptoren in B-Zellen.

Membrangebundene Immunglobuline sind nicht-kovalent mit zwei akzessorischen Peptiden assoziiert und bilden den B-Zell-Antigen-Rezeptor-Komplex. Die ersten von B-Zellen exprimierten Antigenrezeptoren sind IgM und IgD. Der Rezeptor ist ein Prototyp des Antikörpers, für dessen Produktion die B-Zelle vorbereitet wird. Der B-Zell-Rezeptor (BCR) kann nur Antigene binden. Es ist das Heterodimer von Ig alpha und Ig beta, das es der Zelle ermöglicht, das Signal zu übertragen und auf das Vorhandensein von Antigenen auf der Zelloberfläche zu reagieren. Das erzeugte Signal bewirkt das Wachstum und die Proliferation der B-Zelle und die Antikörperproduktion innerhalb der Plasmazelle.

Mehr erfahren


Verständnis der physiologischen Rolle von Rauschen bei der RNA-Verarbeitung

Um eine mögliche funktionelle Rolle der Variabilität (stochastisch oder anderweitig) in der RNA-Sequenz zu verstehen, ist ein möglicher Ausgangspunkt die Bewertung der Proteinprodukte. Die These von „ein Gen, mehrere Proteine“ wurde in den frühen Tagen kurz nach der Entdeckung des alternativen Spleißens begründet. Es wird jedoch diskutiert, inwieweit alternatives Spleißen das Proteinreservoir verändern kann. Natürlich gibt es zahlreiche Beispiele, die zeigen, dass funktionell unterschiedliche Proteine ​​aus alternativen Spleiß-Isoformen erzeugt werden. In jüngerer Zeit wurde mithilfe von Ribosomen-Profiling gezeigt, dass mehr als 75% der alternativen Kassetten-Exons mit mittlerer bis hoher Häufigkeit von Ribosomen besetzt sind [101]. Über 60 % dieser Kassetten-Exons bewahren den Leserahmen, in Übereinstimmung mit der Beobachtung, dass kurze, rahmenerhaltende Kassetten-Exons evolutionär bevorzugter sind [102]. Eine entgegengesetzte Ansicht ist, dass, obwohl Tausende von alternativen Spleiß-Isoformen durch RNA-seq identifiziert werden, nur ein kleiner Teil von ihnen durch Massenspektrometrie in großem Maßstab identifiziert wird [103]. In den frühen Tagen von GENCODE haben Tress et al. [104] untersuchten die begrenzte Anzahl von berichteten alternativen Spleißereignissen. Sie kamen zu dem Schluss, dass viele alternative gespleißte Transkripte, wenn sie translatiert werden, die Struktur und Funktion der Proteinprodukte drastisch verändern würden. Dennoch ist es schwer vorherzusagen, welche Proteinstruktur aus einigen Isoformen resultieren würde oder ob die Sequenz zu einem instabilen Faltungsstatus führen würde [104]. Die Folgestudie, die auf einer groß angelegten Datenbankanalyse der humanen Proteomik basiert, legt nahe, dass die am höchsten exprimierten Gene eine dominante Isoform aufweisen [105]. Aufgrund der begrenzten Sensitivität der auf Massenspektrometrie basierenden Proteomik wissen wir jedoch immer noch nicht, welcher Anteil alternativer Spleißisoformen zu funktionellen Proteinen führt.

Haben sich biologische Systeme entwickelt, um Spleißgeräusche zu unterdrücken? Hat sich das System alternativ weiterentwickelt, um dieses Rauschen auszunutzen? Der häufigste geräuschreduzierende Regulierungsmechanismus ist die negative Rückkopplung. RNA-Qualitätskontrollsysteme wie Nonsense-Mediated Decay (NMD), Nonstop-Zerfall (NSD) und No-Go-Zerfall (NGD) haben sich entwickelt, um Fehler bei der RNA-Verarbeitung zu mindern [106]. Neben der negativen Rückkopplung spielt auch das kinetische Korrekturlesen eine Rolle bei der Dämpfung von Spleißgeräuschen [107, 108]. Auf der anderen Seite wurde vorgeschlagen, dass lautes Spleißen zu Populationsheterogenität führt und für die Neurogenese [109, 110], die angeborene Immunität [111] und die Evolution [112, 113] von wesentlicher Bedeutung sein könnte. Bemerkenswerterweise haben neuere Arbeiten auch eine globale Veränderung des Spleißens bei Krebserkrankungen gezeigt, die Mutationen in spleißosomalen Kernuntereinheiten wie U2AF1 und SF3B1 beinhalten [114]. Intensive Sequenzierungsbemühungen von Patientenproben argumentierten, dass die Spleißveränderungen bei diesen Patienten gering und sehr variabel sind [115, 116, 117]. Bis heute war es schwierig, entweder den Krebsphänotyp oder die Prognose auf Isoformveränderungen zurückzuführen, die einen bestimmten Satz von Genen betreffen. Krebs ist eine evolutionäre Krankheit und diese spliceosomalen Mutationen treten oft in einem frühen Stadium auf [118,119,120]. Eine Möglichkeit könnte sein, dass die Mutationen in spleißosomalen Proteinen als Verstärker des Spleißrauschens fungieren, wie es für Spleißveränderungen bei anderen Krankheitszuständen vorgeschlagen wurde [121]. Isoformen mit geringer Häufigkeit, die durch Spleißgeräusche erzeugt werden, könnten eine evolutionäre Erprobung der neuen Variante ermöglichen und die Tumorprogression auf heterogene Weise fördern.


Der Spleißcode

Die Art und Weise, wie RNA-Spleiße auftreten, ist wie bei anderen regulatorischen Prozessen immer komplexer geworden. Zunächst wurden die oben genannten einfachen Modi als üblich angesehen. Die Forschung zeigt nun, dass es Hunderte von Merkmalen von RNA-Strukturen und regulatorischen Partikeln gibt, bei denen es sich um Protein oder microRNA handeln kann, die bestimmen, wie diese alternativen Spleiße auftreten.

Früher dachte man beispielsweise, dass die Codes an den Rändern des Introns am relevantesten sind. Nun scheint es, dass Strukturen tief im Intron abseits des Schnitts durchaus relevant sein können. Es gibt dramatische Unterschiede beim Spleißen, das während der verschiedenen Phasen der Embryonalentwicklung ausgelöst wird. Viele Unterschiede treten zwischen verschiedenen Arten von Gewebezellen auf. Andere Faktoren, die Spleißmuster beeinflussen, umfassen Transkriptionsraten, Kern-Spleiß-Maschinerie-Niveaus, Konkurrenz zwischen Spleißstellen, Chromatinstruktur, die die Transkriptionsrate beeinflusst, Histonmodifikationen und lokale Chromatinmodifikationen.

Neuere Artikel, in denen versucht wurde, einen Spleißcode zu definieren, haben herausgefunden, dass die Regulierung dieser vielen verschiedenen Variablen DNA-Richtungen in der Größe vieler zusätzlicher Genome einschlagen könnte. Es hat sich gezeigt, dass in vielen Fällen des Spleißens mehrere Schritte erforderlich sind, was die Angelegenheit viel komplexer macht.

Die Zahl der Variablen ist mittlerweile so groß, dass sie zu einem weiteren großen Rechenproblem geworden ist, ähnlich dem Faltungsproblem des Proteins und der Genomregulation in ENCODE. Bitte lesen Sie den Beitrag zur Proteinfaltung, in dem festgestellt wurde, dass es bei einer Milliarde Faltungen pro Sekunde zehn Milliarden Jahre dauern würde, um alle möglichen Faltungen eines durchschnittlich großen Proteins auszuprobieren.


ERGEBNISSE

Datensatz-Assembly

Um den Mechanismus der AA-Selektion besser zu verstehen, haben wir evolutionär konservierte AA-Paare in Abständen von 3 bis 100 nt analysiert. Dazu gehören alle Ereignisse, bei denen sowohl das proximale (stromaufwärts) 3′SS als auch ein distales (stromabwärts gelegenes) 3′SS offensichtlich sowohl im menschlichen als auch im Mausgenom am Spleißen beteiligt sind, basierend auf der Existenz von EST- und mRNA-Transkripten in beiden Spezies ( 1). Die Zahl der konservierten AS-Ereignisse stellt eine untere Grenze der AS-Ereignisse beim Menschen dar, dennoch wird eine biologische Signifikanz erwartet ( 34). Es wird allgemein akzeptiert, dass zwei mutmaßliche Spleißakzeptoren, die sich in unmittelbarer Nähe befinden, stark kompetitiv sind (6, 7, 9). Um die Abhängigkeit zwischen der Position der mutmaßlichen Spleißstelle und der Auswahl der Spleißstelle zu testen, haben wir die Daten entsprechend dem Abstand zwischen den Spleißstellenpaaren in vier separate Sätze unterteilt. Die Gruppen wurden bezeichnet: FAR, MID, CLOSE und NAGNAG. Die Gruppen FAR, MID und CLOSE bestanden aus AA-Paaren, die durch 40–100, 13–39 bzw. 4–12 nt getrennt waren. Die NAGNAG-Gruppe umfasste nur AA-Paare, die im Tandem platziert wurden. Während wir in den CLOSE- und NAGNAG-Datensätzen erwarten, dass sowohl die AA stromabwärts des BP platziert werden, der sich im Allgemeinen zwischen 18 und 40 nt stromaufwärts der Spleißstelle befindet ( 6, 7, 9, 11), umfasste der FAR-Datensatz Sequenzen bei dem die erste Spleißstelle voraussichtlich stromaufwärts des BP liegt. Wie jedoch in Gooding . berichtet et al. (9), in einigen Fällen könnte der BP auch in der FAR-Gruppe stromaufwärts der proximalen Stelle liegen. Die Grenzfälle wurden im MID-Datensatz zusammengefasst. Darüber hinaus haben wir eine Reihe von Kontrollsätzen zusammengestellt, die konstitutive Akzeptoren (CA) enthalten, die von einem stromaufwärts liegenden potentiellen Konkurrenten oder Pseudoakzeptor (PA) durch einen AG-verarmten Abschnitt variabler Länge getrennt sind. Die Sequenzen für den Kontrollsatz wurden bewusst so gewählt, dass die Verteilung der Distanzen zwischen CA und PA in den Kontrollsätzen der des entsprechenden Alternativdatensatzes entspricht.

Die einzigartigen Eigenschaften von AAs

Um die AA-Paare zu untersuchen und sie mit konstitutiv ausgewählten 3′SS zu vergleichen, haben wir eine Reihe von intronischen Eigenschaften analysiert, die für jede Gruppe berechnet wurden. Zu den von uns eingeschlossenen Merkmalen gehörten die Stärke der Spleißstelle, die evolutionäre Erhaltung der Intronik (ohne die Spleißstellen), die Länge und der Score des PPT und seine Position relativ zu den Spleißstellen, der BP-Score und der Abstand zu den Spleißstellen, GC-Gehalt, ESE/ESS Dichte und das Vorkommen anderer AGs-Dinukleotide (siehe Abschnitt Methoden). Es wurde zuvor festgestellt, dass letztere die Erkennung der Spleißstellen beeinflussen, wenn sie in stromaufwärts gelegenen intronischen Regionen auftreten (7, 8). Da in den meisten Fällen [mit Ausnahme der Klasse der distalen BPs (9)] die regulatorischen Spleißelemente nahe am 3′SS liegen, beschränkten wir die Analyse auf 100 nt stromaufwärts der proximalen Stelle.

Die obigen Eigenschaften wurden für alle Sequenzen in jeder AA-Untergruppe berechnet und mit der entsprechenden Untergruppe von CA/PA-Paaren verglichen. Im Fall der NAGNAG-Gruppe wurden Vergleiche mit zwei unabhängigen Sätzen von CA/PA-Paaren durchgeführt: NAGNAG-Motive, bei denen die distale Stelle konstitutiv gespleißt ist und die proximale ein kompetitiver Pseudoakzeptor (NAGNAG-distal) ist, und der umgekehrte Fall, bei dem die Die proximale Stelle ist konstitutiv gespleißt und das distale NAG dient als Pseudoakzeptor (NAGNAG-proximal). Obwohl kompetitive Stellen im Allgemeinen stromaufwärts der Spleißstelle platziert sind ( 6, 7), entschieden wir uns im einzigartigen Fall von NAGNAG, die beiden Kontrollsätze zu testen, da zuvor angenommen wurde, dass sowohl die distale als auch die proximale Stelle bei Tandemakzeptoren zu der Wettbewerb. Darüber hinaus sind diese NAGNAG-Motive von besonderem Interesse, da sie im gesamten menschlichen Genom weit verbreitet sind (10, 14).

Für jede der analysierten Eigenschaften haben wir eine statistische Analyse durchgeführt, die auf alle Datensatzpaare (AA vs. CA/PA) angewendet wurde. Eine Zusammenfassung der statistischen Analyse ist in Tabelle 1 angegeben (detaillierte Ergebnisse sind in Tabelle 1S angegeben). Interessanterweise fanden wir in jeder Untergruppe (definiert durch den Abstand der Spleißstelle) einen anderen Satz von Merkmalen, die zwischen den AA- und CA/PA-Paaren abwichen. Zum Beispiel waren die Merkmale der Spleißstelle nur in der NAGNAG-Gruppe diskriminierend, sowohl beim Vergleich mit dem NAGNAG-proximalen als auch dem NAGNAG-distalen (Tabelle 1SA und B). Dies stimmt mit früheren Studien überein, die eine Korrelation zwischen der Stärke der Spleißstelle und dem Spleißmuster am NAGNAG-Motiv beobachteten (10, 13). Darüber hinaus war in Übereinstimmung mit unseren früheren Ergebnissen (10) die intronische Konservierung in den 100 nt stromaufwärts der proximalen Spleißstelle bei alternativen NAGNAGs im Vergleich zur NAGNAG-proximalen Gruppe signifikant höher (P-Wert für F-test = 4.E−04). Interessanterweise schien sich die Intronerhaltung beim Vergleich alternativer NAGNAGs mit der NAGNAG-distalen Gruppe nicht signifikant zu unterscheiden. Die letztgenannten Gruppen zeigen beide eine hohe intronische Konservierung, was auf ähnliche regulatorische Beschränkungen schließen lässt (10). Darüber hinaus beobachteten wir einen signifikanten Unterschied im GC-Gehalt zwischen alternativen NAGNAGs und der NAGNAG-distalen Gruppe. Überraschenderweise war der hohe GC-Gehalt in der NAGNAG-distalen Gruppe höher als der durchschnittliche GC-Gehalt, der im Allgemeinen stromaufwärts von konstitutiven Akzeptorstellen gefunden wurde (Tabelle 1S).

P-Werte für Student's T- und F-Tests zum Vergleich alternativer Akzeptoren mit konstitutiven/Pseudo-Akzeptoren basierend auf den folgenden Merkmalen: distale Spleißstellen (Dist SS), proximale Spleißstellen (Prox SS), durchschnittliche Intron-Konservierung in 100 nt stromaufwärts der proximalen Spleißstelle (IC .)100), PPT-Länge, PPT-Score, Abstand des PPT von der distalen Stelle (PPT∼D) und der proximalen Stelle (PPT∼P), ESE/ESS-Dichte, Pseudo-HAG-Stellen und GC-Gehalt

Besonderheit . NAGNAG-P . NAGNAG-D . NAH DRAN . MITT. WEIT .
. . . . . .
. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val.
Dist SS 2.E−160.215 1.E−092.E−160.371 0.183 0.321 0.005 0.003 0.049
Prox SS 2.E−061.E−070.236 0.026 0.730 0.241 0.083 0.169 0.063 0.260
NS1004.E−040.144 0.007 0.037 0.013 0.435 2.E−100.373 3.E−060.465
PPT-Länge 0.226 0.344 0.996 0.030 0.823 0.004 0.001 2.E14 0.061 2.E10
PPT-Ergebnis 0.525 0.748 0.211 0.199 0.012 6.E−134.E−088.E−073.E−073.E10
PPT∼D 0.054 0.233 0.901 0.516 5.E−090.002 0.854 0.038 1.E−050.161
PPT∼P n / A n / A n / A n / A 1.E−060.007 0.986 0.055 0.023 0.001
BP-Wert 0.525 0.748 0.2388 0.2338 0.289 0.539 0.4418 0.239 0.4564 0.550
BP∼D 0.054 0.233 0.6724 0.9282 8.88E−070.017 0.002 0.154 1.30E−050.021
BP∼P n / A n / A n / A n / A 2.90E04 0.031 1.22E−040.143 0.005 2.85E−04
ESE 0.042 0.020 0.850 0.812 0.708 0.618 0.031 0.331 0.042 0.020
ESS.hex2 0.873 0.252 0.582 0.948 0.721 0.186 0.064 0.157 0.176 0.135
ESS.hex3 0.350 0.023 0.710 0.779 0.985 0.170 0.606 0.112 0.324 0.428
HEXE 0.888 0.561 0.601 0.023 0.023 0.723 2.E−040.490 1.E−040.868
GC 0.265 0.512 1.E−040.714 2.E−040.711 0.044 0.999 0.149 0.312
Besonderheit . NAGNAG-P . NAGNAG-D . NAH DRAN . MITT. WEIT .
. . . . . .
. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val.
Dist SS 2.E−160.215 1.E−092.E−160.371 0.183 0.321 0.005 0.003 0.049
Prox SS 2.E−061.E−070.236 0.026 0.730 0.241 0.083 0.169 0.063 0.260
NS1004.E−040.144 0.007 0.037 0.013 0.435 2.E−100.373 3.E−060.465
PPT-Länge 0.226 0.344 0.996 0.030 0.823 0.004 0.001 2.E14 0.061 2.E10
PPT-Ergebnis 0.525 0.748 0.211 0.199 0.012 6.E−134.E−088.E−073.E−073.E10
PPT∼D 0.054 0.233 0.901 0.516 5.E−090.002 0.854 0.038 1.E−050.161
PPT∼P n / A n / A n / A n / A 1.E−060.007 0.986 0.055 0.023 0.001
BP-Wert 0.525 0.748 0.2388 0.2338 0.289 0.539 0.4418 0.239 0.4564 0.550
BP∼D 0.054 0.233 0.6724 0.9282 8.88E−070.017 0.002 0.154 1.30E−050.021
BP∼P n / A n / A n / A n / A 2.90E04 0.031 1.22E−040.143 0.005 2.85E−04
ESE 0.042 0.020 0.850 0.812 0.708 0.618 0.031 0.331 0.042 0.020
ESS.hex2 0.873 0.252 0.582 0.948 0.721 0.186 0.064 0.157 0.176 0.135
ESS.hex3 0.350 0.023 0.710 0.779 0.985 0.170 0.606 0.112 0.324 0.428
HEXE 0.888 0.561 0.601 0.023 0.023 0.723 2.E−040.490 1.E−040.868
GC 0.265 0.512 1.E−040.714 2.E−040.711 0.044 0.999 0.149 0.312

Die Ergebnisse werden für die verschiedenen Datensätze gezeigt: FAR, MID, CLOSE, NAGNAG-proximal und NAGNAG-distal. Signifikante Werte (basierend auf Westfall-Young-Korrektur) sind fett gedruckt.

P-Werte für Student's T- und F-Tests zum Vergleich alternativer Akzeptoren mit konstitutiven/Pseudo-Akzeptoren basierend auf den folgenden Merkmalen: distale Spleißstellen (Dist SS), proximale Spleißstellen (Prox SS), durchschnittliche Intron-Konservierung in 100 nt stromaufwärts der proximalen Spleißstelle (IC .)100), PPT-Länge, PPT-Score, Abstand des PPT von der distalen Stelle (PPT∼D) und der proximalen Stelle (PPT∼P), ESE/ESS-Dichte, Pseudo-HAG-Stellen und GC-Gehalt

Besonderheit . NAGNAG-P . NAGNAG-D . NAH DRAN . MITT. WEIT .
. . . . . .
. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val.
Dist SS 2.E−160.215 1.E−092.E−160.371 0.183 0.321 0.005 0.003 0.049
Prox SS 2.E−061.E−070.236 0.026 0.730 0.241 0.083 0.169 0.063 0.260
NS1004.E−040.144 0.007 0.037 0.013 0.435 2.E−100.373 3.E−060.465
PPT-Länge 0.226 0.344 0.996 0.030 0.823 0.004 0.001 2.E14 0.061 2.E10
PPT-Ergebnis 0.525 0.748 0.211 0.199 0.012 6.E−134.E−088.E−073.E−073.E10
PPT∼D 0.054 0.233 0.901 0.516 5.E−090.002 0.854 0.038 1.E−050.161
PPT∼P n / A n / A n / A n / A 1.E−060.007 0.986 0.055 0.023 0.001
BP-Wert 0.525 0.748 0.2388 0.2338 0.289 0.539 0.4418 0.239 0.4564 0.550
BP∼D 0.054 0.233 0.6724 0.9282 8.88E−070.017 0.002 0.154 1.30E−050.021
BP∼P n / A n / A n / A n / A 2.90E04 0.031 1.22E−040.143 0.005 2.85E−04
ESE 0.042 0.020 0.850 0.812 0.708 0.618 0.031 0.331 0.042 0.020
ESS.hex2 0.873 0.252 0.582 0.948 0.721 0.186 0.064 0.157 0.176 0.135
ESS.hex3 0.350 0.023 0.710 0.779 0.985 0.170 0.606 0.112 0.324 0.428
HEXE 0.888 0.561 0.601 0.023 0.023 0.723 2.E−040.490 1.E−040.868
GC 0.265 0.512 1.E−040.714 2.E−040.711 0.044 0.999 0.149 0.312
Besonderheit . NAGNAG-P . NAGNAG-D . NAH DRAN . MITT. WEIT .
. . . . . .
. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val. t P-val. F P-val.
Dist SS 2.E−160.215 1.E−092.E−160.371 0.183 0.321 0.005 0.003 0.049
Prox SS 2.E−061.E−070.236 0.026 0.730 0.241 0.083 0.169 0.063 0.260
NS1004.E−040.144 0.007 0.037 0.013 0.435 2.E−100.373 3.E−060.465
PPT-Länge 0.226 0.344 0.996 0.030 0.823 0.004 0.001 2.E14 0.061 2.E10
PPT-Ergebnis 0.525 0.748 0.211 0.199 0.012 6.E−134.E−088.E−073.E−073.E10
PPT∼D 0.054 0.233 0.901 0.516 5.E−090.002 0.854 0.038 1.E−050.161
PPT∼P n / A n / A n / A n / A 1.E−060.007 0.986 0.055 0.023 0.001
BP-Wert 0.525 0.748 0.2388 0.2338 0.289 0.539 0.4418 0.239 0.4564 0.550
BP∼D 0.054 0.233 0.6724 0.9282 8.88E−070.017 0.002 0.154 1.30E−050.021
BP∼P n / A n / A n / A n / A 2.90E04 0.031 1.22E−040.143 0.005 2.85E−04
ESE 0.042 0.020 0.850 0.812 0.708 0.618 0.031 0.331 0.042 0.020
ESS.hex2 0.873 0.252 0.582 0.948 0.721 0.186 0.064 0.157 0.176 0.135
ESS.hex3 0.350 0.023 0.710 0.779 0.985 0.170 0.606 0.112 0.324 0.428
HEXE 0.888 0.561 0.601 0.023 0.023 0.723 2.E−040.490 1.E−040.868
GC 0.265 0.512 1.E−040.714 2.E−040.711 0.044 0.999 0.149 0.312

Die Ergebnisse werden für die verschiedenen Datensätze gezeigt: FAR, MID, CLOSE, NAGNAG-proximal und NAGNAG-distal. Signifikante Werte (basierend auf der Westfall-Young-Korrektur) sind fett markiert.

Dennoch waren in der CLOSE-Gruppe, in der die Spleißstellen sehr nahe beieinander, aber nicht benachbart sind (Tabelle 1SC), die Merkmale, die sich zwischen AA- und CA/PA-Paaren signifikant unterschieden, der Abstand von PPT und BP zu den Spleißstellen und der PPT-Score (der in der CLOSE-Gruppe statistisch signifikant war, wenn die F Prüfung). Im Allgemeinen erschienen PPT und BP bei AA-Paaren näher sowohl an den proximalen als auch an den distalen Stellen, und der PPT zeigte eine größere Varianz der Scores. Wie in der NAGNAG-distalen Gruppe beobachteten wir auch in der CLOSE-Gruppe einen relativ geringeren GC-Gehalt stromaufwärts der AA-Paare. Im Gegensatz zur NAGNAG-Gruppe beobachteten wir in der CLOSE-Gruppe weder in der Zusammensetzung der Spleißstelle noch in der Intron-Konservierung zwischen AA- und CA/PA-Paaren signifikante Unterschiede. In der MID-Gruppe beobachteten wir schwächere PPTs (d. h. niedrigere PPT-Werte) bei AA im Vergleich zu CA/PA-Paaren. Außerdem waren die Konservierungsniveaus der Introns stromaufwärts der AA-Paare höher und die AG-Dinukleotide waren leicht unterrepräsentiert (Tabelle 1S D). Zu den am stärksten unterscheidenden Merkmalen in der FAR-Gruppe gehörten der Score und die relative Position von PPT und BP. Diese erwiesen sich in AA-Paaren als schwächer und weiter von der distalen Spleißstelle entfernt. Außerdem war die Intronerhaltung bei AA-Paaren signifikant höher und das Auftreten von intronischen AGs war unterrepräsentiert.

Insgesamt legen unsere Ergebnisse nahe, dass nur dann, wenn die beiden Spleißstellen hintereinander angeordnet sind (NAGNAG), die Spleißstellenzusammensetzung, nämlich die Identität des Nukleotids, das der konservierten AG vorangeht, diskriminierend zu sein schien.Wenn dagegen der Abstand zwischen den Spleißstellen größer ist, scheinen Unterschiede in der PPT-Zusammensetzung und der relativen Lage von PPT und BP zu den Spleißstellen eine wichtige Rolle zu spielen. Konsequenterweise schien das Niveau der intronischen Konservierung in den MID- und FAR-Gruppen diskriminierend zu sein, in denen der AA-Abstand >12 nt beträgt (Tabelle 1S, Abbildung 1). Es ist jedoch wichtig anzumerken, dass in der einzigartigen Gruppe der NAGNAG-Akzeptoren auch die Intron-Konservierung statistisch signifikant (wenn auch in geringerem Maße) nur beim Vergleich von Tandem-Akzeptoren mit der proximalen NAGNAG-Gruppe und nicht im Vergleich zu die distale Gruppe. Ebenso beobachteten wir, dass die intronische evolutionäre Konservierung in der CLOSE-Gruppe für AA-Paare relativ hoch (wenn auch nicht statistisch signifikant) ist, verglichen mit der durchschnittlichen intronischen Konservierung stromaufwärts zufällig ausgewählter konstitutiver Spleißstellen (Abbildung 1A). Eine relativ hohe Intron-Konservierung wurde auch in den CA/PA-Paaren nur in der nahen Region neben der Pseudo-Spleißstelle nachgewiesen ( 1 ). Die im Allgemeinen stromaufwärts von alternativen Spleißstellen gefundenen hohen Intron-Konservierungsgrade stimmen mit anderen Studien überein, die auf die Existenz regulatorischer Elemente hinweisen, die an der Auswahl der Spleißstelle beteiligt sind (29). Nichtsdestotrotz könnte die relativ hohe Intron-Konservierung nahe der Spleißstelle bei CA/PA-Paaren, insbesondere in der CLOSE-Gruppe, auf das Vorhandensein von regulatorischen Elementen zurückzuführen sein, die bei der Kontrolle des konstitutiven Spleißens beteiligt sein können, wenn potenzielle Konkurrenten vorhanden sind. Es ist wichtig zu beachten, dass in unserem Datensatz die Pseudospleißstellen (PAs) selbst nicht evolutionär konserviert sind und daher die beobachtete höhere Intronenkonservierung nicht mit einer insgesamt hohen Erhaltung der Stelle oder einem Alignment-Artefakt in Verbindung gebracht werden kann.

Evolutionärer Naturschutz Mensch-Maus für das CLOSE (EIN) und WEIT (B) Gruppen. Die Konservierung wurde für 30 nt stromaufwärts der proximalen (oder Pseudo-) Spleißstelle in überlappenden Fenstern der Länge 10 berechnet. Graue Kreise stehen für alternative Akzeptor (AA)-Paare, schwarze Dreiecke für konstitutive/Pseudo-Akzeptor (CA/PA)-Paare und die graue Kreuze für einen Satz von 1000 zufällig ausgewählten konstitutiven Akzeptoren (CA). Für den CA-Satz wurde die Konservierung stromaufwärts der konstitutiven Spleißstelle berechnet.

Evolutionärer Naturschutz Mensch-Maus für das CLOSE (EIN) und WEIT (B) Gruppen. Die Konservierung wurde für 30 nt stromaufwärts der proximalen (oder Pseudo-) Spleißstelle in überlappenden Fenstern der Länge 10 berechnet. Graue Kreise stehen für alternative Akzeptor (AA)-Paare, schwarze Dreiecke für konstitutive/Pseudo-Akzeptor (CA/PA)-Paare und die graue Kreuze für einen Satz von 1000 zufällig ausgewählten konstitutiven Akzeptoren (CA). Für den CA-Satz wurde die Konservierung stromaufwärts der konstitutiven Spleißstelle berechnet.

PPT-Analyse

Der PPT ist ein Schlüsselmerkmal bei der Spleißregulierung. Zuvor wurde gezeigt, dass sowohl die Zusammensetzung als auch der Abstand des PPT die Auswahl der Spleißstelle beeinflussen können (19). Die PPT wird häufig durch Spleißfaktoren wie den Spleißrepressor PTB und den Spleißverstärker U2AF 65 identifiziert. Neuere Berichte zeigen, dass beide Faktoren miteinander um die Bindung des PPT konkurrieren können ( 35). Obwohl diese Proteine ​​als grundlegende Spleißfaktoren angesehen werden, wurde vorgeschlagen, dass sie auch eine wichtige Rolle bei der Regulierung alternativer 3'-Spleißstellen spielen ( 36). Wie im vorigen Abschnitt beschrieben, haben wir eine umfassende Analyse des PPT in AA- und CA/PA-Paaren in den verschiedenen Teilmengen durchgeführt. Abbildung 2A und B veranschaulichen die Beziehung zwischen den Abständen des PPT von der distalen Spleißstelle und dem Abstand zwischen der proximalen Spleißstelle und der distalen Spleißstelle in AA-Paaren bzw. in CA/PA-Paaren (in CA/PA-Paaren ist CA äquivalent zu distal und PA zu proximal). Jeder Punkt repräsentiert die Beziehung in einer Sequenz. Wenn der Abstand zwischen den proximalen und distalen Spleißstellen 3 (in der NAGNAG-Untergruppe) sowohl in alternativen als auch in konstitutiven Spleißstellen beträgt, wird, wie gezeigt, ein PPT irgendwo zwischen 0 und 90 nt stromaufwärts der Spleißstellen gefunden. Wenn die Spleißstellen jedoch nicht hintereinander liegen, wird in AA-Paaren die vorhergesagte PPT nur dann nahe der distalen Spleißstelle gefunden, wenn die Spleißstellen relativ nahe beieinander liegen, getrennt durch <40 nt ( 2A ). Dies hängt höchstwahrscheinlich mit der Abhängigkeit zwischen der proximalen Stelle und dem PPT in den AA-Paaren zusammen. Wie durch die entlang der Diagonale liegenden Punkte in Fig. 2A demonstriert, fällt bei der Mehrheit der AA-Paare die vorhergesagte PPT in unmittelbarer Nähe der proximalen Spleißstelle. In den CA/PA-Paaren (Abbildung 2B) konnten wir, obwohl wir einen großen Anteil von PPTs in der Nähe der distalen Stelle beobachten, keine klare Beziehung zwischen der Position des PPT und des PA feststellen. Um sicherzustellen, dass diese Ergebnisse nicht auf die kleinere Stichprobengröße der AA-Paare zurückzuführen sind, haben wir zufällig aus dem vollständigen Satz aller konstitutiven Ereignisse 1000 Sätze gleicher Größe wie die AA-Gruppe ausgewählt. Für jeden Satz berechneten wir die Anzahl der Fälle, in denen der PPT neben der distalen Stelle (<5 nt auseinander) in CA/PA-Paaren war, die durch ≤40 und >40 nt getrennt waren, und verglichen sie mit der Verteilung im AA-Satz. Wir haben eine Reihe von Fisher-exakten Tests durchgeführt, in denen jedes Zufallsset mit dem AA-Set verglichen wurde, und alle Fälle zeigten einen signifikanten Unterschied zwischen den Gruppen (unter Verwendung der Bonferroni-Korrektur P < 5*10 –5 ). Diese Ergebnisse bestätigten, dass die Abhängigkeit zwischen dem Abstand „distaler Standort-PPT“ und dem Abstand „distal-proximal“ auf den AA-Satz beschränkt ist.

PPT-Verteilung. (EIN) Der Abstand zwischen der am weitesten stromabwärts gelegenen nt des PPT und der Position −1 (oder N-Stelle) an der distalen NAG-Stelle wird gegen die Anzahl der nts zwischen der Position –1 der proximalen und der distalen Spleißstelle aufgetragen. (B) Ein Kontrollsatz, in dem der Abstand von PPT zu konstitutiven Spleißstellen gegen den Abstand von konstitutiven zu Pseudo-Spleißstellen aufgetragen ist. Die Diagonale zeigt Positionen an, bei denen der PPT der proximalen (oder Pseudo-)Spleißstelle benachbart ist.

PPT-Verteilung. (EIN) Der Abstand zwischen der am weitesten stromabwärts gelegenen nt des PPT und der Position −1 (oder N-Stelle) an der distalen NAG-Stelle wird gegen die Anzahl der nts zwischen der Position –1 der proximalen und der distalen Spleißstelle aufgetragen. (B) Ein Kontrollsatz, in dem der Abstand von PPT zu konstitutiven Spleißstellen gegen den Abstand von konstitutiven zu Pseudo-Spleißstellen aufgetragen ist. Die Diagonale zeigt Positionen an, bei denen der PPT der proximalen (oder Pseudo-)Spleißstelle benachbart ist.

Wir haben außerdem eine detaillierte Analyse der Nähe zwischen dem größten PPT und der proximalen Spleißstelle durchgeführt. Obwohl die Analyse für alle Untergruppen durchgeführt wurde, konzentrierten wir uns speziell auf die FAR-Gruppe, bei der der Abstand zwischen der Spleißstelle den Nachweis von PPTs in voller Größe ermöglicht. Die Analyse hat eine überraschend hohe Anzahl von AA-Paaren ergeben, bei denen gefunden wurde, dass das PPT die proximale Spleißstelle vollständig überlappt (∼57%). Dieses Phänomen wurde in den festgelegten CA/PA-Paaren nicht gefunden, wo wir nur 8 % der Fälle fanden, in denen der vorhergesagte PPT die PA-Stelle überlappte (Tabelle S2). Im Gegensatz dazu wurde bei 65% der konstitutiven Ereignisse die PPT stromabwärts der Pseudo-Spleißstelle (nahe der konstitutiven Spleißstelle) vorhergesagt, während die PPT bei nur ∼ 13% der AA-Paare stromabwärts der proximalen Stelle gefunden wurde. In beiden Gruppen beobachten wir einen ähnlichen Anteil an Ereignissen, bei denen der PPT relativ weit stromaufwärts der proximalen (oder Pseudo-)Spleißstelle gefunden wurde. Wichtig zu erwähnen ist, dass in den meisten Fällen, in denen die PPT die Spleißstellen überlappt, diese normalerweise in der 5′-Hälfte in die PPT eingebettet waren, aber nicht am Rand (die Häufigkeit der Ereignisse, die die Position der Spleißstelle relativ zur PPT ist in Abbildung 1S angegeben).

Frühere Studien haben gezeigt, dass eine effiziente Repression durch die PTB von der Existenz zweier Bindungsstellen abhängt, die die Bildung einer Stamm-Schleife-Struktur durch Protein-Protein-Wechselwirkungen zwischen PTB-Monomeren vermitteln können, bekannt als das „Looping-out“-Modell ( 37). Dieser Mechanismus wurde ursprünglich vorgeschlagen, um die Regulation alternativer Exons zu erklären, jedoch wurde auch vorgeschlagen, dass BPs durch die Spleißmaschinerie ausgeschleift und vermieden werden ( 38). Darüber hinaus berichtete eine kürzlich durchgeführte Computerstudie über die Existenz von zwei PPTs, die die stromaufwärts gelegene Spleißstelle flankieren, wenn alternative 3′SS durch ≥8 nt getrennt sind ( 39). Um weitere Merkmale zu identifizieren, die verwendet werden könnten, um auf genomischer Ebene zwischen alternativen und konstitutiven Spleißakzeptoren zu unterscheiden, suchten wir nach der Existenz einer zusätzlichen Polypyrimidinstrecke im Bereich von 100 nt stromaufwärts der Spleißstelle (sowohl um AA als auch CA/PA . herum). Paare). Die Definition zur automatischen Zuweisung des zweiten PPT ist im Abschnitt Methoden ausführlich beschrieben. Im Allgemeinen erfolgte die Zuordnung der PPTs nach ihrer relativen Größe, wobei PPT1 die längste Strecke war. Insgesamt beobachteten wir keinen klaren Unterschied zwischen den alternativen und konstitutiven Spleißstellen, wenn man nur die Länge von PPT2 betrachtet (P = 0,060) oder seine relative Stärke (P = 0,596). Es ist wichtig anzumerken, dass wir in ∼20% der AA-CA/PA-Paare keinen zusätzlichen PPT finden konnten, während wir in 19% der AA- und 27% der CA/PA-Paare beide PPTs entweder stromaufwärts oder stromabwärts von . fanden die Spleißstelle (Tabelle S3).

Anschließend bewerteten wir die relative Position beider PPTs in allen AA- und CA/PA-Paaren, wobei wir uns auf die FAR-Gruppe konzentrierten. Wir fanden, dass in 53% der AA-Paare ein PPT gefunden wurde, das die Spleißstelle überlappte und das andere stromaufwärts davon gefunden wurde [PPT-PPT(p)]. Im Gegensatz dazu machte dieses Muster nur ∼6% aller CA/PA-Paare aus ( Abbildung 3). Diese Beobachtungen bekräftigen, dass das häufige Auftreten von Überlappungen zwischen der proximalen Spleißstelle und dem PPT nicht auf enge Spleißstellenpaare beschränkt ist, bei denen die proximale Stelle aufgrund von Platzbeschränkungen standardmäßig in den PPT fällt, wie in den CLOSE- und MID-Gruppen (Abbildung 2S). Diese Ergebnisse stimmen auch mit früheren Beobachtungen von Dou et al. (39). Darüber hinaus war in den meisten in unserer Studie analysierten AA-Paaren das PPT, das die Spleißstelle überlappte, das größere unter den beiden PPTs (Tabelle 4S). Darüber hinaus beobachteten wir, dass 54 % der Pseudospleißstellen in CA/PA-Paaren von zwei PPTs (PPT-p-PPT) flankiert (aber nicht überlappt) wurden. Dieses Muster wurde nur bei 17 % der AA-Paare beobachtet (Abbildung 3). Im Allgemeinen wurden die PPTs in AA-Paaren immer stromaufwärts der proximalen Spleißstelle gefunden oder überlappten die Spleißstelle, jedoch nie stromabwärts der proximalen Stelle (Abbildungen 3 und 2S). Die Tatsache, dass keine PPTs zwischen AA-Paaren nachgewiesen wurden, könnte auf das kodierende Potenzial dieser Region zurückzuführen sein. Dennoch könnte es darauf hindeuten, dass ein stromabwärts gelegenes PPT allein nicht in der Lage ist, eine stromaufwärts gelegene Spleißstelle zu regulieren.

Position der PPTs relativ zur proximalen Spleißstelle in der FAR-Gruppe. Die Balken zeigen den Prozentsatz der Beobachtungen in den Daten an. I–III sind Fälle, in denen nur ein PPT stromaufwärts (I), überlappend (II) oder stromabwärts (II) der proximalen Spleißstelle gefunden wurde. IV–VI sind Fälle, in denen zwei PPTs beobachtet wurden (IV) die die proximale Stelle flankieren, (V) eine PPT die die Spleißstelle überlappt und die zweite stromaufwärts und (VI) eine PPT die die Spleißstelle überlappt und die zweite stromabwärts der proximale Spleißstelle. Die grauen Balken stellen alternative Akzeptorpaare dar und die schwarzen Balken stellen konstitutive/Pseudo-Akzeptor-Paare dar, bei denen die Pseudospleißstelle die proximale Stelle nachahmt. Die Anzahl der Vorkommen wird in Klammern angezeigt.

Position der PPTs relativ zur proximalen Spleißstelle in der FAR-Gruppe. Die Balken zeigen den Prozentsatz der Beobachtungen in den Daten an. I–III sind Fälle, in denen nur ein PPT stromaufwärts (I), überlappend (II) oder stromabwärts (II) der proximalen Spleißstelle gefunden wurde. IV–VI sind Fälle, in denen zwei PPTs beobachtet wurden (IV) die die proximale Stelle flankieren, (V) eine PPT die die Spleißstelle überlappt und die zweite stromaufwärts und (VI) eine PPT die die Spleißstelle überlappt und die zweite stromabwärts der proximale Spleißstelle. Die grauen Balken stellen alternative Akzeptorpaare dar und die schwarzen Balken stellen konstitutive/Pseudo-Akzeptor-Paare dar, bei denen die Pseudospleißstelle die proximale Stelle nachahmt. Die Anzahl der Vorkommen wird in Klammern angezeigt.

Kombinieren von Funktionen zur Klassifizierung von Spleißstellen

Um zu testen, ob die oben beschriebene Kombination von Funktionen AA- und CA/PA-Paare besser trennen kann, haben wir für jeden der Datensätze einen SVM-Klassifikator erstellt: NAGNAG, CLOSE, MID und FAR. SVM ist ein überwachter maschineller Lernalgorithmus, der darauf trainiert wird, zwischen zwei Datensätzen zu trennen. Es wurde zuvor angewendet, um automatisch alternative Exons basierend auf exonischen und intronischen Eigenschaften zu identifizieren, einschließlich evolutionärer Konservierung, Länge von PPT und Zusammensetzung der Spleißstellen (23). Darüber hinaus hat eine kürzlich durchgeführte Studie SVM angewendet, um zwischen alternativen und konstitutiven 3′/5′-Spleißstellen basierend auf Parametern wie PPT, Spleißstellenzusammensetzung und Rahmenerhaltung zu unterscheiden (25). Hier haben wir den SVM-Algorithmus angewendet, um alternative und konstitutive 3′ss-Ereignisse in jeder Untermenge unabhängig voneinander zu unterscheiden. Der Merkmalssatz bestand aus intronischen Merkmalen, die im vorherigen Abschnitt berechnet wurden, einschließlich der Zusammensetzung der Spleißstelle, der PPT-Eigenschaften intronischer Konservierung, des Vorkommens der Pseudo-Spleißstelle und des GC-Gehalts (siehe Abschnitt Methoden für Details). Da festgestellt wurde, dass die Position des vorhergesagten BP relativ zur Spleißstelle stark mit der relativen Position des PPT korreliert (Pearson-Korrelation ∼0.9), haben wir diesen Parameter nicht in das SVM-Feature-Set aufgenommen. Darüber hinaus haben wir die ESE- und ESS-Dichte nicht als Parameter für SVM aufgenommen, da sie sich in keiner der Untergruppen als statistisch signifikant erwiesen. Um die Leistungsfähigkeit unserer Methode einzuschätzen, haben wir einen „Hold One Out“-Kreuzvalidierungstest (auch bekannt als „Jackknife“-Test) durchgeführt. Für jeden Test zeichneten wir einen Plot der empfangenden Betriebseigenschaften (ROC) und berechneten die Fläche unter der Kurve (AUC), die Sensitivität, Spezifität, Gesamtgenauigkeit und den Korrelationskoeffizienten von Matthews (Tabelle 2). Wie gezeigt, wurde die beste SVM-Leistung für den Klassifikator AA FAR vs. CA/PA FAR erzielt, für den die AUC 0,94 betrug, gefolgt von MID (AUC = 0,91), CLOSE (AUC = 0,80) und schließlich NAGNAG-P (AUC = 0,78) (Abbildung 4 und Tabelle 2). Wie im NAGNAG-D-Klassifikator gezeigt, stellten wir eine bemerkenswerte Abnahme der SVM-Leistung fest (AUC = 0,69). Diese Ergebnisse stimmen mit unseren früheren Berichten überein, die Ähnlichkeit in den genomischen Eigenschaften zwischen alternativen gespleißten NAGNAG-Motiven und NAGNAG-Motiven zeigen, bei denen die distale Stelle konstitutiv gewählt wird (10). Insgesamt in Übereinstimmung mit der aktuellen Studie von Xia et al. (25) beobachten wir, dass die Leistung der SVM als Funktion des Abstands zwischen den Spleißstellenpaaren zunimmt. Anders als Xia et al. ( 25) erzielten wir in der aktuellen Studie auch bei der Klassifikation nahe beieinander liegender Spleißstellenpaare eine beachtlich hohe Leistung, wobei die Sensitivität in den verschiedenen Untergruppen zwischen 60 und 85 % schwankte ( Tabelle 2). Der Unterschied in der SVM-Leistung, der für die nahegelegenen Standorte in den verschiedenen Studien erzielt wurde, ist wahrscheinlich auf die einzigartigen Merkmale zurückzuführen, die für die Studie ausgewählt wurden.

ROC-Diagramm, das die SVM-Ergebnisse zusammenfasst: Die Falsch-Positiv-Rate wird gegen die Wahr-Positiv-Rate für alternative Akzeptoren im Vergleich zu konstitutiven/Pseudo-Akzeptor-Paaren im FAR (schwarze Linie), MID (rot gestrichelt), CLOSE (grüne Linie), NAGNAG-proximal ( blaue Punkte) und NAGNAG-distale (schwarze Punkte) Gruppen.

ROC-Plot, der die SVM-Ergebnisse zusammenfasst: Die Falsch-Positiv-Rate wird gegen die Wahr-Positiv-Rate für alternative Akzeptoren im Vergleich zu konstitutiven/Pseudo-Akzeptor-Paaren in den FAR (schwarze Linie), MID (rot gestrichelte), CLOSE (grüne Linie), NAGNAG-proximal ( blaue Punkte) und NAGNAG-distale (schwarze Punkte) Gruppen.

. FP. FN. TP. TN. SN. SP. TA. MCC. AUC.
WEIT 12 7 40 129 85.106 91.489 89.894 0.741 0.936
MITTE 37 14 63 194 81.818 83.983 83.442 0.608 0.913
NAH DRAN 51 22 53 174 70.667 77.333 75.667 0.437 0.802
NAGNAG-P 121 47 150 276 76.142 69.521 71.717 0.432 0.785
NAGNAG-D 53 75 122 124 61.929 70.056 65.775 0.32 0.698
. FP. FN. TP. TN. SN. SP. TA. MCC. AUC.
WEIT 12 7 40 129 85.106 91.489 89.894 0.741 0.936
MITTE 37 14 63 194 81.818 83.983 83.442 0.608 0.913
NAH DRAN 51 22 53 174 70.667 77.333 75.667 0.437 0.802
NAGNAG-P 121 47 150 276 76.142 69.521 71.717 0.432 0.785
NAGNAG-D 53 75 122 124 61.929 70.056 65.775 0.32 0.698

Die Tabelle zeigt die Anzahl der falsch positiven (FP), richtig positiven (TP), falsch negativen (FN), wahr negativen (TN), Sensitivität (SN), Spezifität (SP), Gesamtgenauigkeit (TA) sowie The Matthews Korrelationskoeffizient (MCC) und den AUC-Wert für die verschiedenen Datensätze.

. FP. FN. TP. TN. SN. SP. TA. MCC. AUC.
WEIT 12 7 40 129 85.106 91.489 89.894 0.741 0.936
MITTE 37 14 63 194 81.818 83.983 83.442 0.608 0.913
NAH DRAN 51 22 53 174 70.667 77.333 75.667 0.437 0.802
NAGNAG-P 121 47 150 276 76.142 69.521 71.717 0.432 0.785
NAGNAG-D 53 75 122 124 61.929 70.056 65.775 0.32 0.698
. FP. FN. TP. TN. SN. SP. TA. MCC. AUC.
WEIT 12 7 40 129 85.106 91.489 89.894 0.741 0.936
MITTE 37 14 63 194 81.818 83.983 83.442 0.608 0.913
NAH DRAN 51 22 53 174 70.667 77.333 75.667 0.437 0.802
NAGNAG-P 121 47 150 276 76.142 69.521 71.717 0.432 0.785
NAGNAG-D 53 75 122 124 61.929 70.056 65.775 0.32 0.698

Die Tabelle zeigt die Anzahl der falsch positiven (FP), richtig positiven (TP), falsch negativen (FN), wahr negativen (TN), Sensitivität (SN), Spezifität (SP), Gesamtgenauigkeit (TA) sowie The Matthews Korrelationskoeffizient (MCC) und den AUC-Wert für die verschiedenen Datensätze.

Merkmalsauswahl

Um den Beitrag der verschiedenen Parameter zum Lernprozess abzuschätzen, haben wir ein einfaches (rückwärts gerichtetes) Merkmalsauswahlverfahren durchgeführt, bei dem wir in jedem SVM-Lauf einen Merkmalssatz ausschließen und die Leistungsänderung bewerten. Ein einzelner Merkmalssatz wurde als ein Satz aller Parameter definiert, die eine gemeinsame Eigenschaft haben und stark voneinander abhängig sind, zum Beispiel wurde die Intronerhaltung für fünf überlappende Fenster berechnet, die durchschnittlichen Erhaltungswerte für jedes Fenster separat und der Durchschnitt über alle Fenster zusammen betrachtet als einzelne Merkmale im Vektor, während ein Satz all dieser Merkmale zusammen als ein Merkmalssatz mit dem Namen 'Intronerhaltung' betrachtet wurde. Für jeden Satz haben wir eine ΔAUC berechnet, die die Differenz zwischen dem Gesamt-AUC-Wert ist, der mit dem vollständigen Vektor erhalten wurde, und dem AUC-Wert, der erreicht wurde, wenn der spezifische Satz eliminiert wurde.

Wie in Abbildung 5 gezeigt, waren die Merkmale, die in den FAR- und MID-Gruppen am meisten zur SVM-Leistung beitrugen, die Intronerhaltung (insbesondere in der MID-Gruppe) und die PPT-Merkmale, einschließlich sowohl der PPT-Länge als auch des relativen Abstands von das PPT zur Spleißstelle. Interessanterweise war der Effekt des Entfernens entweder des PPT- oder des Intron-Erhaltungs-Merkmalssatzes aus der FAR-Gruppe sehr ähnlich, was darauf hindeutet, dass beide in der letztgenannten Gruppe wichtig sind.Im Gegensatz dazu hatte das Entfernen des Erhaltungssatzes aus der MID-Gruppe einen bemerkenswerten Effekt im Vergleich zum Entfernen des PPT-Satzes, was darauf hindeutet, dass in dieser Untergruppe der Beitrag jedes Parameters zum Lernprozess unterschiedlich ist. Dieses Ergebnis könnte darauf zurückzuführen sein, dass die MID-Gruppe die Borderline-Sequenzen umfasst und eine gemischte Verteilung darstellen kann. In der CLOSE-Gruppe trat die signifikanteste Änderung des AUC-Wertes auf, wenn die PPT-Merkmale eliminiert wurden. Darüber hinaus haben wir eine geringere Reduzierung der SVM-Leistung beobachtet, wenn alle anderen Funktionen aus dem CLOSE-Klassifikator entfernt wurden. Dies weist darauf hin, dass in der CLOSE-Gruppe (anders als in der FAR- und MID-Gruppe) der Lernprozess meist von einem einzigartigen Feature-Set beherrscht wird. In der NAGNAG-proximalen Gruppe waren die bemerkenswertesten Merkmale die Spleißstellen, gefolgt von der intronischen Konservierung. Dies steht im Einklang mit den statistischen Analyseergebnissen der aktuellen Studie und früheren Beobachtungen (10, 13). Insgesamt stimmte der Merkmalsauswahltest mit der statistischen Analyse überein. Die letzteren Ergebnisse bekräftigen jedoch, dass die Unterschiede zwischen AS und CS nicht auf eindeutigen Parametern beruhen, sondern vielmehr auf einer Kombination mehrerer Sequenzmerkmale.

ΔAUC-Werte für die verschiedenen Feature-Sets werden für die Gruppen FAR (schwarz), MID (rot), CLOSE (grün) und NAGNAG-proximal (blau) aufgetragen. Die Feature-Sets sind Spleißstellen (SS), Intronische Konservierung (CON), Polypyrimidin-Trakt (PPT), Pseudo-Spleißstellen (PSE) und GC-Inhalt (GC).

ΔAUC-Werte für die verschiedenen Feature-Sets werden für die Gruppen FAR (schwarz), MID (rot), CLOSE (grün) und NAGNAG-proximal (blau) aufgetragen. Die Feature-Sets sind Spleißstellen (SS), Intronische Konservierung (CON), Polypyrimidin-Trakt (PPT), Pseudo-Spleißstellen (PSE) und GC-Inhalt (GC).


Teil 2: Spleißosomstruktur und -dynamik

00:00:00.02 Hallo, ich bin Melissa Moore von der University of Massachusetts Medical School
00:00:03.24 und dem Howard Hughes Medical Institute und in diesem Vortrag
00:00:06.28 Ich erzähle dir von einigen Arbeiten aus unserem eigenen Labor
00:00:09.27 über Spleißosomenstruktur und -dynamik. Also wie wir gesehen haben
00:00:14.15 der erste Vortrag, eukaryotische Gene werden gespalten, indem sie
00:00:20.00 haben exprimierte Regionen oder Exons hier oben und Introns.
00:00:26.13 Und die Introns müssen entfernt werden und in meinem vorherigen
00:00:30.21 cartoon Ich habe gerade Schere und Klebeband benutzt. Also in diesem Vortrag
00:00:34.15 werden wir darüber sprechen "Was ist die Natur von denen?
00:00:36.27 Schere und Klebeband, und wie reagieren sie eigentlich?"
00:00:39.25 Lassen Sie uns also zuerst darüber sprechen, wie das Spleißen tatsächlich abläuft.
00:00:45.17 Und es geschieht in zwei chemischen Schritten. Im ersten Schritt
00:00:50.18 des Spleißens, die Zweigstelle – also haben wir darüber gesprochen, das ist ein
00:00:54.11 konserviertes Adenosin im Intron nahe der 3-Prime-Spleißstelle.
00:00:58.19 Das 2-primäre Hydroxyl der Verzweigungsstelle greift das Phosphat an
00:01:05.07 an der 5-Prime-Spleißstelle, und das erzeugt ein Lariat-Zwischenprodukt,
00:01:10.11 mit 2 Primzahlen, 5 Primzahlen und 3 Primzahlen Phosphat
00:01:13.23 alles kommt von diesem Adenosin. Und es gibt die 5 Primzahl frei
00:01:17.23 Exon. Jetzt, wo das 5-Prime-Exon nicht wegschwebt, wird es sein
00:01:24.10 von der Spleißmaschine festgehalten, über die wir sprechen werden
00:01:27.09 gleich. Der zweite Schritt des Spleißens – hier sind also Zwischenprodukte
00:01:33.22 in der Reaktion. Dieses 3-Primär-Hydroxyl, das erzeugt wurde
00:01:38.15 im ersten Schritt auf dem 5er-Prime-Exon – es greift jetzt die
00:01:42.16 Phosphat an der 3-Prime-Spleißstelle, und jetzt geht es los
00:01:47.28 das Intron und ligiert die beiden Exons zusammen. Jetzt wir
00:01:53.09 wissen, dass dies die Chemie ist und dass diese als Single auftreten
00:01:57.27 Umesterungsreaktionen. Die zwei Schritte des Spleißens
00:02:01.28 werden von einem großen Komplex in der Zelle, dem Spleißosom, katalysiert.
00:02:09.06 Das Spleißosom ist wohl die komplizierteste makromolekulare Maschine
00:02:13.26 in der Zelle, wie wir gleich sehen werden. Und das Spleißosom besteht
00:02:17.24 von vier Hauptstücken, großen Teilen, Untereinheiten, die müssen
00:02:23.23 kommen mit jeder Spleißrunde in diesem komplizierten zusammen
00:02:27.04 Tanz namens Spleißosomenzyklus, über den wir sprechen werden
00:02:30.07 in ein paar Folien. Aber was ich dir hier zeigen möchte ist das
00:02:34.12 die Stücke des Spleißosoms, die Hauptstücke sind diese
00:02:38.13 Komponenten namens U1, U2, das dreifache snRNP U4/5/6 und der NineTeen-Komplex,
00:02:46.00 oder das NTC. Was sind nun diese Dinger?
00:02:49.17 Was sind nun diese U1-, U2-Dinge, die ich dir auf der letzten Folie gezeigt habe?
00:02:57.06 Nun, sie sind sogenannte snRNPs für kleine nukleäre RNA-Proteinkomplexe.
00:03:03.21 Und so besteht jedes dieser snRNPs aus einer kleinen nuklearen RNA
00:03:07.27 irgendwo zwischen hundert und ein paar hundert Nukleotiden.
00:03:12.19 Es ist eine stabile RNA, die mit einer Reihe von Proteinen komplexiert ist. So für
00:03:17.00 Beispiel: U1 snRNP enthält U1 snRNA und eine Reihe von Kernproteinen
00:03:23.05 nennt man die Sm-Proteine. Es gibt sieben Proteine. Sie machen a
00:03:26.08 ringartige Struktur, und Sie können sehen, dass sie gemeinsam sind
00:03:29.18 viele der snRNPS. Und dann einige spezifische Proteine
00:03:32.26, die U1 snRNP und im Fall von U1 gemeinsam sind - 70K, A und C.
00:03:38.03 U2 ist komplizierter, und das sind alle Proteine, die es gibt
00:03:42.10 verbunden mit U2 snRNP. Und dann mit dem dreifachen snRNP,
00:03:46.09 ein sogenanntes dreifaches snRNP, weil es drei kleine Kerne hat
00:03:50.14 RNAs darin, und es enthält sogar noch mehr Proteine.
00:03:55.17 Zusätzlich zu den snRNPs gibt es den NineTeen-Komplex, also
00:04:00.12 benannt, weil es ein Protein namens Prp19 enthält und
00:04:05.15 die damit verbundenen Faktoren. Es ist also wie ein snRNP, außer es ist
00:04:10.02 enthält keine RNA-Komponente. Und dann zusätzlich
00:04:13.25 zu diesen stabilen Hauptkomponenten gibt es auch Dinge, die so genannt werden
00:04:18.11 Spleißfaktoren und das sind Proteine, die kommen und gehen,
00:04:22.10, sind aber keinem einzelnen snRNP stabil zugeordnet.
00:04:26.05 Und in dieser Klasse enthalten sind RNA-Helikasen, die die
00:04:32.29 Struktur von RNAs oder kann die Struktur von RNA-Proteinkomplexen verändern.
00:04:39.02 Sicherlich gibt es RNA-bindende Proteine, über die wir gesprochen haben
00:04:42.12 zwei der Klassen der letzten Vorlesung – die SR-Proteine
00:04:46.06 und die hnRNP-Proteine. Und es gibt unerwartete Proteine
00:04:51.05 wie cis/trans-Prolyl-Isomerasen und Ubiquitin-Ligasen.
00:04:54.25 Insgesamt die komplette Spleißosom-Stückliste, wie wir sie jetzt verstehen
00:05:01.23 besteht aus 5 snRNAs (U1, U2, U4, U5 und U6) und hundert
00:05:09.26 Proteine ​​in Hefe, hundert verschiedene Proteine ​​und ungefähr
00:05:12.25 dreihundert verschiedene Proteine ​​beim Menschen. Und der Grund, dass die
00:05:17.13 menschliche Spleißmaschinen sind viel komplizierter
00:05:19.17 als die Hefespleißmaschinerie, können Sie sich vorstellen
00:05:22.11 warum, weil wir so viele verschiedene Introns haben und wir alle machen
00:05:25.07 dieses alternative Spleißen, das die Hefe nicht tut. Und so die meisten
00:05:28.08 dieser Proteine, die zusätzlichen, sind am alternativen Spleißen beteiligt.
00:05:32.00 Lassen Sie mich Ihnen nun ein wenig über die snRNAs erzählen. Sie heißen
00:05:36.03 "U"-snRNAs, weil sie uridinreiche RNAs sind und ihre
00:05:40.23 Nummerierung kam von - wenn man nur alle stabilen RNAs reinigt
00:05:47.27 aus dem Kern und lässt sie auf einem Gel laufen, dem am häufigsten vorkommenden
00:05:53.01 eine davon ist U1, die zweithäufigste ist U2 und so weiter.
00:05:57.06 Und es stellt sich heraus, dass U3 existiert, aber an der Ribosomen-Biogenese beteiligt ist
00:06:03.28 ebenso wie U7. Aber die anderen fünf der sechs am häufigsten vorkommenden
00:06:09.29 sind alle am prä-mRNA-Spleißen oder am Spleißosom beteiligt.
00:06:14.13 Hier sind wir beim Spleißosom, zurück beim Spleißosomenzyklus,
00:06:17.15 und wir werden uns das etwas genauer ansehen, denn
00:06:20.18 Ich werde dir von einigen Experimenten erzählen, die wir kürzlich gemacht haben
00:06:22.29 durchgeführt, um diesen Zyklus zu testen. Also im ersten Teil des Zyklus,
00:06:27.24 zu Beginn der Spleißosomenmontage interagiert U1 snRNP mit
00:06:33.23 die 5-Prime-Spleißstelle und U1-snRNA sind tatsächlich Basenpaare
00:06:38.22 und erkennt die 5-Prime-Spleißstelle. Ebenso U2 snRNA
00:06:44.29 Basenpaare mit und erkennen die Konsensussequenz der Zweigstelle,
00:06:49.22 und U2-snRNA bildet, wenn sie sich mit der U1-snRNA verbindet, einen A-Komplex.
00:06:56.03 E-Komplex steht für "früher" Komplex und dann sind A, B und C--
00:07:02.21 wir werden gleich sehen - wurden nur nach ihrem Fluchtort benannt
00:07:06.07 auf einem Gel. Also kommt zuerst ein Komplex und dann der nächste große Brocken
00:07:11.12 des Spleißosoms, das hereinkommt, ist das dreifache snRNP--
00:07:15.17 U4/5/6. Sobald das dreifache snRNP da ist, haben wir den B-Komplex.
00:07:21.10 Dann gibt es eine strukturelle Neuordnung, wo U1 snRNP eigentlich ist
00:07:26.24 ausgeworfen. Es ist rausgeschmissen und irgendwie werden die Dinge grundlegend neu geordnet, so
00:07:31.20, dass U6-snRNA mit der 5-Prime-Spleißstelle interagiert. In einer anderen Neuordnung
00:07:38.27 U4 snRNP wird rausgeschmissen und dann kommt der NineTeen Komplex rein,
00:07:47.17 und jetzt haben wir das katalytisch aktive Spleißosom, wo der erste Schritt
00:07:53.18 und dann der zweite Schritt des Spleißens. Einmal der zweite Schritt des Spleißens
00:07:58.01 ist fertig, das Spleißprodukt wird freigegeben und das ausgespleißte Intron
00:08:05.21 verlässt mit dem Rest des Spleißosoms. Dass Spleißmaschinen zerlegt werden müssen,
00:08:10.27 und dann wird es bei jeder neuen Spleißrunde neu zusammengesetzt, also ergo
00:08:15.29 der Spleißosomenzyklus. Woher wissen wir also viele dieser Details des Mechanismus?
00:08:22.04, von denen ich dir erzählt habe? Nun, eine der Möglichkeiten, die wir kennen, ist durch
00:08:25.19 Durchführung von In-vitro-Spleißreaktionen. In einer In-vitro-Spleißreaktion wird also
00:08:31.15 nehmen wir ein Stück RNA, normalerweise ein Stück RNA, das ein Paar wäre
00:08:37.19 Hundert Nukleotide, die aus einem Exon mit einem Intron bestehen würden
00:08:42.16 gefolgt von einem nachgeschalteten Exon. Und das kleine Sternchen hier, die roten Sternchen,
00:08:49.01 sollen darauf hinweisen, dass diese RNA radioaktiv markiert wäre, also würden wir
00:08:53.04 transkribieren Sie es in vitro und setzen Sie überall radioaktive Nukleotide ein.
00:08:59.23 Wir mischen diese RNA dann mit einem der Ganzzellextrakte, wenn wir am Hefespleißosom arbeiten
00:09:05.08 oder Kernextrakt, wenn wir am menschlichen Spleißosom arbeiten. Und zum Beispiel wir
00:09:09.20 könnte das von HeLa-Zellen bekommen, die eine sehr häufige Gewebekulturzelle für den Menschen ist.
00:09:15.01 Und dann auch ATP, weil ATP für das Spleißen essentiell ist, weil viele der
00:09:21.21 Spleißosom-Übergänge, die ich dir hier alle gezeigt habe
00:09:26.12 nach der E-Komplexbildung erfordert jeder dieser Schritte ATP und
00:09:32.07 geht auch hier hinten herum. Warum verwenden wir nun Ganzzellextrakt?
00:09:38.01 oder Kernextrakt? Nun, ich habe dir gerade gesagt, dass die Spleißmaschinerie ist
00:09:43.08 unglaublich kompliziert. Es enthält in Hefe hundert verschiedene Polypeptide
00:09:48.15 beim Menschen dreihundert verschiedene Polypeptide. Es gibt wirklich nur nein
00:09:51.26 wie wir derzeit jedes dieser Proteine ​​reinigen können, haben Sie das
00:09:56.23 in ein Reagenzglas und stellen Sie die Maschinerie vollständig zusammen. Also jetzt, die
00:10:01.10 Der beste Weg, das Spleißosom zu studieren, ist einfach fast in seiner ursprünglichen Form
00:10:04.12 Umgebung, und zwar in unfraktioniertem Zellextrakt. Also wenn wir dann nehmen
00:10:11.16 diese Splicing-Reaktionen und nehmen Sie Zeitpunkte heraus und reinigen Sie dann
00:10:17.23 die radioaktive RNA und lassen Sie sie auf einem denaturierenden Gel laufen – und in diesem Fall a
00:10:22.07 ziemlich hochprozentiges denaturierendes Gel - was wir sehen können, ist das vorbei
00:10:26.16 Uhr (und dieser Zeitverlauf geht von ungefähr null bis sechzig Minuten
00:10:31.23 in vitro) können wir das Substrat allmählich verschwinden sehen. Und dann früh
00:10:40.11 Zeitpunkte, die beiden Zwischenstufen des Spleißens erscheinen, die Lariat-Zwischenstufe
00:10:44.11 und das 5-Prime-Exon. Und dann sieht man zu späteren Zeitpunkten die
00:10:49.18 Lariatprodukt, das Intronprodukt und das gespleißte Exonprodukt
00:10:56.22 erscheinen. Und der Grund, warum die Lariate hoch im Gel laufen, obwohl
00:11:01.26 sie sind kleiner als die Prä-Messenger-RNA, das ist, dass sie das haben
00:11:06.21 kreisförmige Struktur, und wegen dieser ungewöhnlichen Struktur sind sie verzögert
00:11:11.17 im Gel mehr als eine lineare RNA und so laufen sie tatsächlich höher als
00:11:16.16 würden Sie erwarten. Aber jetzt, wenn wir stattdessen dieselbe Spleißreaktion durchführen
00:11:23.27, aber reinige die RNA nicht und lasse sie einfach auf einem nativen Gel laufen, also sind wir jetzt
00:11:30.05 mit Blick auf die Komplexe, die die RNA enthalten. Hier können wir die sehen
00:11:35.12 Komplexe, von denen ich dir schon erzählt habe. Hier ist also der E-Komplex, der frühe Komplex,
00:11:39.18 A, B und C und sie bauen sich auf und verschwinden mit der Zeit, wie Sie vielleicht erwarten.
00:11:45.29 Und daher kamen die Namen dieser verschiedenen Komplexe,
00:11:49.10 einfach durch ihre Wanderung auf dem Gel. Okay, jetzt diese anderen
00:11:57.05 Komplexe können gereinigt werden. Sie sind stabil. Sie sind stabil genug, um
00:12:01.11 ein natives Gel überleben, und es wurden jetzt viele verschiedene Möglichkeiten entwickelt
00:12:07.13 um die verschiedenen Komplexe zu reinigen. Hier ist ein Beispiel aus meinem Labor.
00:12:11.17 Wir haben ein Spleißsubstrat genommen und dort mutiert
00:12:15.20 die 3 beste Spleißstelle, damit sich die Spleißmaschinerie aufbauen konnte
00:12:19.28 die RNA. Es könnte den ersten Schritt tun, aber es konnte nicht den zweiten Schritt machen
00:12:24.11, weil die 3-Prime-Spleißstelle mutiert war. Und in dieses Intron haben wir eingebaut
00:12:30.04 Stammschleifen, die vom MS2-Protein erkannt wurden, das eine Virushülle ist
00:12:35.06 Protein, das sehr fest an seine Erkennungssequenz bindet. Dieser virale Mantel
00:12:40.09 Protein namens MS2 haben wir mit Maltose-bindendem Protein verbunden. Maltosebindung
00:12:45.13 Protein bindet gerne Amyloseharz, also könnten wir das als Affinität verwenden
00:12:50.12 markieren, um diese Spleißosomen herunterzuziehen und zu reinigen. Und du kannst hier sehen
00:12:56.07 ein EM-Bild dieser Spleißosomen und die Spleißosomen sind alle
00:13:02.24 ungefähr 20-30 Angström groß. Mit diesen EM-Bildern können Sie jetzt tun
00:13:11.07 Einzelpartikelrekonstruktion, um Strukturen der Spleißmaschinerie zu erhalten.
00:13:17.27 Und an dieser Stelle, im Vergleich zum Ribosom, zum Beispiel die
00:13:25.08 Die strukturellen Informationen, die wir für das Spleißosom haben, sind ziemlich begrenzt.
00:13:30.13 Wir haben jetzt Kristallstrukturen – zwei verschiedene Kristallstrukturen von U1 snRNP,
00:13:36.20, das ist das häufigste der snRNPs. Und die sind bei 5,5 und 4,4
00:13:43.08 Angström Auflösung, genug um die RNA und die Proteine ​​zu sehen.
00:13:49.13 Aber für die größeren Komplexe sind wir noch bei der Elektronenmikroskopie
00:13:54.09 Bühne, und so zum Beispiel hier ein paar Bilder aus Reinhardt Luhrmanns Labor
00:13:57.28 der Hefe-Splicing-Komplexe – der B-Komplex, der aktivierte B-Komplex
00:14:04.04 und dann der C-Komplex, das Spleißosom mit Zwischenprodukten
00:14:08.12 darin. Und so sind wir in den kommenden Jahren wirklich – die Spleiß-Community – ist
00:14:14.08 wirklich hart kämpfen, aber sich auf hochauflösende Strukturen freuen
00:14:19.09 weil wir wirklich gerne sehen würden, wo all diese Teile zusammenhalten
00:14:22.19 und wie sie alle zusammenpassen, um diese wirklich bemerkenswerten Maschinen zu bilden.
00:14:27.09 Da sind wir inzwischen an der strukturellen Front. In
00:14:34.11 zusätzlich zur Struktur für jeden biochemischen Komplex oder jede Maschine, Sie
00:14:38.29 muss wirklich etwas über ihre Dynamik bemerken, also habe ich das durchgesehen
00:14:42.29 ganzen Spleißzyklus mit dir, aber wie ich schon sagte, der Spleißzyklus ist
00:14:47.17 basierend auf den Komplexen, die stabil genug sind, um auflösbar zu sein
00:14:54.14 auf einem Gel oder Sie können sie affinitätsreinigen. Aber es erzählt dir nichts davon
00:15:00.19 die Kinetik des Kommens und Gehens. Wird es zum Beispiel wahr sein?
00:15:07.00, dass bei jedem Intron U1 vor U2 kommen muss, und müssen diese beiden vor U2 kommen?
00:15:14.01 das dreifache snRNP? Und all diese Pfeile, die wir hier zeigen, sind Einbahnstraßen
00:15:19.12 Pfeile, aber die meisten biochemischen Reaktionen und chemischen Reaktionen sind es wirklich
00:15:23.11 in beide Richtungen. Sind diese Pfeile also wirklich eine Einbahnstraße: Ist es eine Einbahnstraße?
00:15:28.07 Oder ist dieser Vorgang irgendwie reversibel? Um an diese Informationen zu kommen
00:15:34.07 mein Labor arbeitet seit kurzem mit dem Labor von Jeff Gelles zusammen
00:15:39.02 an der Brandeis University und Virginia Cornish an der Columbia University
00:15:43.29 sowie einige Mitarbeiter bei New England Biolabs, um neue zu entwickeln
00:15:48.12 Werkzeuge, um die Dynamik des Spleißosoms zu untersuchen. Das Wichtigste
00:15:53.27 Methode, die wir verwendet haben, wird als totale interne Reflexion bezeichnet.
00:15:59.08 Dies ist ein Experiment, das Sie zu Hause ausprobieren können. Das ist also einfach ein Laser
00:16:03.21 Zeiger, der in ein Wasseraquarium geht. Und wenn Sie richtig positionieren
00:16:11.12 der Laserpointer im kritischen Winkel, wenn sich der ändert
00:16:15.23 Brechungsindex, in diesem Fall zwischen Wasser und Luft, dann der gesamte Laser
00:16:20.23 Licht wird vollständig reflektiert, das nennt man interne Totalreflexion.
00:16:25.05 Außer genau an der Stelle, an der der Laser auftrifft, ist da ein bisschen
00:16:34.15 Energie, die durch die andere Seite geht, die als evaneszente Welle bezeichnet wird.
00:16:38.13 Also die evaneszente Welle – in diesem Fall haben wir jetzt die Laser
00:16:44.26 kommen durch die Luft zu einem Objektträger. Hier ist also die Änderung
00:16:49.02 im Brechungsindex geht vom Objektträger zum wässrigen
00:16:56.14 Schicht über dem Objektträger. Die evaneszente Welle wird gehen
00:17:00.05 hundert Nanometer in die Lösung über dem Objektträger.
00:17:05.25 Stellen Sie sich also vor, Sie haben nicht nur einen Laser, sondern sagen wir drei verschiedene Farben
00:17:11.17 von Lasern. Es stellt sich heraus, dass wir jetzt fünf Laser machen können. Ich werde dir nur drei zeigen,
00:17:16.05 heute drei. Aber stellen Sie sich vor, drei verschiedene Farben von Lasern zu haben, die alle gehen
00:17:23.23 in ihren kritischen Winkeln und mit etwas an der Oberfläche befestigt
00:17:27.25 innerhalb dieser 100 Nanometer und mit Molekülen, die fluoreszieren
00:17:34.07 in den Farben, die von deinen drei verschiedenen Lasern angeregt werden. Also Moleküle
00:17:41.14, die sich oberhalb der evaneszenten Welle in Lösung befinden, sind nicht fluoreszierend
00:17:45.25, weil sie sich außerhalb des Bereichs befinden, in dem sich die Lichtenergie befindet. Und so
00:17:51.10 Nur die Moleküle, die an die Oberfläche gebunden sind, werden fluoreszieren.
00:17:55.07 Also können wir das verwenden, um dann nach allem zu fragen, was an die Oberfläche gebunden ist
00:18:01.02 welche verschiedenfarbigen Moleküle zu einem bestimmten Zeitpunkt mit dem verbunden sind
00:18:05.13 Molekül, das an die Oberfläche gebunden ist. Schauen wir also einfach mal, wie das aussieht.
00:18:09.04 Stellen Sie sich vor, Sie schauen auf diese Oberfläche und wir werden es sein
00:18:13.27 beim Betrachten der Moleküle auf der Oberfläche. Wir nennen diese Technik also Kolokalisation
00:18:20.21 der Einzelmolekülspektroskopie oder CoSMos. Und diese Technik war
00:18:25.13 Pionierarbeit von Jeff Gelles und seinem Kollegen Larry Friedman bei Brandeis
00:18:29.00 Universität. Hier betrachten wir also die Fluoreszenz und jede einzelne von
00:18:35.29 Diese Flecken sind ein einzelnes Molekül auf einem Deckglas mit unterschiedlicher Farbe
00:18:42.21 Dinge drauf. In diesem Fall sind die Moleküle ein DNA-Strang, und die
00:18:49.16 farbige Dinge sind verschiedene Oligos, die zu diesem DNA-Strang komplementär sind.
00:18:53.22, aber sie haben verschiedene Fluorophore. Und so kannst du sehen für
00:18:57.12 Beispiel, dass an dieses DNA-Molekül alle drei Oligos gebunden waren
00:19:04.18 aber dieses DNA-Molekül hatte nur dieses eine – hatte nur das Grün und das
00:19:10.04 blau daran gebunden. Und du kannst sehen, hier ist einer, der nur das Blau hatte
00:19:13.19 Molekül daran gebunden. Es ist also ganz einfach, denn alles was wir tun ist
00:19:18.25 wir sehen uns das an, sagen wir, Konstellationen, verschiedene Konstellationen von Flecken
00:19:23.17 und wir lernen etwas über unser biologisches System.
00:19:27.09 Und vor allem, wenn wir uns ansehen können, wie sich diese Flecken im Laufe der Zeit verändern,
00:19:33.13 können wir die Dynamik des Systems kennenlernen. Jetzt um
00:19:37.19 verwenden, um das Spleißosom zu studieren, wir mussten eine Reihe von entwickeln
00:19:42.01 verschiedene oder neue Technologien, die es uns ermöglichen, Teile des Spleißosoms zu markieren
00:19:46.22 damit wir sie sehen können. Und so mussten wir eines der Dinge tun
00:19:51.18 war, fluoreszenzmarkierte Prä-mRNAs zu erzeugen, weil wir es wissen müssen
00:19:57.21 wo sich die Prä-mRNAs auf der Oberfläche befinden. Auch unsere Prä-mRNAs müssen
00:20:02.26 irgendwie an die Oberfläche gebunden werden. Die Art und Weise, wie wir das tun, ist,
00:20:06.13 ein Biotin-Molekül an ein Ende stecken, und dann haben wir auch Biotin an der
00:20:12.05 Glasoberfläche. Wir haben biotinyliertes PEG – Polyethylenglycol.
00:20:17.19 Und dann machen wir ein Sandwich, wo wir Streptavidin haben. Streptavidin
00:20:21.24 kann vier Biotin-Moleküle binden, also können Sie daraus a
00:20:25.11 Sandwich und binden Sie dort Ihre RNA. Jetzt das andere, was wir tun mussten
00:20:30.07 Entwickeln waren andere Möglichkeiten, die snRNPs zu markieren, denn was wir wirklich
00:20:33.27 wollte das Kommen und Gehen der snRNPs in Echtzeit beobachten.
00:20:37.22 Wir markieren also die snRNPs mit zwei Protein-Tags.
00:20:44.22 Einer ist der SNAP-Tag, der von Kai Johnsson entwickelt wurde und jetzt ist
00:20:49.17 erhältlich über New England Biolabs. SNAP basiert auf einem Protein, das
00:20:55.12 ist ein Selbstmordenzym, das Alkylgruppen von Guaninnukleotiden entfernt
00:21:01.23 der DNA. Und so überträgt es diese Alkylgruppen auf sich selbst. Also in diesem Fall
00:21:08.03 wenn du Benzylguanin hast – also hier ist Guanin und dann gibt es eine Benzylgruppe
00:21:13.19 drauf und wenn du daran einen fluoreszierenden Farbstoff anbringst, das SNAP-Tag-Protein
00:21:20.05 überträgt diesen Farbstoff auf sich selbst, und wenn Sie ein Fusionsprotein hergestellt haben
00:21:25.21 zwischen dem SNAP-Tag und Ihrem interessierenden Protein - in diesem Fall a
00:21:30.08 snRNP-Protein – dann können Sie Ihr snRNP-Protein spezifisch kennzeichnen.
00:21:34.29 Hier ist das andere Tag, das wir verwendet haben, das E. coli DHFR,
00:21:42.03 Dihydrofolat-Reduktase-Tag und bakterielle Dihydrofolat-Reduktase bindet
00:21:50.08 sehr eng an Trimethoprim – dieses Molekül hier unten. Es ist nicht kovalent
00:21:54.15 Interaktion. Trimethoprim ist ein Inhibitor von E. coli DHFR, aber dieses Molekül
00:21:59.29 bindet nicht an eukaryotisches DHFR. Aber das ist eine sehr enge Interaktion und
00:22:07.29 wieder wenn wir einen Farbstoff damit anbinden, wird dieser Farbstoff mit unserem DHFR interagieren
00:22:13.14 markieren und uns erlauben, dieses Protein zu markieren. Und diese Technologie war
00:22:19.18, entwickelt von Virginia Cornish und ihren Mitarbeitern an der Columbia University.
00:22:23.22 Wie bekommen wir diese Tags auf unsere snRNPs? So machen wir das
00:22:29.17 Wir verwenden das Hefesystem und wir verwenden die homologe Rekombination.
00:22:33.16 Also machen wir Versionen von verschiedenen Proteingenen, die wir wollen
00:22:38.09 tag – in diesem Fall zwei U1-Proteine ​​und ein U2-Protein. Wir platzieren dann das Tag
00:22:45.22 von Interesse am C-Terminus dieses Proteins oder das Gen für dieses Protein
00:22:50.00 und dann haben wir einen wählbaren Hersteller. Und wir verwenden homolog
00:22:54.25 Rekombination, um diese modifizierten Gene in haploide Hefe zu bringen. Und
00:23:01.11 Das bedeutet, dass das einzige Gen, das dieses Protein in der Hefe kodiert, ist
00:23:07.17 unser Protein von Interesse - unser markiertes Protein. Also dann von dieser Hefe
00:23:13.15 Stämme können wir einen Ganzzellextrakt herstellen. Und in diesem Fall haben wir U1
00:23:18.15 mit zwei DHFR-Tags auf zwei verschiedenen Proteinen oder U1 mit zwei Tags
00:23:26.03 und U2 hat ein SNAP-Tag drauf, also eine dreifach getaggte Sorte. Wir dann
00:23:33.06 nimm diese Extrakte und wir können entweder einfach das TMP zum Etikett hinzufügen
00:23:40.17 das DHFR oder um das SNAP-Tag zu kennzeichnen, nehmen wir unser Benzylguanin, das a
00:23:46.15 fluoreszierendes Etikett darauf. Das reagieren wir mit dem Ganzzellextrakt. Wir entfernen
00:23:52.07 den überschüssigen Farbstoff durch Gelfiltration und dann können wir jetzt unser TMP hinzufügen. Und so
00:23:58.04 das wirklich tolle an diesem system ist zunächst einmal, dass wir wissen, dass die
00:24:04.00 Proteine, die wir markieren, sind aktiv, weil 1) sie die einzige Kopie von sind
00:24:08.09 das Protein in der Zelle und wir markieren nur essentielle Proteine.
00:24:14.29 Viele der Proteine ​​im Spleißosom sind essentiell, also wissen wir
00:24:20.07 Wenn die Zellen wachsen, weil Spleißen wichtig ist, dann dieses Protein
00:24:24.06 muss aktiv sein. Zweitens gibt es absolut keine Proteinrekonstitution
00:24:29.04 erforderlich, also stellen wir keine rekombinanten Proteine ​​her und reinigen sie
00:24:32.25 und setzen sie wieder ein. Wir verwenden die körpereigenen Proteine. Wir gerade
00:24:36.08 hat dem Ding ein kleines Protein-Tag hinzugefügt. Schauen wir uns nun an, wie diese
00:24:43.03 Experimente gehen. Also werden wir unsere prä-mRNA haben
00:24:50.18, die über dieses Biotin-Streptavidin-Sandwich an der Oberfläche befestigt ist.
00:24:54.12 Es enthält ein Fluorophor, damit wir verfolgen können, wo sich die Prä-mRNA befindet
00:24:58.24 Moleküle sind. Und das ist eigentlich ein Blick durch das Mikroskop von
00:25:04.09 wie ein Feld dieser prä-mRNAs aussieht, wo jeder dieser Flecken
00:25:08.21 ist ein einzelnes prä-mRNA-Molekül. Und in den Filmen werde ich zeigen
00:25:15.11 Wir werden uns die Bindung von U1 snRNP an diese Prä-mRNAs ansehen
00:25:21.20 im Zeitverlauf bei Spleißreaktionen. Eines der Dinge über einzelne Moleküle
00:25:27.09 Reaktion ist, dass du wirklich alles siehst, was vor sich geht--
00:25:36.11 alles, was fluoreszierend ist, jede Art von Staub oder alles, was du sehen kannst,
00:25:41.01 Sie müssen also wirklich viele Kontrollen durchführen, um sicherzustellen, dass Sie wissen, was
00:25:44.21 Sie sehen. Also das erste, was ich dir zeige, ist ein Film
00:25:48.19 wo wir einige Kontrollen machen, wo wir entweder aufgehört haben
00:25:54.13 fluoreszierende RNA, oder wir haben die Tags auf U1 snRNP nicht (und wir
00:26:00.28 würde kein Signal erwarten) oder wir haben die komplette Reaktion, wo wir
00:26:04.19 haben die fluoreszenzmarkierte RNA und die fluoreszenzmarkierte snRNP.
00:26:09.07 Also schauen wir uns den Film an. Dieser Film zeigt zwei Kontrollsichtfelder
00:26:19.21 und dann rechts ein experimentelles Sichtfeld. Das Sichtfeld
00:26:24.28 ganz links ist die Wildtyp-Prä-mRNA vorhanden.
00:26:31.21 Wir können das in diesem Sichtfeld nicht sehen, weil wir nicht hineinschauen
00:26:35.13 Kanal. Wir betrachten den Cy3-Kanal, den TMP-Kanal.
00:26:39.18 Und wir haben auch das Cy3-TMP im Auszug, aber es gibt kein Tagged
00:26:44.05 Protein. Sie können also sehen, dass wir ein wenig Hintergrund mit haben
00:26:48.07 Material bindet sich unspezifisch an die Folie und deshalb ist es wichtig
00:26:55.07, um diese Kontrollen durchzuführen, um sicherzustellen, dass Ihr Hintergrund nicht zu hoch ist.
00:26:59.06 Im mittleren Panel haben wir jetzt das markierte U1 und das Cy3-TMP
00:27:07.24 aber wir haben keine prä-mRNA auf der Folie, also sehen wir wieder nur
00:27:11.26 Hintergrundbindung. Und dann im Panel ganz rechts, welches das ist
00:27:16.14 mit all den blinkenden Lichtern haben wir alle drei Komponenten. Also haben wir
00:27:21.05 mit U1 markiert. Wir haben die Prä-mRNA auf der Oberfläche und wir haben Cy3-TMP.
00:27:28.11 Eine Sache, die Sie sofort sehen können, ist die U1-Interaktion
00:27:35.03 mit den RNAs ist hochdynamisch. Also auch in Abwesenheit von ATP, U1
00:27:40.27 bindet und gibt mehrere Male von jeder Prä-mRNA ab. Jetzt wo wir
00:27:48.28 Wenn wir wissen, dass unser System funktioniert, machen wir wirklich ein paar Experimente. Und der
00:27:53.09 Die wirklich coole Sache an diesen Experimenten ist, dass man sie einfach sehen kann
00:27:58.09 die Antwort mit deinen Augen. Also zeige ich dir ein paar Filme
00:28:04.15 als nächstes, wo wir zwei fluoreszierende Markierungen an jedem der Hauptunterkomplexe angebracht haben
00:28:10.00 In einem Auszug, in einem Quadranten sehen Sie also einen Auszug, der
00:28:16.08 hat Markierungen auf U1 snRNP, wie Sie bereits auf zwei verschiedenen Proteinen gesehen haben.
00:28:20.25 Dann haben wir einen weiteren Auszug mit Labels auf U2 snRNP, auf der U5-Komponente
00:28:26.21 des Triple-snRNP und auch auf dem NineTeen-Komplex. Und in diesem ersten Satz von
00:28:34.12 Filme werden wir kein ATP haben, also in Abwesenheit von ATP
00:28:40.27 Wir wissen aus den Studien zu Gelen, dass der einzige Komplex, der
00:28:49.15 Form ist dieser E-Komplex, also sollte nur U1 stabil mit U1 interagieren können
00:28:55.02 die RNA. Sehen wir uns jetzt an, ob das der Fall ist.
00:29:02.22 Hier ist ein Film, der vier verschiedene Ausschnitte mit einem anderen snRNP zeigt
00:29:11.02 in jedem Auszug beschriftet - entweder U1 in der oberen linken Ecke, das dreifache snRNP
00:29:17.27 in der unteren linken Ecke, U2 in der oberen rechten Ecke oder die
00:29:22.06 NTC in der unteren rechten Ecke. Und in Abwesenheit von ATP, was?
00:29:28.05 man sieht wie wir in den vorherigen Filmen gesehen haben, dass U1 kommt und bindet
00:29:34.18 reversibel, aber für alle anderen snRNPs sehen wir keine signifikante Bindung
00:29:41.04 über dem Hintergrund. Wenn wir die Daten aus jedem dieser Sichtfelder nehmen
00:29:46.26 und zähle einfach die Anzahl der Spots im Laufe der Zeit – die Gesamtanzahl der Spots
00:29:53.20 im Laufe der Zeit – was Sie sehen können, ist, dass in Abwesenheit von ATP nur U1
00:29:58.27 baut sich auf. Und keiner der anderen snRNPs oder der NTC hat wirklich viel
00:30:05.07 Belegung zu einem beliebigen Zeitpunkt in Abwesenheit von ATP. Also lass uns jetzt laufen
00:30:12.16 ganzen Spleißosomenzyklus, also werden wir jetzt ATP hinzufügen und sehen, was passiert.
00:30:19.17 Dieser Film ist jetzt in der gleichen Reihenfolge wie zuvor, aber jetzt haben wir ATP hinzugefügt
00:30:25.19 zur Reaktion. Und wenn Sie ganz genau hinschauen, können Sie die
00:30:32.06 scheinbare Reihenfolge der Addition der snRNPs. So früh im Film,
00:30:37.03 und der Film wiederholt sich ständig, man sieht, dass U1 bindend ist
00:30:42.10 und Kommen und Gehen. Das nächste aufzubauende snRNP ist U2 und dann
00:30:52.02 nach U2 sehen wir U4, 5 und 6 kommen. Und dann der NTC, wir
00:30:59.10 sehen weniger davon, aber es sammelt sich viel später in der Reaktion an.
00:31:03.24 Was Sie in diesem Film also sehen können, ist, dass wir in Echtzeit sehen können
00:31:12.04 alle vier dieser snRNPs binden an die mit . bedeckte Oberfläche
00:31:16.22 prä-mRNA-Moleküle. Und wie ich Ihnen auf der nächsten Folie zeigen werde, können wir sehen
00:31:23.10, dass alle snRNPs dynamisch binden – das heißt, sie kommen
00:31:27.08 und gehen, dass keiner von ihnen kommt und dauerhaft bleibt.
00:31:32.07 Eines der Dinge, die man in diesen Filmen sehen kann, ist, dass wir nicht nur können
00:31:37.18 sehen, dass alle snRNPs in Gegenwart von ATP binden, aber anders als
00:31:42.11 der Spleißosomenzyklus, den ich dir zuvor mit all den Einwegpfeilen gezeigt habe,
00:31:47.12 alle snRNPs binden reversibel. Und wir können das sehen, indem wir uns hier ansehen
00:31:52.24 ein einzelnes RNA-Molekül, und dafür schauen wir uns nur die Intensität im Zeitverlauf an
00:32:00.07 ein RNA-Molekül und Sie können für U1 sehen, dass es zweimal gebunden hat. Hier ist eine RNA
00:32:05.16 Molekül, an dem zwei Moleküle von U2 gebunden sind, U5 und das NTC. Der Grund
00:32:11.08 wir sehen nicht nur oft zwei verbindliche Ereignisse speziell für U1, wir werden
00:32:16.00 sehen Sie drei, manchmal bis zu zehn verbindliche Ereignisse. Der Grund, den wir zeigen
00:32:21.19 diese besonderen Spuren zeigen Ihnen, dass diese Bindung reversibel ist
00:32:27.09 bindend und nicht aufgrund von Photobleaching. Photobleaching ist also immer ein Problem
00:32:31.08 in diesen Einzelmolekülreaktionen, weil unter dem intensiven Laserlicht
00:32:36.09 die Farbstoffe können oft photobleichen und dann werden sie leer und dann wenn
00:32:41.04 das Signal verschwindet, du weißt nicht, ob es daran liegt, dass dein Komplex es hat
00:32:44.13 aus der evaneszenten Welle gegangen oder dein Farbstoff ist photogebleicht. Das ist also
00:32:49.02 warum wir jedem snRNP zwei verschiedene Fluorophore beigefügt haben, weil
00:32:53.13 Wenn wir das Schrittverhalten sehen, liegt dies entweder an der Farbstofffreisetzung
00:32:58.27, weil wir das DHFR-Tag verwenden oder es aufgrund von Photobleaching ist. Aber das
00:33:03.26 bedeutet, dass dieses Molekül, das in einem Schritt verschwunden ist, wirklich ein
00:33:08.26 Molekül, das verschwunden ist. Der ganze Komplex ging weg. Denn es ist sehr
00:33:14.28 unwahrscheinlich, dass Sie zwei oder zwei Photobleaching-Schritte gleichzeitig haben
00:33:20.02 gleichzeitige Färbeschritte. Und du kannst auch sehen, dass es weg war und dann
00:33:27.28 ein anderer kam zurück. Dies ist also wieder eine der Kontrollen, die
00:33:32.13 müssen Sie tun, wenn Sie Einzelmolekülexperimente durchführen. In Ordung
00:33:36.14 Also denken wir zurück an diese Filme, wenn wir die Gesamtzahl der
00:33:41.16 Punkte in jedem Frame und zeichne einfach diese Zahl hier ein, und das wäre die
00:33:46,19 Anzahl Farbstoffe pro prä-mRNA-Molekül. Sie können jetzt im sehen
00:33:51.02 Präsenz von ATP U1 baut sich zuerst auf, dann U2, dann U5 und dann der NTC
00:33:58.11 danach. Dies gibt uns also einen scheinbar geordneten Prozess für das Spleißosom
00:34:04.05 Versammlung, und es stimmt damit überein. Aber es sagt uns eigentlich nichts
00:34:09.13 ein Molekül, dass die Spleißosomenanordnung bestellt wurde. Aber wir können
00:34:15.14 testen Sie das direkt mit unseren Einzelmolekülmethoden, indem Sie einfach folgen
00:34:20.07 zwei snRNPs gleichzeitig. Also machen wir jetzt Dreifarbenexperimente.
00:34:24.04 Also eine Farbe auf der Prä-mRNA, eine Farbe auf – in diesem Fall – U2 snRNP,
00:34:30.25 und eine andere Farbe auf U1. Und im gleichen Experiment, indem Sie sich diese snRNPs ansehen
00:34:36.13 gleichzeitig können wir sehen, kommt U1 zuerst oder kommt U2 zuerst?
00:34:43.25 Und so sehen diese Daten aus. Also hier ist wieder einer davon
00:34:48.22 einzelne Einzelmolekülspuren, aber dies ist ein Prä-mRNA-Molekül, bei dem
00:34:53.06 U1 und U2 kamen zu derselben prä-mRNA im selben Extrakt. Und du kannst sehen
00:34:59.22 ganz klar, dass U1 zuerst kam und dann U2. Aber wir können dies quantifizieren durch
00:35:07.26 die Pünktlichkeit von U2 und U1 messen und diese Differenz nehmen,
00:35:14.00 die Ankunftszeit von U2 minus die Ankunftszeit von U1 und das ist die
00:35:20.10 Verzögerungszeit zwischen den beiden. Wenn diese Zahl also positiv ist, bedeutet das
00:35:24.24 U2 kam nach U1. Wenn diese Zahl negativ ist, bedeutet dies, dass U2 vor U1 kam.
00:35:32.08 Und dann können wir diese Zahl über viele verschiedene prä-mRNA-Moleküle hinweg betrachten.
00:35:38.08 Das ist also ein sogenanntes Wahrscheinlichkeitsdichtediagramm. Es ist ein Balkendiagramm, in dem die Wahrscheinlichkeit
00:35:45.22 Dichte ist die Bin-Höhe geteilt durch die Bin-Breite. Das Wichtigste zu sehen
00:35:51.16 ist, dass wir hier 82 verschiedene Moleküle betrachten und das fast alle
00:35:55.20 hatte eine positive Zahl für dieses tU2 minus tU1. Das heißt also fast
00:36:02.20 alle, U2 kam nach U1. Jetzt gab es hier ein paar wo U2
00:36:08.18 kam anscheinend zuerst, aber das würde mit der Menge vereinbar sein
00:36:15.16 Kennzeichnung unserer Extrakte, da wir keine 100%ige Kennzeichnung bekommen.
00:36:20.11 Es ist unmöglich, ohne dass unsere Extrakte sterben. Wir haben also etwa 90%
00:36:27.05 Etikettierungseffizienz in unseren Extrakten, und dieser Wert wäre konsistent mit
00:36:31.15 eine dunkle U1 kommt vor U2. Es steht also nicht im Widerspruch zu einem bestellten Modell.
00:36:39.22 Also haben wir das für alle Komplexpaare gemacht. Hier ist U2 gegen
00:36:46.28 U1. Dies ist ein weiterer Datensatz mit jetzt 111 Molekülen. Hier ist U5
00:36:52.05 gegen U2, und hier ist der NTC gegen U5.Und Sie können all dies sehen,
00:36:57.27 die meisten Ereignisse geben Ihnen eine positive Zahl, daher die
00:37:04.21 Der zweite Komplex kam nach dem ersten Komplex. Und das führt uns zu
00:37:11.24 kommen zu dem Schluss, dass für diese spezielle prä-mRNA, mit der wir gearbeitet haben
00:37:17.07 (und das ist RP51A – es ist ein Modell-Spleißsubstrat in Hefe), es ist ein hoch
00:37:22.29 geordneter Montageweg mit U1 fast immer vor U2 und
00:37:31.19 dann der dreifache snRNP und danach kommt der NTC. Aber was wir jetzt wissen
00:37:37.07 das ist neu, was wir vorher nicht wussten, dass jeder Schritt auf diesem Weg ist
00:37:42.11 ist reversibel. Das bedeutet also, dass die Prä-mRNA nicht unbedingt
00:37:52.21 verpflichtet, im allerersten Schritt mit U1-Zusatz zu spleißen, aber das
00:37:58.17 es wird immer fester, wenn du durch das Spleißosom gehst
00:38:03.00 Montagepfad. Auch im Hinblick auf alternatives Spleißen im menschlichen System
00:38:08.20 wenn das Spleißosom zerlegt werden kann, zum Beispiel hier an späteren Stellen,
00:38:15.06 dann können Sie sich vorstellen, das Spleißen an bestimmten Spleißstellen zu hemmen
00:38:19.02 irgendwo auf diesem Weg, weil er entlang des Weges rückwärts gehen könnte
00:38:23.14 Pfad, wenn er gehemmt ist. Das hat also wichtige Auswirkungen auf unser Verständnis
00:38:27.24 alternatives Spleißen. Schließlich muss ich den Leuten danken, die es tatsächlich getan haben
00:38:32.13 die Arbeit. Und offensichtlich brauchte alles, was so kompliziert war, den Input vieler
00:38:39.07 verschiedene Leute. Und so habe ich dir heute aus meinem Labor Daten von Melissa gezeigt,
00:38:46.28 Aaron, Danny, Eric, Jing und Nick haben dazu beigetragen. Auch all diese Arbeiten wurden in
00:38:53.28 Zusammenarbeit mit dem Labor von Jeff Gelles, das die CoSMos entwickelt hat
00:38:57.10 Technologie, insbesondere Larry und Alex. Und dann auch noch die Cornish
00:39:03.24 Labor, das die DHFR-Markierungstechnik entwickelt hat, und schließlich die
00:39:08.23 New England Biolabs für ihre Hilfe mit dem SNAP-Tag. Und diese Arbeit war
00:39:14.09 finanziert von HHMI und den National Institutes of Health. Vielen Dank.
00:39:22.07

  • Teil 1: Gespaltene Gene und RNA-Spleißen

Variabilität von Zelle zu Zelle beim alternativen RNA-Spleißen

*Korrespondierender Autor. Abteilung für Systembiologie, Harvard Medical School, 200 Longwood Ave. WAB 536, Boston, MA 02115, USA. Tel.: +1 617 432 6401 Fax: +1 617 432 5012 E-Mail: [email protected]

Die Heterogenität der Expressionsniveaus von Säugetiergenen ist selbst in klonalen Populationen groß und hat phänotypische Konsequenzen. Alternatives Spleißen ist ein grundlegender Aspekt der Genexpression, sein Beitrag zur Heterogenität ist jedoch unbekannt. Hier verwenden wir Einzelmolekül-Bildgebung, um die Variabilität von Zelle zu Zelle in mRNA-Isoform-Verhältnissen für zwei endogene Gene, CAPRIN1 und MKNK2, zu charakterisieren. Wir zeigen, dass die Isoformvariabilität in nicht-transformierten, diploiden Zellen bemerkenswert nahe am minimal möglichen ist, wenn man die stochastische Natur einzelner Spleißereignisse berücksichtigt, während die Variabilität in HeLa-Zellen erheblich höher ist. Eine Analyse der potentiellen Quellen der Isoformverhältnis-Heterogenität zeigt, dass ein Unterschied in der Kontrolle der Spleißfaktor-Aktivität ein Grund für diesen Anstieg ist. Unser bildgebender Ansatz visualisiert auch nicht alternativ gespleißte mRNA und aktive Transkriptionsstellen und liefert räumliche Informationen über die Beziehung zwischen Spleißen und Transkription. Zusammen zeigt unsere Arbeit, dass Säugerzellen Schwankungen in den mRNA-Isoformverhältnissen minimieren, indem sie die Spleißmaschinerie streng regulieren.

Zusammenfassung

Die Rolle der mRNA-Prozessierung bei der Variabilität der Genexpression ist wenig charakterisiert. Diese Studie untersucht das Ausmaß der Zell-zu-Zell-Variabilität des alternativen RNA-Spleißens in Säugerzellen unter Verwendung der Einzelmolekül-Bildgebung von CAPRIN1- und MKNK2-Spleißisoformen.

Die biologische Genexpression ist ein komplexer Prozess, der Transkription, mRNA-Prozessierung und Translation umfasst. Da die Genexpression ein grundlegender Aspekt des biologischen Verhaltens ist, ist eine zentrale Frage innerhalb der Molekular- und Zellbiologie, wie effektiv Zellen die Häufigkeit ihrer Genexpressionsprodukte mRNA und Protein kontrollieren.

Frühere experimentelle und theoretische Studien haben gezeigt, dass es selbst zwischen genetisch identischen Zellen, die unter einheitlichen Bedingungen gezüchtet wurden, erhebliche Variationen von Zelle zu Zelle in der Genexpression geben kann. Es wurde gezeigt, dass diese Variation in einer Vielzahl von biologischen Kontexten wie Entwicklung, Virologie, Funktion des Immunsystems und Krebsbehandlung wichtig ist. Es wurde gezeigt, dass eine Hauptursache für die Variabilität das transkriptionelle Bursting ist, oder der Prozess, bei dem Gene sporadisch exprimiert werden, getrennt durch lange Dauer der Inexpression. Da die biochemischen Reaktionen, die die Genexpression steuern, oft durch molekulare Spezies vermittelt werden, die in geringer Zahl vorhanden sind, kann außerdem eine Variabilität durch stochastische Effekte aufgrund der zufälligen Wahrscheinlichkeit entstehen, dass eine einzelne biochemische Reaktion auftritt.

Die Rolle der mRNA-Prozessierung bei der Variabilität der Genexpression wurde nicht gründlich untersucht, insbesondere im Hinblick auf alternatives Spleißen. Alternatives RNA-Spleißen ist eine Form der mRNA-Prozessierung, die zur Synthese mehrerer verschiedener mRNAs aus einem einzigen Gen führt. Dabei enthält die naszierende mRNA (Prä-mRNA) eines Gens Sequenzen, sogenannte Introns, die in verschiedenen Kombinationen ausgeschnitten werden können, um mehrere Genprodukte, sogenannte Isoformen, zu erzeugen. Da alternatives Spleißen in der überwiegenden Mehrheit der menschlichen Gene auftritt, stellt es eine potenziell Hauptquelle für die Variabilität von Zelle zu Zelle in der Genexpression dar.

In dieser Studie versuchten wir, das Ausmaß der Variabilität von Zelle zu Zelle zu charakterisieren, die durch alternatives RNA-Spleißen entsteht. Dazu haben wir einen Einzelmolekül-Imaging-Ansatz verwendet, der auf fluoreszierenden vor Ort Hybridisierung zur Untersuchung der Zell-zu-Zell-Variabilität der Isoformverhältnisse von zwei Genen, CAPRIN1 und MKNK2, die jeweils zwei Spleißisoformen enthalten (Abbildung 2 aus dem Manuskript). Unter Verwendung einer klonal abgeleiteten, diploiden, nicht transformierten Zelllinie (Rpe1-Zellen – retinale Pigmentepithelzellen) fanden wir heraus, dass die Variabilität angesichts der wahrscheinlichkeitstheoretischen Wahrscheinlichkeit einzelner Spleißereignisse bemerkenswert nahe am Minimum liegt. Im Gegensatz dazu fanden wir, dass die Variabilität des Isoformverhältnisses in klonal abgeleiteten HeLa-Zellen, einer Krebszelllinie mit einem instabilen Karyotyp, wesentlich größer war. Um die Unterschiede zwischen den beiden Zelllinien zu erklären, untersuchten wir weiter die möglichen Ursachen der Variabilität des Isoformverhältnisses. Wir untersuchten zunächst mehrere bekannte Quellen der mRNA-Variabilität, wie zum Beispiel das transkriptionale Bursting, stellten jedoch fest, dass sie nicht signifikant zum Unterschied zwischen Zelllinien beitrugen. Als wir jedoch die Rolle von Spleißfaktoren bei der Kontrolle der Variabilität von Zelle zu Zelle untersuchten, stellten wir fest, dass eine geringere Kontrolle über die Regulierung des alternativen Spleißens wahrscheinlich die Hauptursache für diesen Unterschied ist.

Die Variabilität der Genexpression von Zelle zu Zelle durch alternatives Spleißen ist ein unvermeidliches Merkmal der Biologie. Da gespleißte Isoformen unterschiedliche und sogar gegensätzliche zelluläre Funktionen haben können, wäre es interessant zu sehen, ob eine solche Variabilität phänotypische Konsequenzen in verschiedenen biologischen Umgebungen haben kann. Wir gehen davon aus, dass zukünftige Arbeiten Aufschluss über das Ausmaß der Variabilität von Zelle zu Zelle beim alternativen Spleißen für zusätzliche Gene geben und möglicherweise Splicing-Ereignisse identifizieren werden, bei denen Heterogenität eine wichtige funktionelle Rolle spielt.