Information

15.2: Methoden zur Messung der Genexpression - Biologie

15.2: Methoden zur Messung der Genexpression - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Der intuitivste Weg, einen bestimmten Phänotyp zu untersuchen, besteht darin, die Expressionsniveaus von funktionellen Proteinen zu messen, die zu einem bestimmten Zeitpunkt in der Zelle vorhanden sind. In diesem Kapitel betrachten wir zwei Techniken zur Generierung von Genexpressionsdaten: Microarrays und RNA-seq.

Mikroarrays

Microarrays ermöglichen die Analyse der Expressionsniveaus von Tausenden von vorselektierten Genen in einem Experiment. Das Grundprinzip von Microarrays ist die Hybridisierung komplementärer DNA-Fragmente. Zunächst werden kurze DNA-Abschnitte, sogenannte Sonden, an einer festen Oberfläche befestigt, die allgemein als Genchip bekannt ist. Dann wird die interessierende RNA-Population, die einer Zelle entnommen wurde, mittels reverser Transkriptase, die DNA aus RNA unter Verwendung des Poly-A-Schwanzes als Primer synthetisiert, in cDNA (komplementäre DNA) revers transkribiert. Für intergene Sequenzen, die keinen Poly-A-Schwanz aufweisen, kann ein Standardprimer an die Enden der mRNA ligiert werden. Die resultierende DNA weist mehr Komplementarität zur DNA auf dem Objektträger auf als die RNA. Die cDNA wird dann über den Chip gewaschen und die resultierende Hybridisierung löst die Fluoreszenz der Sonden aus. Dies kann nachgewiesen werden, um die relative Häufigkeit der mRNA im Ziel zu bestimmen, wie in Abbildung 15.2 dargestellt.

Derzeit werden zwei Grundtypen von Mikroarrays verwendet. Affymetrix-Genchips haben einen Platz für jedes Gen und haben längere Sonden in der Größenordnung von 100 Nukleotiden. Auf der anderen Seite kacheln gefleckte Oligonukleotid-Arrays Gene und haben kürzere Sonden um die Dutzende von Basen.

Es gibt zahlreiche Fehlerquellen in den aktuellen Verfahren und zukünftige Verfahren versuchen, Schritte im Prozess zu beseitigen. Reverse Transkriptase kann zum Beispiel Fehlpaarungen einführen, die die Interaktion mit der richtigen Sonde schwächen oder Kreuzhybridisierung verursachen oder an mehrere Sonden binden. Eine Lösung hierfür war die Verwendung mehrerer Sonden pro Gen, da die Kreuzhybridisierung für jedes Gen unterschiedlich sein wird. Aufgrund der Sekundärstruktur der RNA ist jedoch eine reverse Transkription erforderlich. Die strukturelle Stabilität der DNA macht es weniger wahrscheinlich, dass sie sich verbiegt und nicht an die Sonde hybridisiert. Die nächste Generation von Technologien wie RNA-Seq sequenziert die RNA, wenn sie aus der Zelle kommt, und untersucht im Wesentlichen jede Base des Genoms.

RNA-seq

RNA-Seq, auch bekannt als Whole-Transkriptom-Shotgun-Sequenzierung, versucht, die gleiche Funktion zu erfüllen, die in der Vergangenheit mit DNA-Mikroarrays ausgeführt wurde, jedoch mit höherer Auflösung. Insbesondere verwenden DNA-Mikroarrays spezifische Sonden, und die Erzeugung dieser Sonden hängt notwendigerweise von der Vorkenntnis des Genoms und der Größe des hergestellten Arrays ab. RNA-seq beseitigt diese Einschränkungen durch einfaches Sequenzieren der gesamten cDNA, die in Microarray-Experimenten hergestellt wurde. Möglich wird dies durch die Sequenzierungstechnologie der nächsten Generation. Die Technik wurde schnell in Studien zu Krankheiten wie Krebs eingesetzt [4]. Die Daten von RNA-seq werden dann durch Clustering auf dieselbe Weise analysiert, wie normalerweise Daten von Microarrays analysiert würden.

Genexpressionsmatrizen

Microarrays und RNA-seq werden häufig verwendet, um die Genexpressionsprofile von Zellen unter verschiedenen Bedingungen zu vergleichen. Die Datenmengen, die aus diesen Experimenten generiert werden, sind enorm. Microarrays können Tausende von Genen analysieren und RNA-seq kann im Prinzip jedes aktiv exprimierte Gen analysieren. Das Expressionsniveau jedes dieser Gene wird unter einer Vielzahl von Bedingungen gemessen, einschließlich Zeitverläufen, Entwicklungsstadien, Phänotypen, gesund vs. krank und anderen Faktoren.

Um zu verstehen, was die Heatmap einer Genexpressionsmatrix (Abbildung 15.4) aussagt, müssen wir zunächst verstehen, was uns die Expressionsdatenmatrix sagt. Durch die Verwendung von Microarrays und RNA-seq können wir in einem Experiment das Ausmaß der Genexpression in quantitativer Form erhalten. Wenn wir mehrere Experimente haben, können wir eine Wertematrix (Abbildung 15.5) erstellen, die einen logarithmischen Wert von (T/R) darstellt, wobei T das Genexpressionsniveau in der Testprobe und R das Genexpressionsniveau in der Referenzprobe ist.

Die Expression Matrix wurde aufgrund von Urheberrechtsbeschränkungen entfernt.

Abbildung 15.4: Transformieren von Abbildung 4 in eine Heatmap
Wenn wir die Matrix als Heatmap visualisieren, erhalten wir folgende neue Farbmatrix:

Diese Matrizen können hierarchisch gruppiert werden, um die Beziehung zwischen Genpaaren, Paaren von Paaren usw. zu zeigen, wodurch ein Dendrogramm erstellt wird, in dem die Zeilen und Spalten unter Verwendung optimaler Blattordnungsalgorithmen geordnet werden können.

Bild im öffentlichen Bereich. Dieser Graph wurde mit dem Programm Cluster von Michael Eisen erstellt, das unter rana.lbl.gov/EisenSoftware.htm erhältlich ist, mit Daten, die aus der StemBase-Datenbank der Genexpressionsdaten extrahiert wurden.

Indem wir die verborgene Struktur eines langen Genomsegments aufdecken, erhalten wir einen guten Einblick in die Funktion eines Genfragments und verstehen anschließend mehr über die Ursache einer unbekannten Krankheit.

Diese prädiktive und analytische Kraft wird durch die Fähigkeit der Datenbündelung erhöht; das heißt, Clustern entlang beider Dimensionen der Matrix. Die Matrix ermöglicht den Vergleich von Expressionsprofilen von Genen sowie den Vergleich der Ähnlichkeit verschiedener Zustände wie Krankheiten. Eine Herausforderung ist jedoch der Fluch der Dimensionalität. Mit zunehmendem Datenraum nimmt die Clusterbildung der Punkte ab. Manchmal können die Daten auf niederdimensionale Räume reduziert werden, um mithilfe von Clustering eine Struktur in den Daten zu finden, um anhand der Nähe abzuleiten, welche Punkte zusammengehören.

Auch die Interpretation der Daten kann eine Herausforderung darstellen, da möglicherweise andere biologische Phänomene im Spiel sind. Protein-kodierende Exons haben beispielsweise eine höhere Intensität, da Introns schnell abgebaut werden. Gleichzeitig sind nicht alle Introns Schrott und es kann zu Mehrdeutigkeiten beim alternativen Spleißen kommen. Es gibt auch zelluläre Mechanismen, die aberrante Transkripte durch non-sense-vermittelten Zerfall abbauen.


Auswahl und Validierung von Referenzgenen zur Messung der Genexpression in Toona ciliata unter verschiedenen experimentellen Bedingungen durch quantitative Echtzeit-PCR-Analyse

Bevor die Genexpression verschiedener Organismen untersucht wird, ist es wichtig, das beste Referenzgen zu bestimmen. Die derzeit genaueste Methode zum Nachweis der Genexpression ist die quantitative Real-Time-PCR (RT-qPCR). Mit dieser Methode können Referenzgene gewonnen werden, die in unterschiedlichen biologischen Systemen und unter unterschiedlichen Bedingungen stabil sind. Toona ciliata Rom (T. ciliata). ist eine wertvolle und schnell wachsende Holzart. In dieser Studie wurden 20 Referenzgene mittels RT-qPCR als primäre Voraussetzung für zukünftige Genexpressionsanalysen identifiziert. Vier verschiedene Methoden, geNorm, NormFinder, BestKeeper und RankAggreg, wurden verwendet, um die Expressionsstabilität der 20 Kandidaten-Referenzgene in verschiedenen Geweben unter verschiedenen Bedingungen zu bewerten.

Ergebnisse

Die experimentellen Ergebnisse zeigten, dass TUB-α war das am stabilsten exprimierte Referenzgen in allen Proben und UBC17 war am stabilsten in Blättern und jungen Stängeln unter Hypsipyla robusta (H. robusta) und Methyljasmonat (MeJA)-Behandlungen. Zusätzlich, PP2C59 und UBC5B waren die leistungsstärksten Gene in Blättern unter H. robusta Behandlung, während HIS1 und AKT7 waren die besten Referenzgene in jungen Stämmen. Die beiden besten Referenzgene waren 60S-18 und TUB-α nach der Behandlung bei 4 °C. Der Ausdruck von HIS6 und MUB1 war unter PEG6000-Behandlung am stabilsten. Die Richtigkeit der ausgewählten Referenzgene wurde mit dem Transkriptionsfaktor MYB3 (TcMYB3) Gen.

Schlussfolgerungen

Dies ist der erste Bericht, der die besten Referenzgene für die Normalisierung der Genexpression in T. ciliata unter verschiedenen Bedingungen, was die zukünftige Aufklärung der Genregulation bei dieser Art erleichtern wird.


Das Hauptprodukt von Protein-kodierenden Genen sind mRNAs. Wenn wir über die Messung der Genexpression sprechen, wollen wir die Steady-State-Spiegel einer bestimmten mRNA innerhalb einer Zelle untersuchen. Dies wird normalerweise erreicht, indem mit einer großen Anzahl von Zellen begonnen und alle mRNAs aus allen Zellen geerntet werden. Eine Möglichkeit, das Expressionsniveau nur der mRNA eines Gens zu messen, besteht darin, einen Northern Blot durchzuführen. Andere sensitive Verfahren umfassen: einen S1-Nuklease-Schutz-Assay, einen RNAse-Schutz-Assay und einen Primer-Extension-Assay.

Microarrays wurden auch ausgiebig verwendet, um die Expressionsniveaus von Tausenden von Genen gleichzeitig in einem einzigen Experiment zu messen.

Mit dem Aufkommen der RNA-Seq-Methodik ist es möglich, die Anzahl der Transkripte in einem Experiment zu zählen (wenn Sie ein sequenziertes Referenzgenom haben)

Laut Daten der nächsten Generation:

Ich habe nie direkt mit mRNA gearbeitet, aber was ich vom Bioinformatiker bekommen habe, war ungefähr so: Sie extrahieren Ihre mRNA, sequenzieren sie, filtern sie nach Qualität & Länge, bauen sie zusammen und was Sie dann haben, sind so etwas wie "Transkripte". Diese zählen Sie: xy von Transkript1 & yx von Transkript2. Du suchst weiter nach Isoformen und korrigierst am Ende diese Zählungen nach den von dir berechneten anfänglichen Reads. Wenn Sie die Transkripte mit einer Kontrolle vergleichen, können Sie messen, ob sie hoch- oder herunterreguliert ist (das Setzen der Reads der Kontrolle auf "Null", wie 1234 Reads eines Transkripts sind normal. In Probe 2 haben Sie 5000 Reads dieses Transkripts. Das Gen scheint . zu sein hochreguliert). Soweit ich weiß, ist dies ungefähr die Art und Weise, wie Genexpressions-Approximationen / -Quantifizierungen vorgenommen werden.


Technik zur Messung der Expressionsdynamik jedes Gens in einer einzelnen Zelle

Allon M. Klein ist am Department of Systems Biology, Harvard Medical School, Boston, Massachusetts 02115, USA tätig.

Sie können auch in PubMed Google Scholar nach diesem Autor suchen

Um komplexe Systeme zu verstehen und zu beherrschen, müssen wir die Dynamik ihrer Bestandteile messen können. In der Biologie ist die Genexpression wahrscheinlich das ultimative Beispiel für ein komplexes System mit mehr als 20.000 Genen, die die Funktionen von menschlichem Gewebe orchestrieren. Uns fehlen jedoch die Werkzeuge, um zu messen, wie sich die Expression von Genen in einzelnen Zellen im Laufe der Zeit verändert. In einem Papier in Natur, La Manno et al. 1 beschreiben eine leistungsfähige Methode, die es ermöglicht, das Ausmaß und die Rate der Expressionsänderung gleichzeitig für jedes Gen in einer einzelnen Zelle abzuschätzen. Der Ansatz hat erhebliche Auswirkungen auf die Untersuchung der Zelldynamik, insbesondere im Krankheitsverlauf und in komplexen Prozessen wie der Embryonalentwicklung.

Lesen Sie das Papier: RNA-Geschwindigkeit einzelner Zellen

Biologen stehen vor einem operativen Problem, wenn sie versuchen, die dynamischen Veränderungen der Genexpression zu verstehen, die auftreten, wenn Zellen altern, sich differenzieren oder erkranken. Einerseits beinhalten Techniken, die es Forschern ermöglichen, die Expression aller Gene in einer bestimmten Zelle umfassend zu messen, die Zerstörung der interessierenden Zelle. Dies verhindert eine zeitliche Analyse und liefert daher nur eine Momentaufnahme der Genexpression. Andererseits können Techniken, die eine Langzeitmessung der Genexpression in lebenden Zellen ermöglichen, verwendet werden, um nur eine begrenzte Anzahl von Genen zu verfolgen 2 .

Meine Gruppe und viele andere haben zuvor versucht, die Expressionsdynamik aller Gene in einer Zelle aus destruktiven Messungen einzelner Zellen abzuleiten, indem sie Schnappschussmessungen in kontinuierliche „Trajektorien“ organisierten, die die Expressionsdynamik annähern. Da jedoch verschiedene Genexpressionsdynamiken zu denselben Schnappschüssen führen können, können selbst die ausgefeiltesten Algorithmen falsche Ergebnisse liefern 3 .

La Manno et al. dieses operative Problem teilweise überwunden, indem sie erkannten, dass bestehende Momentaufnahmen der Genexpression tatsächlich echte dynamische Informationen liefern können. Die Autoren analysierten Daten, die durch Einzelzell-RNA-Sequenzierung generiert wurden. Dieser Ansatz wird typischerweise verwendet, um die Häufigkeit von Messenger-RNA-Transkripten für jedes Gen in jeder Zelle einer Probe zu messen. Die Forscher zeigten aber, dass diese RNA-Sequenzen auch Aufschluss darüber geben, ob die Expression jedes einzelnen Gens zum Zeitpunkt der Messung zu- oder abnimmt.

La Manno et al. nutzten die Tatsache aus, dass frisch transkribierte mRNA Segmente enthält, die später bei der Bildung reifer mRNA herausgeschnitten (gespleißt) werden. Bei einem stabil exprimierten Gen liegt immer ein kleiner Teil seiner mRNA in der unreifen, ungespleißten Form vor, da ältere Transkripte ständig durch neue ersetzt werden. Wenn ein Gen gerade erst aktiviert wurde, wird es für kurze Zeit einen viel höheren Anteil an unreifen Transkripten geben. Umgekehrt wird, wenn die Expression eines Gens unterdrückt wird, der Anteil an kurzlebigen, ungespleißten Transkripten sinken, bevor die langlebigeren reifen mRNA-Transkripte zerfallen. Daher kann für jedes Gen in einer Zelle das Verhältnis von ungespleißter mRNA zu gespleißter mRNA verwendet werden, um direkt auf die momentane Expressionsdynamik zu schließen – d. h. die „RNA-Geschwindigkeit“ jedes Gens, die dann verwendet werden kann, um die zellulären Veränderungen abzuleiten, in einem Gewebe stattfinden (Abb. 1).

Abbildung 1 | Messung dynamischer Veränderungen der Genexpression in komplexen Geweben. ein, Während die Boten-RNA reift, werden Abschnitte des unreifen Transkripts entfernt – ein Vorgang, der als Spleißen bezeichnet wird. Wenn die Expression eines Gens zunimmt, wird in der Zelle ein vorübergehender Anstieg des Anteils an unreifen, ungespleißten Transkripten im Vergleich zu dem von reifen, gespleißten Transkripten beobachtet. Im Gegensatz dazu wird bei abnehmender Expression des Gens kurzzeitig ein höherer Anteil gespleißter Transkripte beobachtet (nicht gezeigt). La Manno et al. 1 hat das Verhältnis von ungespleißten zu gespleißten Transkripten für jedes Gen in einer einzelnen Zelle gemessen, um eine Menge namens RNA-Geschwindigkeit zu berechnen, die zeigt, wie sich die Genexpression verändert. B, Durch die Messung der RNA-Geschwindigkeit in Tausenden von Zellen in einem Gewebe (hier in Neuronen im sich entwickelnden Mausgehirn) konnten die Autoren Karten erstellen, die nicht nur zeigen, wie eng Zellen miteinander verwandt sind (wobei die Nähe durch ähnliche Farben angezeigt wird), sondern auch, welchen Zellen sie in Zukunft ähneln werden (durch Pfeile gekennzeichnet), je nach den Veränderungen der Genexpression, die sie durchmachen. Die RNA-Geschwindigkeit verfolgt erfolgreich frühe Vorläufer (orange und gelb), die schließlich zu einer Reihe differenzierter Zelltypen (blaue gestrichelte Kreise) führen. (B angepasst aus Fig. 3c von Lit. 1.)

Dieser Ansatz wurde bereits bei Massen-RNA-Sequenzierungsdatensätzen verwendet 4 , 5 . La Manno et al. erkannte, dass die Methode auf Einzelzelldaten angewendet werden kann, für die sie erheblich nützlicher ist. Diese Daten liefern ein viel höher aufgelöstes Bild dynamischer Prozesse – insbesondere in komplexen Geweben, die viele Zelltypen mit unterschiedlichen Genexpressionsmustern enthalten, die in Massenanalysen zusammengeführt werden. Die Autoren fanden heraus, dass bestehende Algorithmen zur Analyse von Daten aus der Einzelzell-RNA-Sequenzierung routinemäßig Informationen über unreife, ungespleißte mRNA verwerfen. Durch die vollständige Überarbeitung ihrer Rechenpipelines, um diese Daten zu retten, konnten sie Informationen über gespleißte und ungespleißte Formen jedes Transkripts gewinnen und somit die RNA-Geschwindigkeit vorhersagen.

Wie so oft war für La Manno . viel Aufwand und technischer Einfallsreichtum erforderlich et al. um ihre ursprüngliche Idee in einen robusten Satz von Arbeitsalgorithmen zu übersetzen. Zu den Herausforderungen, die sie bewältigen mussten, gehörte die Tatsache, dass die Messung der Genexpression in einzelnen Zellen nervig sein kann. Dies liegt daran, dass die meisten mRNA-Moleküle in jeder Zelle bei dem Versuch, sie zu sequenzieren, verloren gehen, sodass die Forscher nur ein lückenhaftes Bild der Genexpression haben. Eine weitere Herausforderung bestand darin, zu bestimmen, wie das Basislinienverhältnis von gespleißten zu ungespleißten Transkripten für jedes Gen abgeleitet werden kann, wenn es einer stabilen Transkription unterliegt. Die Autoren mussten modernste Ansätze in Statistik und maschinellem Lernen anwenden, um diese Probleme zu lösen.

La Manno und Mitarbeiter demonstrieren auf wunderbare Weise die Nützlichkeit ihres Ansatzes, indem sie sowohl veröffentlichte als auch neu gesammelte Datensätze verwenden. Sie zeigten zum Beispiel, dass die RNA-Geschwindigkeit die Zunahmen und Abnahmen der Genexpression, die Zellen im Embryo bekanntermaßen durchlaufen, genau erkennen kann, wenn sie sich von einem Zelltyp namens Neuralleistenzelle zu chromaffinen Zellen der Nebennieren differenzieren. Die Autoren nutzten die RNA-Geschwindigkeit auch, um die Dynamik der Genexpression im sich entwickelnden Hippocampus des Mausgehirns, während der Differenzierung von intestinalen Stammzellen und mehr zu untersuchen. Diese Reihe von Beispielen legt nahe, dass die Methode einen breiten Wert haben wird. Zu den wichtigsten Errungenschaften der Gruppe gehörte die Analyse menschlichen embryonalen Gewebes, bei der andere dynamische Messungen aufgrund der technischen und ethischen Probleme, die mit der Untersuchung lebender menschlicher Embryonen verbunden sind, sehr schwierig oder sogar unmöglich wären.

Die Entwicklung einer Analyse der RNA-Geschwindigkeit für einzelne Zellen ist ein großer Durchbruch. Aber natürlich hat es Grenzen. Aufgrund ihrer Natur kann die RNA-Geschwindigkeit eine bestimmte Zelle nicht über die Zeit verfolgen, sie ist auf die Untersuchung von mRNA beschränkt und liefert keine Informationen über die räumliche Organisation von Zellen. Diese Einschränkungen könnten bei der Untersuchung von Phänomenen in der Stammzellbiologie, der Embryonalentwicklung oder dem Ausbruch von Krankheiten einschränkend sein, die wahrscheinlich von der Abstammung und Anordnung der Zellen abhängen und von anderen Mechanismen als der Transkription, einschließlich der Proteinphosphorylierung, angetrieben werden können. Die Methode liefert nur eine probabilistische Beschreibung der Zelldynamik, die aus Momentangeschwindigkeiten zusammengesetzt wird. Aufgrund dieser Einschränkungen besteht kein Zweifel daran, dass die raum-zeitliche Expressionsdynamik von Genen weiterhin mit komplementären Methoden wie der Live-Bildgebung untersucht wird.

Nichtsdestotrotz ist die Fähigkeit, echte, augenblickliche RNA-Geschwindigkeiten in einzelnen Zellen abzuleiten, ein Sprung nach vorne für Studien der Genexpressionsdynamik auf der gesamten Genomskala. Tatsächlich wurde der Ansatz der Autoren bereits von anderen Forschern angewendet 6 . In naher Zukunft kann ich mir vorstellen, dass die RNA-Geschwindigkeit leicht zu einem wichtigen Werkzeug für Einzelzellanalytiker wird.


Schlussfolgerungen

Wir möchten betonen, dass in den hochdimensionalen numerischen Daten unterschiedliche Trends existieren und unterschiedliche Entfernungsmaße einige dieser Trends unterschiedlich hervorheben. Im vorliegenden Fall haben drei Arten von Distanzen relativ gut die Eigenschaft von Genexpressionsprofilen hervorgehoben, für homologe Gewebe zwischen Arten ähnlicher zu sein als für nicht-homologe Gewebe innerhalb von Arten. Im Gegensatz dazu wurde bei der Beantwortung einer Frage zur Divergenz zwischen orthologen Genen eines der drei Distanzen (euklidisch) ausgewählte Gene einheitlich in allen Geweben in der Nähe des Expressionshintergrunds exprimiert, während korrelationsbasierte Distanzen und GA-Distanz Gene mit konzertierten Veränderungen zwischen homologen Geweben selektierten. Um die Expressionsdivergenz bei verschiedenen Arten zu untersuchen, muss sich die Wahl des Distanzmaßes daher an der Art der Expressionsmuster orientieren, die man identifizieren möchte.


Nutzung der Variabilität in der Genexpression als Werkzeug zur Untersuchung der Genregulation

Interessenkonflikt: AR erhält Lizenzgebühren aus Patenten im Zusammenhang mit den im Artikel beschriebenen RNA-FISH-Methoden sowie Beratungseinnahmen.

Abstrakt

Mit dem Aufkommen quantitativer Instrumente zur Messung der Genexpression in einzelnen Zellen haben Forscher die Entdeckung gemacht, dass die Konzentrationen von Boten-RNA und Proteinen in vielen Zusammenhängen von Zelle zu Zelle stark variieren können, oft aufgrund von inhärent stochastischen Ereignissen, die mit der Genexpression verbunden sind. Das Studium dieser zellulären Individualität ist zu einem eigenständigen Studiengebiet geworden, das sich durch eine Mischung aus technologischer Entwicklung, theoretischer Analyse und neuerdings Anwendungen auf biologische Phänomene auszeichnet. In diesem Review konzentrieren wir uns auf die Nutzung der der Genexpression inhärenten Variabilität als Werkzeug zum Verständnis der Genregulation. Wir diskutieren die Verwendung von Variabilität als natürliche Störung auf Systemebene, ihre Verwendung bei der quantitativen Charakterisierung der der Transkription zugrunde liegenden biologischen Prozesse und ihre Anwendung auf die Entdeckung neuer Genregulationsinteraktionen. Wir glauben, dass die Nutzung der Variabilität neue biologische Einblicke in verschiedene Aspekte der Transkriptionskontrolle liefern kann und einen leistungsstarken ergänzenden Ansatz zu bestehenden Techniken bieten kann. WIRES Syst Biol Med 2013, 5:751–759. doi: 10.1002/wsbm.1243


Abstrakt

Biologische Prozesse sind oft dynamisch, daher müssen Forscher ihre Aktivität zu mehreren Zeitpunkten überwachen. Die umfangreichste Informationsquelle bezüglich einer solchen dynamischen Aktivität sind Zeitreihen-Genexpressionsdaten. Diese Daten werden verwendet, um den kompletten Satz aktivierter Gene in einem biologischen Prozess zu identifizieren, ihre Änderungsraten, ihre Reihenfolge und ihre kausalen Wirkungen abzuleiten und dynamische Systeme in der Zelle zu modellieren. In diesem Aufsatz diskutieren wir die grundlegenden Muster, die in Zeitreihenexperimenten beobachtet wurden, wie diese Muster kombiniert werden, um Expressionsprogramme zu bilden, und die computergestützte Analyse, Visualisierung und Integration dieser Daten, um Modelle dynamischer biologischer Systeme abzuleiten.


Ergebnisse

Proliferation und adipogene Differenzierung von humanen ASCs

Wir evaluierten Kandidaten-Referenzgene für quantitative RT-PCR-basierte Genexpressionsstudien von proliferierenden und differenzierenden humanen ASCs. Zuerst isolierten wir ASCs aus frischen abdominalen sWAT-Proben, die durch Inzision von vier weiblichen Spendern gewonnen wurden, die sich einer elektiven plastischen Bauchoperation unterzogen (Zusätzliche Datei 1: Tabelle S1). Die Zellen wurden in flüssigem Stickstoff gelagert. Um die Reinheit der ASC-Population zu bestimmen, wurden die Zellen aufgetaut und bis zur Passage 3 gezüchtet. Anschließend wurden die Zellen permeabilisiert und einer Multiparameter-Detektions-FACS-Analyse mit Antikörpern gegen etablierte ASC-Markerproteine ​​unterzogen [6, 25]. Die überwiegende Mehrheit der Zellen zeigte den charakteristischen ASC-Immunphänotyp DLK1 + /CD34 + /CD90 + /CD105 + /CD45 − /CD31 − (Abb. 1a), der für permeabilisierte Passage-3-ASCs erwartet wird [6, 25].

Charakterisierung, Proliferation und Differenzierung von ASCs. ein – Charakterisierung von ASCs mittels FACS-Analyse. 100.000 Zellen wurden fixiert, permeabilisiert und auf die Expression der Markerproteine ​​CD45, CD31, CD90, CD105, CD34 und DLK1 analysiert. Histogramme von Passage 3 ASCs werden gezeigt. Schwarze Histogramme: Ungefärbte Kontrolle. Rote Histogramme: Zellen mit spezifischer Antikörperfärbung. Histogramme sind repräsentativ für 3 unabhängige Durchflusszytometrie-Analysen unter Verwendung von ASCs von verschiedenen Spendern. B und C – Mikrofotografien (B) und Wachstumskurven (C) von proliferierenden ASCs, die in PM4-Medium kultiviert wurden, das 2,5 % FCS oder 10 % FCS enthält. Jeder Datenpunkt repräsentiert die durchschnittliche Zellzahl von 3 verschiedenen Wells. Die Werte werden als Mittelwerte +/- SEM dargestellt. **P < 0,01. D – Adipogene Differenzierung von ASCs. Am Tag 0 (d 0) wurde die Adipogenese induziert und an den angegebenen Tagen die Morphologie der Zellen mittels Hellfeldmikroskopie dokumentiert. e – Die Bildung von Lipidtröpfchen wurde mittels Oil-Red-O-Färbung an den Tagen 9 und 14 nach Induktion der Adipogenese überwacht. F – Der Perilipin-Proteinspiegel wurde mittels Western-Blot-Analyse in undifferenzierten (d 0) und differenzierten (d 9) ASCs überwacht. Repräsentative Ergebnisse aus drei unabhängigen Experimenten, die in ASCs von drei verschiedenen Spendern durchgeführt wurden, werden gezeigt

Die ASCs wurden dann in einem schwach mitogenen Medium (PM4-Medium mit 2,5% FCS) und in einem hoch mitogenen Medium (PM4-Medium mit 10% FCS) kultiviert. Die Proliferation wurde durch Zählen der ASC-Zahlen an den angegebenen Tagen überwacht (Abb. 1b und c). Wie erwartet zeigten ASCs, die in hoch mitogenem Medium gezüchtet wurden, eine signifikant höhere Proliferationsrate im Vergleich zu Zellen, die in niedrig mitogenem Medium gezüchtet wurden.

Zur adipogenen Differenzierung wurden ASCs bis zum Dichtearrest gezüchtet und in serumfreiem Medium ausgehungert. Die Induktion der Adipogenese durch einen Hormoncocktail führte innerhalb der ersten 72 h nach Induktion zu der charakteristischen morphologischen Transformation von ASCs von einer fibroblastenähnlichen Morphologie zu runden Zellen (Abb. 1d). Dies ist ein Kennzeichen der Adipogenese [26]. Die Differenzierung wurde durch den Nachweis intrazellulärer Fetttröpfchen (Abb. 1e) und des adipozytenspezifischen Proteins Perilipin (Abb. 1f) bestätigt. Die vollständige Western-Blot-Analyse ist in Zusatzdatei 2 dargestellt: Abbildung S1.

Selektions- und Expressionslevel von Referenzgenen

Für die quantitative RT-PCR-Analyse wurde Gesamt-RNA aus proliferierenden ASCs (3 Spender) und aus ASCs 0, 1, 2, 3, 6 und 10 Tage nach Induktion der Adipogenese (4 Spender) isoliert. Die Ausbeute reichte von 2 bis 10 µg mit einem mittleren Reinheitsverhältnis (A260/A280) von 2,0.

Wir haben mehrere Kandidaten-Referenzgene (Zusatzdatei 1: Tabelle S2) ausgewählt, um die zuverlässigsten für die RNA-Expressionsanalyse in proliferierenden und differenzierenden ASCs zu finden. Standardkurven für Referenzgene wurden basierend auf proliferierenden ASCs verarbeitet, während Standards für adipogene Markergene an ASCs drei Tage nach der Induktion der Adipogenese erstellt wurden (Zusatzdatei 3: Abbildung S2 und Zusatzdatei 4: Abbildung S3).

Die quantitative RT-PCR für Standards wurde unter Verwendung der klassischen 10-fach seriellen Verdünnungsmethode durchgeführt. Die Effizienzen (E) von Referenz- und Zielgen-Primersätzen wiesen Mittelwerte von 101,9 +/– 2,81% bzw. 103,9 +/– 3,80% auf (Zusatzdatei 4: Tabelle S3). Um eine spezifische PCR-Amplifikation zu bestätigen, wurde eine Gelelektrophorese durchgeführt. Es zeigte nur ein PCR-Produkt in der vorhergesagten Größe (Fig. 2a). Außerdem zeigte die Schmelzkurvenanalyse einen klaren Peak für jedes Primerpaar (Daten nicht gezeigt).

Primerspezifität und durchschnittliche Schwellenwerte für den Rohzyklus. ein – Die Amplifikationsspezifität aller in Frage kommenden Referenzgen-Primersätze. cDNA wurde aus undifferenzierten menschlichen ASCs isoliert. Spuren 1–10: GAPDH, TBP, EF1A, LMNA, RPS18, PSMD5, MRPL19, TCRF, CCNA2 und GUSB. B und C – Quantitative Roh-PCR CT Werte für Kandidaten-Referenzgene während der Proliferation (B) und Adipogenese (C). Jedes Gen wurde in 15 (Proliferation) oder 24 (Adipogenese) verschiedenen biologischen Proben in Duplikaten amplifiziert. Werte werden als Mittelwerte +/- SEM . dargestellt

Die getesteten Referenzgene zeigten verschiedene Expressionsniveaus (Abb. 2b und c). Um zu bewerten, ob sich die erhöhten SDs innerhalb dieser vier Gruppen auf signifikante Ausreißer beziehen, haben wir den Grubbs-Test durchgeführt, der Ausreißer in einem bestimmten Datensatz erkennt und ihre Signifikanz definiert. Mit dem Schwellenwert bei wurde kein signifikanter Ausreißer erkannt P 0,05. Daher wurden alle Proben zur weiteren Analyse eingeschlossen.

Evaluierung geeigneter Referenzgene für die Proliferation und Differenzierung von ASC

Die in dieser Studie ausgewählten Kandidaten-Referenzgene kodieren Proteine ​​in verschiedenen Funktionsklassen, so dass die Wahrscheinlichkeit, dass Gene koreguliert werden könnten, gering ist [18]. Um optimale Referenzgene für die ASC-Proliferation und -Differenzierung auszuwählen, wurden drei verschiedene mathematische Ansätze (GeNorm, NormFinder und BestKeeper) verwendet:

Die GeNorm-Analyse stuft Kandidaten-Referenzgene mit ihrem niedrigsten Expressionsstabilitätswert (M-Wert) bis zu einem Schwellenwert von 0,5 ein. Gene mit Werten über 0,5 gelten als instabil [27], obwohl in heterogenen Zellpopulationen auch ein M-Wert von 1,0 akzeptiert werden kann [27]. ASCs, die den Differenzierungsprozess durchlaufen, können im Vergleich zu zyklischen ASCs nicht als homogene Zellpopulation angesehen werden. Daher wurde der Schwellenwert für proliferierende Zellen auf 0,5 und für sich differenzierende Zellen auf 1,0 gesetzt. Die mit der GeNorm-Software erzeugten M-Werte sind in Abb. 3a und b dargestellt.

Analyse und Rangfolge der Kandidatengenexpression zur Bestimmung der stabilsten Referenzgene in der Proliferation und Adipogenese. ein und B – GeNorm-Analyse zeigt den Stabilitätswert M von Kandidaten-Referenzgenen in der Proliferation (ein) und differenzieren (B) ASC. Niedrigere Werte zeigen stabilere Gene an, höhere Werte zeigen weniger stabile Gene an. C und D – NormFinder-Analyse zeigt die stabilsten Referenzgene bei der Proliferation (C) und differenzieren (D) ASC. Niedrigere Werte zeigen stabilere Gene an, höhere Werte zeigen weniger stabile Gene an. e und F – BestKeeper-Analyse, die die stabilsten Referenzgene (basierend auf ihrem Pearson-Korrelationskoeffizienten) für die Proliferation zeigt (e) und Differenzierung (F). Höhere Werte zeigen stabilere Gene an, niedrigere Werte zeigen weniger stabile Gene an. P < 0,001 (Ausnahmen: Proliferation: RPS18 P = 0,002 Adipogenese: GUSB P = 0,03, MRPL19 P = 0.003). g – Auswirkungen geeigneter (grün) und ungeeigneter (rot) Referenzgene auf die relative Expression adipogener Markergene im Verlauf der Adipogenese werden gezeigt

Der NormFinder-Algorithmus berechnet den Stabilitätswert jedes Gens. Basierend auf dieser Analyse wird die Verwendung von zwei Kandidatengenen mit der geringsten Stabilität empfohlen (Schwellenwert 0,15) [18]. Wie in Abb. 3c gezeigt, sind Kandidatengene (MRPL19, TBP, EF1A, PMSD5 und GAPDH) die Kriterien erfüllen, die durch den Normalisierungsfaktor-Grenzwert 0,15 für proliferierende ASCs definiert sind. NormFinder-Analyse enthüllt MRPL19 und TBP die beste Kombination von Referenzgenen für proliferierende ASCs (Stabilitätswert 0,075). Allerdings blieben die Stabilitätswerte von Kandidatengenen, die in differenzierenden ASCs getestet wurden, nicht unter dem Schwellenwert von 0,15 (Abb. 3d). Wie oben erwähnt, könnten diese höheren Werte auf die Heterogenität der sich differenzierenden Zellen zurückzuführen sein. Die Kombination aus PSMD5 und TBP den Stabilitätswert auf einen akzeptablen Wert von 0,122 geändert.

Die BestKeeper-Analyse schließt schrittweise ungeeignete Referenzgene aus. Nach deskriptiver statistischer Analyse für jedes Referenzgen werden Kandidaten mit einer Standardabweichung über 1,0 sofort ausgeschlossen. Anschließend wird eine paarweise Korrelationsanalyse durchgeführt, um den Pearson-Korrelationskoeffizienten R für jedes Referenzgen zu berechnen. Hohe R-Werte gelten als Hinweis auf ein stabiles Genexpressionsmuster [24]. Analyse von CT Werte aller Kandidatengene in proliferierenden ASCs zeigten eine SD (Standardabweichung) unter 1,0 (Daten nicht gezeigt). CCNA2 wurde aufgrund seines hohen SD (0,89) von weiteren Berechnungen ausgeschlossen. Eine weitere Analyse zeigte eine starke Korrelation für alle Kandidatengene (0,977 < R < 0,741 Fig. 3e). Als wir die BestKeeper-Analyse mit den drei am besten geeigneten Genen wiederholten, MRPL19, GUSB und EF1A, stieg die Korrelation sogar an (0,985 < R < 0,987, Zusatzdatei 1: Tabelle S4). Nach Ausschluss CCNA2 (SD = 1,5) zeigten Kandidaten-Referenzgene in adipogenen ASCs eine eher schwache Korrelation (0,920 < R < 0,437, Fig. 3f). Die Prüfung der drei besten Kandidaten (PSMD5, EF1A und TFRC) zeigte eine starke Korrelation zwischen diesen Genen (0,969 < R < 0,935, Zusatzdatei 1: Tabelle S4).

Der Einfluss verschiedener Referenzgene auf die Expression von Gene of Interest (GOIs) wurde bei der Differenzierung von ASCs untersucht. Repräsentative Zeitverlaufsexperimente mit den Kombinationen EF1A + PSMD5, CCNA2 + LMNA und nur CCNA2 as the reference gene(s) are shown in Fig. 3g. It is clear that the selection of the reference gene(s) has considerable influence on the measurement of GOI expression.


Diskussion

Using a repeated sampling study design, we investigated PBMC transcript expression in patients undergoing stent implantation, using a novel time-course analysis method. We identified a set of 42 genes with differential temporal expression among patients with and without ISR at one year follow-up in a discovery analysis of the CardioGene Study. Independent replication testing in an Icelandic sample confirmed differential expression of 36 probesets mapped to 32 genes. The gene expression patterns over time may be of interest as well, with consistently expressed genes representing gene expression data that may be able to predict ISR and differentially expressed genes over the time course representing genes with possible direct functional roles in the development of ISR, both of which require further investigation to explore more fully.

Gene expression profiling with DNA microarray technology is a popular tool to monitor the expression level of thousands of genes simultaneously and has been applied in cardiovascular research, to detect patterns of gene expression indicative of underlying disease states[16–21]. Since the data generated represent the temporal abundance of mRNA levels in the sample, measurements of the change of this abundance over the course of disease progression (or any biological process) is therefore both possible and of great scientific interest using this technology. In fact, Yuan and Kendziorski[22] reported that more than one-third of the experiments catalogued in the Gene Expression Omnibus (National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov/geo/) are from experiments that measure gene expression over time. Early time-course RNA expression studies have focused on identifying clusters of genes with a similar pattern over time[14, 23, 24]. More recently, detecting a differential gene expression pattern over time between several biological groups has become an interesting goal of time-course gene expression data.

To detect differential gene expression pattern over time, we used a time-varying intercept model which can account for differences in sample intervals between patients. The term "differential gene expression pattern over time" can be interpreted in several ways to form suitable questions and, thus, the hypotheses are dependent on the particular experiment under consideration. We considered two related questions where each can roughly correspond to the main effect of the group, and the interaction between group and time points. Consider, for example, a gene with exactly the same expression pattern over time in both groups, but the first group has a higher expression than the second group, consistently over all time points. This is a gene that shows the main effect of the group. On the other hand, consider another gene with similar expression level at two time points, 1 and 2, but this gene's expression increases from time 1 to 2 in one group but decreases in another group. This group-by-time interaction cannot be examined by methods that only test the main effect of the group. The time-varying intercept model we used can detect both the main effect and group-by-time interaction. This method, however, requires a large number of bootstrap resampling to evaluate the significance level of the difference between groups, which can be computationally challenging especially when a large number of genes are tested.

Of the genes we identified, the most extensive prior literature in vascular disease was found for the NAB2 gene, which is also known as EGR1 binding protein 2. Early growth response (EGR) genes, which are transcription factors that are implicated in a wide variety of proliferative and differentiative processes[15]. Nab proteins are necessary for Schwann cells to exit the cell cycle and generate a myelin-specific gene profile and are key regulators of the myelination process of peripheral nerves[25]. NAB2 is expressed in vascular smooth muscle cells in response to injury[3–12, 26] and EGR1 has been identified in a microarray study of in vitro smooth muscle cell proliferation[27]. Die LAMP2 gene product protects the lysosomal membrane from proteolytic enzymes within lysosomes and also functions as a receptor for proteins to be imported into lysosomes[28]. Mutationen im LAMP2 gene have been identified in patients with hypertrophic cardiomyopathy[29], and the gene product mediates adherence of PBMCs to the vascular endothelium[13]. Cellular adhesion to the vascular endothelium has been well-described in animal models and post-mortem human examinations, in atherogenesis and acute vascular injury[30, 31]. In the latter, the extent of leukocyte adhesion is predictive of the degree of subsequent neointimal hyperplasia, which is the key lesion of ISR.

Some genes identified have no apparent role in vascular biology, such as VPS26, VPS41, SRP54, und RAD23B, and comparison to previously published reports in the literature do not show differential gene expression in other studies of restenosis, although these investigations were conducted primarily on vascular tissues or culture vascular smooth muscle cells rather than peripheral blood[17, 18, 27, 32]. Die VPS26 and VPS4 genes belongs to a group of vacuolar protein sorting genes and may have a role in lysosome maintenance[33], and SRP54 is a protein in the signal recognition particle, which directs secretory proteins to membranes as they emerge from the ribosome [34]. Specific vascular or inflammatory cell function has not been described, but derangement of these basic cellular processes may impact vascular and other physiologic functions adversely. RAD23B has a role in DNA (nucleotide excision) repair, and genetic variants in RAD23B have been associated with several solid tumors[35–38]. The association with cancer would suggest a possible link to excess proliferative mechanisms in vascular wound repair, as has been described for many other cell cycle regulatory genes[39]. Genetic variants in other genes we identified are also associated with human diseases. Several genetic variants in ACADM have been associated with medium-chain acyl-CoA dehydrogenase activity, but there is no known vascular implication of this disorder[40]. Variants in PCMT1 und FOLR2 have been associated with neural tube defects[41–43], with no known vascular phenotype in these cases. Overall the findings of this study are hypothesis-generating and can be used to support the rational for investigating the function of specific genes and pathways in adverse vascular remodeling, which is relevant to both ISR and more general CAD phenotypes.

We compared the results of our study to previously published reports of transcriptome analysis in ISR. Our results were negative for replication of these studies which focused primarily on vascular tissue samples, in relatively small sample sets. In one study, peripheral blood total leukocyte gene expression was studied in 10 patients with ISR and atherectomy specimens [23]. While a high degree of correlation between peripheral blood leukocyte and arterial neointima tissue gene expression was identified in a subset of genes, these findings were based upon single measurements in a small sample size and were not replicated in the original report. These prior reports highlight the major difficulty of studying vascular tissues, since access to these tissues in adequately large sample sizes is limited.

Vascular biopsy and atherectomy are performed infrequently as part of routine clinical care and would not support well-powered studies of vascular tissues. Tissue sampling over a time course is not clinically indicated or possible. Additionally, a large degree of intra-individual variability in gene expression was noted in these prior studies of vascular tissues, making replication testing critical, yet this cannot be done without access to additional tissues samples. In our study, we analyzed peripheral blood leukocytes, specifically focusing on the mononuclear fraction which contains primarily B and T lymphocytes and monocytes. Although the analysis of peripheral blood cells would ideally be complemented by similar studies in vascular tissues, studying gene expression profiles in blood leukocytes is biologically relevant due to well-defined interactions with the arterial wall, particularly in the setting of vascular injury and repair as in the setting of ISR[17]. The overlap between vascular and blood gene expression in one prior transcriptome analysis of ISR was supportive of our rationale to study PBMCs. For these reasons, and with the additional prior knowledge that inflammation plays a significant role in the development of ISR, we undertook a study of PBMCs in several hundred patients, with adequately powered replication testing for our top discovery findings. Additionally, we use a time course analysis method that improved our ability to detect gene expression signals between the two comparison groups, overcoming some of the difficulty of substantial variability in single point microarray gene expression data.

To address the possibility of false positives identified with our statistical methods, we conducted replication analyses in the independent sample of deCODE samples and we conducted bootstrap resampling to assess significance of the findings. Through this sensitivity analysis, we demonstrated that the validation of 36 probe sets is not likely to be due to chance. Additional potential limitations of this study of ISR are the use of a clinical restenosis outcome, rather than an angiographic outcome, in which clinically silent ISR may have been missed, and the choice of tissue analyzed, as discussed. The CardioGene and deCODE cohorts differ in the incidence of ISR (16.7% in the CardioGene Study and 28.8% in deCODE) with the patients in the deCODE sample showing overall lower residual percent stenosis in the treated lesion after stent implantation. Also, the proportions with hyperlipidemia and diabetes differ. However, despite the differences in the cohorts, we find replication of a substantial proportion of the discovery findings.


Zitiere das

  • APA
  • Autor
  • BIBTEX
  • Harvard
  • Standard
  • RIS
  • Vancouver

Vertebrate Embryogenesis. Hrsg. / Francisco J. Pelegri. New York, NY : Humana Press, 2019. p. 183-218 (Methods in Molecular Biology Vol. 1920).

Forschungsergebnisse : Kapitel in Buch/Bericht/Konferenzverfahren › Kapitel (Buch) › Sonstiges › Peer-Review

T1 - Detection of gene and protein expression in mouse embryos and tissue sections

N2 - Analysis of gene (mRNA and protein) expression patterns is central to the study of embryonic development. This chapter details methods for detecting mRNA and protein expression in whole-mouse embryos and in tissue sections, including mRNA in situ hybridization, immunohistochemistry, and detection of enzymatic and fluorescent protein reporters. We focus on histological methods molecular methods of measuring gene expression (for example, RNAseq, PCR) are not included here.

AB - Analysis of gene (mRNA and protein) expression patterns is central to the study of embryonic development. This chapter details methods for detecting mRNA and protein expression in whole-mouse embryos and in tissue sections, including mRNA in situ hybridization, immunohistochemistry, and detection of enzymatic and fluorescent protein reporters. We focus on histological methods molecular methods of measuring gene expression (for example, RNAseq, PCR) are not included here.


Schau das Video: Genregulation bei Prokaryoten - Operon-Modell (Kann 2022).