Information

Warum Transkriptom statt Proteom analysieren?

Warum Transkriptom statt Proteom analysieren?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Die Analyse des Transkriptoms (RNA-Seq, Microarrays, qPCR etc.) ist wahrscheinlich die am weitesten verbreitete Technologie, um die Genexpression und dynamische zelluläre Prozesse zu beurteilen. Die Ergebnisse werden dann extrapoliert (Funktionsanalysen, GO usw.), um biologische zelluläre Konsequenzen abzuleiten. RNAs sind wirklich nur der Mittelsmann. Das Vorhandensein einer mRNA bedeutet nicht unbedingt, dass sie zu einem Protein wird. Es könnte vor der Translation durch microRNAs etc. abgebaut werden. Es ist schließlich das Protein, das tatsächlich zu einer biologischen Veränderung führt.

Meine Frage ist also, warum nicht einfach direkt zu den Proteinen gehen. Warum nicht einfach die Proteine ​​extrahieren und sequenzieren, quantifizieren, analysieren und Schlussfolgerungen ziehen? Was sind die zwingenden Argumente, das Transkriptom zu studieren, um biologische Prozesse zu verstehen?


F: Warum nicht einfach die Proteine ​​extrahieren…

A: Es ist nicht nur eine Frage von extrahieren die Proteine, müsstest du trennen sie und dann isolieren jeder von ihnen. Derzeit gibt es keine praktische Möglichkeit, dies beispielsweise für 10.000 Proteine ​​zu tun, die auf jeden Fall mehrere Formen haben können. Das Schöne an der RNAseq-Methode ist, dass sie es tut nicht erfordern eine physische Trennung oder Isolierung von Transkripten.

Ein Ansatz, der wahrscheinlich nützlicher ist, ist die Identifizierung und Quantifizierung der Proteine vor Ort, aber dies ist noch weit von der erforderlichen Vollständigkeit und Sensibilität entfernt.

F:… reihen Sie sie an…

A: Die Proteinsequenzierung ist langsam und schwierig. Es kann im Gegensatz zur Sequenzierung von DNA-Kopien von RNA-Transkripten nicht massenhaft angewendet werden. Andere Identifizierungsmethoden auf der Grundlage des physikalischen Verhaltens (Migration oder Elutionsposition) sind vielversprechender und die Richtung, der wahrscheinlich gefolgt wird.

F:… quantifizieren Sie sie…

A: Auch das ist schwierig, wenn Sie beispielsweise Proteine ​​aus Gelen eluieren. Im Gegensatz dazu zählt die RNAseq-Methodik nur Transkripte. (Aber die wahrscheinlichste Richtung, in die dies gehen wird, ist die Quantifizierung durch die Peakhöhe, ohne Trennung oder Isolierung, wie bei der Metabolomik, oder durch die Intensität eines Signals von dem im Gel immobilisierten Protein, eine Färbung von etwas komplexerem.)

Im Allgemeinen führen Sie also Proteinanalysen an bestimmten individuellen Proteinen durch, die für Sie von Interesse sind, während Sie RNAseq-Analysen an allen Transkripten in einer biologischen Probe durchführen und dann angeln gehen können (unter den Ergebnissen und anschließend auf dem See, wenn dies Ihre ist) Ding).


Warum nicht einfach die Proteine ​​extrahieren und sequenzieren, quantifizieren, analysieren und Schlussfolgerungen ziehen?

Denn Proteomik ist Ja wirklich schwer. Um ein Beispiel zu geben, gibt es kein Proteinäquivalent der PCR. Das bedeutet, dass es keinen einfachen Weg gibt, ein bestimmtes Protein aus einer komplexen Mischung auszuwählen und zu amplifizieren. Die Erfindung der PCR war von zentraler Bedeutung für die rasanten Fortschritte in der Genomik in den letzten 40 Jahren.

Massenspektrometrie ist das primäre Werkzeug für Hochdurchsatz-Proteomik, und Massenspektrometrie-Analysen sind immer noch sehr schwierig durchzuführen und noch schwieriger zu interpretieren.


Während Sie Recht haben, dass „das Endergebnis“ immer Protein ist und dass die funktionelle Analyse auf mRNA-Ebene die translationale Kontrolle ignorieren kann, gibt es gute Gründe, das Transkriptom zu analysieren:

1) Wie Sie schon sagten, kann mit mRNA viel passieren: Sie kann abgebaut, translatiert oder auch zeitweise unterdrückt werden, bis sie wieder aktiviert wird. Die meisten dieser Kontrollprozesse haben einen ziemlich starken Einfluss auf den "endgültigen Proteinausstoß", sind aber auf mRNA/Transkriptom-Ebene viel einfacher zu untersuchen (da sie dort stattfinden).

2) Die Analyse des Transkriptoms auf einer genomweiten Ebene ist technisch relativ einfach: Die Sequenzierungstechnologie ist inzwischen ziemlich fortgeschritten und es gibt viele verschiedene Protokolle, die nicht nur die Expressionsniveaus einzelner mRNAs untersuchen, sondern auch andere Dinge wie Stabilität, Prozessierung (dh Spleißen). oder Polyadenylierung) sowie Translation von mRNA. All dies ist auch mit relativ geringem Materialeinsatz möglich.
Andererseits erfordert die Proteinanalyse den Einsatz von Massenspektrometrie, die nicht unbedingt so leistungsfähig oder empfindlich ist wie die Sequenzierung.


Was sind die zwingenden Argumente, das Transkriptom zu studieren, um biologische Prozesse zu verstehen?

Es gibt zwingende Argumente, das Transkriptom zu studieren, aber sie hängen von der Forschungsfrage ab. Forschung, die sich auf die Aktivierung von Transkriptionsfaktoren konzentriert, sollte Transkriptomdaten ebenso verwenden wie Forschungen zu RNA-Prozessierungsereignissen (Spleißen, Prä-mRNA-Prozessierung, Stabilität). Sie benötigen auch Transkriptdaten, wenn Sie RNA-Transkripte untersuchen, die keine Proteine ​​kodieren.

Ich glaube nicht, dass es zwingende biologische Argumente für die Untersuchung des Transkriptoms gibt, wenn man etwas über die Expression proteinkodierender Gene in Geweben oder Zellen wissen möchte. Sie sollten sich auf Proteine ​​konzentrieren, da sie den letzten Schritt bei der Expression von proteinkodierenden Genen darstellen. Die Übereinstimmung zwischen den Niveaus von Protein-kodierenden Transkripten und ihrem Protein kann ausgezeichnet sein, kann aber auch sehr schlecht sein. Transkriptdaten können diese Gruppen nicht trennen. In globalen Schätzungen erklären die Transkriptkonzentrationen nur etwa die Hälfte der Variation der Proteinkonzentrationen. Ich denke, dass diese Ungenauigkeit inakzeptabel ist, wenn es eine praktikable Alternative gibt.

Warum nicht einfach die Proteine ​​extrahieren und quantifizieren?

Es gibt physikalische und historische Grenzen für die globale Quantifizierung von Proteinen. Ich habe ein paar Einschränkungen zusammengestellt, die ich für die wichtigsten halte. Massenspektrometrie (MS) ist derzeit die Methode der Wahl für die Hochdurchsatz-Proteinquantifizierung. Methoden wie die Edman-Sequenzierung oder der immunologische Nachweis haben einen viel geringeren Durchsatz.

Es gibt physikalische Einschränkungen, die MS derzeit daran hindern, quantitative globale Messungen mit intakten Proteinen durchzuführen. Das ist sehr schade. Globale Messungen werden derzeit durchgeführt, indem Peptide aus verdauten Proteinen unter Verwendung eines Flüssigchromatographiesystems quantifiziert werden, um die MS mit Peptiden zu versorgen (LC-MS). Die Peptide werden identifiziert und dann einem Protein oder einer Gruppe von Proteinen zugeordnet. Die Endergebnisse sind zuverlässig und die meisten werden zu individuellen Proteinidentifikationen führen. Einige Peptide werden nur aufgelöst, um eine Gruppe von Proteinen zu identifizieren. Dies ist in den meisten Fällen eine geringfügige Einschränkung.

Globale Messungen von Proteinmengen sind erst in den letzten zehn Jahren möglich geworden, während globale Messungen erst mit dem Aufkommen von Ultrahochleistungs-LCs in Kombination mit den neuesten Massenspektrometern zur Routine wurden. Viele akademische Forscher werden über ihre lokale Massenspektrometrie-Einrichtung Zugang zu dieser Technologie haben, aber die meisten werden dies nicht erkennen. Diese Neuheit ist ein großer Teil des Grundes, warum es weniger verbreitet ist.

Zusammenfassung

Ich denke, dass die LC-MS-Quantifizierung von Proteinen in den nächsten Jahren häufiger anstelle von Transkriptdaten verwendet werden wird. Dies liegt an der Fähigkeit aktueller LC-MS-Instrumente, bessere Antworten in biologischen Systemen zu liefern, die Informationen auf Proteinebene benötigen. Rezensenten werden anfangen, es zu fordern. Ich denke, innerhalb des nächsten Jahrzehnts könnte die Hochleistungs-LC-MS billig genug werden, um sogar immunologische Techniken mit geringerem Durchsatz wie Immunblotting und Immunfluoreszenz zu ersetzen.


Es gibt einen Aspekt, der nicht näher beschrieben wurde: Ein Transkriptom ist viel billiger als ein Proteom. Analysieren ein einziges Protein in LC-MS/MS kann so viel kosten wie ein Transkriptom. Und wenn Sie zu diesen kleinen, unterfinanzierten Gruppen gehören, die an Nicht-Modellorganismen arbeiten, die wirklich interessant, aber nicht wirklich nützlich für die Heilung von Krebs sind, dann haben Sie keine Wahl.


Proteom

Bedeutung des Proteoms

Was können wir vom Proteom lernen? Da die meisten zellulären enzymatischen Funktionen, regulatorischen Schalter, Signalwandler und strukturellen Komponenten aus Proteinen bestehen, kann die Charakterisierung der von einer Zelle exprimierten Proteine ​​wichtige Hinweise auf die Funktion, Organisation und Reaktionsfähigkeit einer Zelle geben. Durch die Definition der Variation zwischen verschiedenen Zellen und zwischen Zellen, die verschiedenen Reizen ausgesetzt sind, können wir außerdem Folgendes verstehen:

zelluläre Anpassung an Umweltsignale

Mechanismen der Zelldifferenzierung und der Entwicklung des Organismus

zelluläre Aspekte von Krankheitsprozessen

Zellreaktionen auf das Altern

Unterschied zwischen Individuen innerhalb einer Spezies, d. h. die molekulare Grundlage unserer Individualität in Bezug auf Physiologie, Krankheitsanfälligkeit und Reaktion auf Therapeutika und Umwelteinflüsse.

Derzeit herrscht große Aufregung über das Potenzial, die Genexpressionsniveaus für jedes Gen eines Organismus zu messen. Umfangreiche oder vollständige Genomsequenzen haben es möglich gemacht, die Niveaus der mRNA-Transkripte aller Gene gleichzeitig durch DNA-Microarray-Hybridisierung zu profilieren. Ist es deshalb überhaupt notwendig, die Proteinexpression zu untersuchen, da die Genexpression so einfach auf mRNA-Ebene gemessen werden kann? Die meisten Wissenschaftler glauben, dass die Antwort ja lautet, da sich die beiden Ansätze tatsächlich quantitativ und qualitativ unterscheiden. Erstens unterscheiden die meisten DNA-Mikroarrays typischerweise nicht zwischen Transkriptvarianten (hergestellt durch alternatives Spleißen, Verwendung alternativer Transkriptionsstartstellen oder Polyadenylierungsstellen oder RNA-Editierung). Zweitens kann die Proteinhäufigkeit durch den mRNA-Spiegel nicht genau vorhergesagt werden, da die Geschwindigkeit der Translation und des Proteinabbaus für jede mRNA unbekannt ist. Drittens sind posttranslationale Modifikationen und proteolytische Spaltungen kritisch für die Funktion eines Proteins, können jedoch nicht durch den mRNA-Spiegel nachgewiesen oder vorhergesagt werden. Schließlich arbeiten Proteine ​​normalerweise in Komplexen und die Proteinlokalisierung wird von der Zelle reguliert, aber keine dieser Eigenschaften wird durch die Untersuchung des mRNA-Spiegels angesprochen.

Sowohl die Bedeutung als auch die Komplexität des Studiums des Proteoms zeigen sich in seiner schieren Größe. Das Proteom ist um ein Vielfaches größer als das Genom, da fast alle Proteine ​​ein hohes Maß an posttranslationalen Modifikationen und Prozessierungen durchlaufen. Es gibt viele Beispiele, bei denen ein einzelnes Gen (bestehend aus vielen Exons) durch alternatives Spleißen und posttranslationale Modifikationen Hunderte und möglicherweise Tausende verschiedener Proteinmoleküle erzeugen kann. Daher stellt die Analyse des gesamten Proteoms eine größere Herausforderung dar als die Genomsequenzierungsprojekte.


Hintergrund

Die meisten Bakterien leben in Umgebungen, die kein kontinuierliches Wachstum aufrechterhalten. Vielmehr sind natürliche Populationen in Bezug auf das Wachstum typischerweise stationär, da für das Wachstum erforderliche Faktoren in der Regel limitierend sind (z. B. Nährstoffe, Sauerstoff) oder sich wachstumshemmende Faktoren (z. B. Abfallprodukte) angesammelt haben (Übersicht in [1]). Die stationäre Phase ist jedoch nicht unbedingt der Endzustand. Sobald die Umweltbedingungen wieder günstig werden, setzt das Bakterienwachstum wieder ein. Vermutlich sind Populationen stationärer Phasen optimiert, um mit einer von zwei Möglichkeiten fertig zu werden. Einerseits müssen sie den anspruchsvollen Umweltbedingungen standhalten, die das Wachstum verhindern. Andererseits sollten sie in der Lage sein, das Wachstum bei wachstumsfördernden Umweltveränderungen schnell wieder aufzunehmen. Ein Ziel dieser Studie war es, herauszufinden, wie die Bakterien mit dieser Situation umgehen. Transkriptomische und proteomische Daten einer Bakterienpopulation beim Durchlaufen der verschiedenen Wachstumsstadien können einige Hinweise geben. Transkriptomische Ansätze wurden verwendet, um die Veränderungen zwischen den Wachstumsphasen zu untersuchen [2, 3]. Ein kombinierter transkriptomischer und proteomischer Ansatz hat den Vorteil, tiefere Einblicke in die molekularen Veränderungen zu liefern, die der bakteriellen Wachstumsanpassung zugrunde liegen [4,5,6,7]. Im Allgemeinen erwarteten wir, dass der Informationsfluss von DNA zu RNA mit der Umwandlung von RNA zu Protein korreliert, d. h. Veränderungen im Transkriptom werden vorhergesagt zu entsprechenden Veränderungen im Proteom und Metabolom. Es gibt jedoch Hinweise aus einem breiten Spektrum von Organismen, dass die RNA-Häufigkeit im Allgemeinen nicht gut mit der Protein-Häufigkeit korreliert [8]. Ein weiteres Ziel dieser Studie war es herauszufinden, ob dies tatsächlich der Fall ist.

In einer früheren Studie haben wir Transkriptomdaten unseres Modellorganismus analysiert, Rhodobacter sphaeroides, in der exponentiellen Phase und nach verschiedenen Inkubationszeiten in der stationären Phase [9]. R. sphaeroides ist ein fakultativ phototrophes Alphaproteobakterium, das hauptsächlich in Süßwasserhabitaten vorkommt. Diese Umgebungen unterliegen häufigen Veränderungen, was sich in der Flexibilität von R. sphaeroides aus einer Reihe von Stoffwechselwegen auszuwählen, um das Wachstum zu optimieren und Stress zu minimieren. Zum Beispiel, R. sphaeroides verwendet aerobe Atmung zur ATP-Produktion bei ausreichendem Sauerstoffgehalt. Sinkt die Sauerstoffspannung, beginnen die Bakterien photosynthetische Komplexe zu bilden. Wenn Licht verfügbar ist, wird anoxygene Photosynthese durchgeführt [10]. Da die gleichzeitige Anwesenheit von Licht, Sauerstoff und Bakteriochlorophyll zu photooxidativem Stress durch die Bildung des schädlichen Singulett-Sauerstoffs führt, versuchen die Bakterien dies zu vermeiden, indem sie die Photosynthese-Genexpression in Gegenwart von Licht und Sauerstoff unterdrücken [11, 12]. Darüber hinaus stellen sie eine Reaktion zum Schutz vor dem folgenden photooxidativen Stress bereit [13, 14]. Die Antwort von R. sphaeroides auf verschiedene Stressfaktoren wie oxidativen Stress (Wasserstoffperoxid), photooxidativen Stress (Singulettsauerstoff) und Eisenlimitierung wurde intensiv untersucht [14,15,16,17,18,19]. Dieses umfangreiche Wissen über die R. sphaeroides Reaktion auf verschiedene Stressreaktionen bietet uns die Möglichkeit, das Transkriptom dieses Bakteriums bei verschiedenen Stressreaktionen mit dem Transkriptom in verschiedenen Wachstumsphasen zu vergleichen. Insbesondere interessieren wir uns für gemeinsame regulatorische Faktoren und Expressionsmuster.

Der Erfolg dieses Ansatzes wurde in einer früheren Studie zu R. sphaeroides die sich auf transkriptomische Veränderungen während des Austritts aus der stationären Phase nach dem Zugang zu frischen Nährstoffen konzentrierte (im Folgenden als Auswuchs bezeichnet). Unsere Daten zeigten, dass die alternativen Sigmafaktoren RpoHI und RpoHII wichtige Akteure im Auswuchs nach einer längeren stationären Phase sind. RpoHI und RpoHII werden auch für die Reaktion auf eine Vielzahl von Belastungen benötigt, einschließlich Hitze, Singulett-Sauerstoff, Wasserstoffperoxid, Superoxid und CdCl2 [20]. Bemerkenswerterweise gab es eine signifikante Überlappung zwischen dem Auswuchs-Transkriptom und der der photooxidativen Stressreaktion [9], was darauf hindeutet, dass die bakterielle Reaktion auf die plötzliche Änderung der Bedingungen, die das Auswachsen einleiten, der photooxidativen Stressreaktion ähnlich ist.

Diese Studie präsentiert eine umfassende vergleichende Analyse der Veränderungen im Transkriptom und vergleicht diese über die verschiedenen Wachstumsphasen mit dem Proteom. Wir beziehen nicht nur transkriptomische und proteomische Daten während des Übergangs in die stationäre Phase ein, sondern auch das Proteom in der tiefen stationären Phase. Die Transkriptomdaten basieren auf einer zuvor veröffentlichten Microarray-Analyse [9] und die Proteomdaten basieren auf quantitativer Massenspektrometrie.


Proteomik: Grundkonzepte, Technologie und Anwendungen

Die Gentranskripte, die ein Individuum im Laufe seines Lebens herstellen kann – als Transkriptom bezeichnet (analog zum Begriff Genom) – beziehen sich auf den haploiden Chromosomensatz, der alle funktionellen Gene trägt.

In ähnlicher Weise werden alle von einem Organismus hergestellten Proteine ​​jetzt unter dem Schatten der Proteomik gruppiert. Die Proteomik umfasst die systematische Untersuchung von Proteinen, um einen umfassenden Überblick über die Struktur, Funktion und Rolle bei der Regulation eines biologischen Systems zu erhalten.

Dazu gehören Protein-Protein-Interaktion, Proteinmodifikation, Proteinfunktion und deren Lokalisierungsstudien. Ziel der Proteomik ist es, nicht nur alle Proteine ​​einer Zelle zu identifizieren, sondern auch eine vollständige dreidimensionale Karte der Zelle zu erstellen, die anzeigt, wo sich Proteine ​​befinden. In Verbindung mit den Fortschritten in der Bioinformatik wird dieser Ansatz zur umfassenden Beschreibung biologischer Systeme zweifellos einen großen Einfluss auf unser Verständnis des Phänotyps sowohl normaler als auch kranker Zellen haben.

Das Proteom (von Mark Wilkins 1995 geprägter Begriff) einer bestimmten Zelle ist die Gesamtzahl der Proteine ​​zu einem bestimmten Zeitpunkt und reagiert sehr dynamisch auf interne und externe Signale. Proteine ​​können durch posttranslationale Modifikationen modifiziert werden, Translokationen innerhalb der Zelle erfahren oder synthetisiert oder abgebaut werden.

Daher spiegelt die Untersuchung von Proteinen einer Zelle zu einem bestimmten Zeitpunkt die unmittelbare Proteinumgebung wider, in der sie untersucht wird. Ein zelluläres Proteom ist die Sammlung von Proteinen, die in einem bestimmten Zelltyp unter dem Einfluss einer bestimmten Reihe von Umweltbedingungen wie der Exposition gegenüber einer Hormonstimulation gefunden werden. Ein vollständiger Satz von Proteinen aus allen verschiedenen zellulären Proteomen bildet das vollständige Proteom eines Organismus.

Ein interessantes Ergebnis des Human Genome Project ist, dass es im menschlichen Proteom weit mehr Proteine ​​gibt (

400.000 Proteine) als es im menschlichen Genom proteinkodierende Gene gibt (

22.000 Gene). Es wird angenommen, dass die große Zunahme der Proteindiversität auf alternatives Spleißen und posttranslationale Modifikation von Proteinen zurückzuführen ist. Dies weist darauf hin, dass die Proteindiversität allein durch Genexpressionsanalyse nicht vollständig charakterisiert werden kann. Die Proteomik ist somit ein nützliches Werkzeug zur Charakterisierung von interessierenden Zellen und Geweben.

Die ersten Proteinstudien, die als Proteomik bezeichnet werden können, begannen mit der Einführung der zweidimensionalen Gelelektrophorese von E. coli-Proteinen (O’Ferrall, 1975), gefolgt von Proteinstudien an Mäusen und Meerschweinchen (Ksole, 1975). Obwohl die 2-dimensionale Elektrophorese (2-DE) ein großer Fortschritt war und viele Proteine ​​mit dieser Technik getrennt und sichtbar gemacht werden konnten, reichte sie für die Proteinidentifizierung durch eine empfindliche Proteinsequenzierungstechnologie nicht aus.

Nach gewissen Bemühungen war die erste bedeutende Technologie zur Identifizierung von Proteinen die Proteinsequenzierung durch Edman-Abbau (Edman, 1949). Diese Technologie wurde zur Identifizierung von Proteinen aus 2D-Gelen verwendet, um eine erste 2D-Datenbank zu erstellen (Celis et al. 1987). Eine weitere wichtige Entwicklung bei der Proteinidentifizierung war die Massenspektrometrie (MS)-Technologie (Andersen et al. 2000). Die Proteinsequenzierung durch die MS-Technologie wurde aufgrund ihrer Analyseempfindlichkeit verbessert, verträgt Proteinkomplexe und ist für Operationen mit hohem Durchsatz zugänglich.

Obwohl mehrere Fortschritte bei der Proteinidentifizierung (durch MS- oder Edman-Sequenzierung) erzielt wurden, ohne dass die Datenbank für die DNA-Sequenzierung exprimierter Sequenzen und genomischer DNA im großen Maßstab vorhanden war, konnten Proteine ​​nicht charakterisiert werden, da verschiedene Proteinisoformen aus einem einzelnen Gen durch mehrere generiert werden können Modifikationen (Abb. 18.1). Und der Großteil der DNA- und Proteinsequenzen hat sich innerhalb kurzer Zeit angesammelt.

1995 erfolgte erstmals die Sequenzierung des Genoms eines Organismus bei Haemophilus influenzae (Fleischmann et al. 1995). Bis heute wurde die Sequenzierung mehrerer anderer eukaryotischer Genome abgeschlossen, nämlich. Arabidopsis thaliana (Tabata, 2000), Sachcharomyces cerevisiae (Goffeau, 1996), Caenorhabditis elegans (Abbott, 1998), Oryza (Matsumoto, 2001) und Mensch (Venter, 2001).

Für die Profilerstellung der Proteinexpression ist ein übliches Verfahren die Analyse von mRNA durch verschiedene Methoden, einschließlich der seriellen Analyse der Genexpression (SAGE) (Velculescu et al. 1995) und der DNA-Mikroarray-Technologie (Shalon, 1996). Das Transkriptionsniveau eines Gens gibt jedoch nur eine grobe Vorstellung von dem tatsächlichen Expressionsniveau dieses Gens.

Eine mRNA kann im Überfluss produziert, aber gleichzeitig schnell abgebaut oder ineffizient translatiert werden, wobei die Proteinmenge minimal gehalten wird. Die gebildeten Proteine ​​werden auch posttranslationalen Modifikationen unterzogen. Verschiedene posttranslationale Modifikationen oder Proteolyse und Kompartimentierung regulieren die Proteinfunktionen in der Zelle (Abb. 18.1).

Die durchschnittliche Anzahl der pro Gen gebildeten Proteine ​​wurde auf ein oder zwei in Bakterien, drei in Hefen und drei oder mehr beim Menschen vorhergesagt (Wilkins et al. 1996). Als Reaktion auf extrazelluläre Reaktionen unterliegen eine Reihe von Proteinen posttranslationalen Modifikationen. Proteinphosphorylierung ist ein wichtiger Signalmechanismus und eine Fehlregulation von Proteinkinase und Phosphatase kann zu Onkogenese führen (Hunter, 1995).

Durch Proteomanalyse können Veränderungen in den Modifikationen vieler Proteine, die von einer Zelle exprimiert werden, nach der Translation analysiert werden. Ein weiteres wichtiges Merkmal eines Proteins ist seine Lokalisation in der Zelle. Es ist bekannt, dass die Fehllokalisierung von Proteinen eine nachteilige Wirkung auf die Zellfunktion hat (zystische Fibrose) (Drumm und Collins, 1993). Das Zellwachstum, der programmierte Zelltod und die Entscheidung, den Zellzyklus zu durchlaufen, werden alle durch die Signaltransduktion durch Proteinkomplexe reguliert (Pippin et al. 1993). Die Proteininteraktion kann unter Verwendung des Hefe-Zwei-Hybrid-Systems nachgewiesen werden (Rain et al. 2001).

Um ein Proteom zu verstehen, müssen drei verschiedene Arten von Analysen durchgeführt werden:

(1) Proteinexpressions-Proteomik ist die quantitative Untersuchung der Proteinexpression des gesamten Proteoms oder Subproteoms von zwei Proben, die sich durch eine Variable unterscheiden. Die Identifizierung neuer Proteine ​​in der Signaltransduktion und krankheitsspezifischer Proteine ​​sind die wichtigsten Ergebnisse dieses Ansatzes.

(2) Strukturelle Proteomik versucht, alle Proteine ​​innerhalb eines Komplexes oder einer Organelle zu identifizieren, ihre Lokalisierung zu bestimmen und alle Protein-Protein-Wechselwirkungen zu charakterisieren. Das Hauptziel dieser Studien ist es, die Struktur von Proteinkomplexen oder zellulären Organellenproteinen aufzuzeigen (Blackstock und Weir, 1999).

(3) Funktionelle Proteomik ermöglicht die Untersuchung einer ausgewählten Gruppe von Proteinen, die für Signalwege, Krankheiten und Protein-Protein-Interaktionen verantwortlich sind. Dies kann möglich sein, indem die spezifischen Subproteome zur weiteren Analyse durch Affinitätschromatographie isoliert werden (Abb. 18.2):

Technologie der Proteomik:

Die Messung des Niveaus eines Gentranskripts ergibt nicht unbedingt ein klares Bild der gebildeten Proteinprodukte. Daher sollten zur Messung der echten Genexpression die Proteine ​​analysiert werden. Vor der Identifizierung und Messung der Aktivität sollten alle Proteine ​​in einem Proteom zu irgendeinem Zeitpunkt voneinander getrennt werden.

Ein typisches Proteomics-Experiment (z. B. Protein Expression Profiling) kann in folgende Kategorien unterteilt werden:

(i) Trennung und Isolierung von Proteinen

(ii) Der Erwerb von Proteinstrukturinformationen zur Proteinidentifizierung und -charakterisierung

(i) Proteintrennung und -isolierung:

Ein wesentlicher Bestandteil der Proteomik ist die Proteinelektrophorese, der effektivste Weg, ein komplexes Proteingemisch aufzulösen. Zwei Arten der Elektrophorese stehen als ein- und zweidimensionale Elektrophorese zur Verfügung. Bei der eindimensionalen Gelelektrophorese (1-DE) werden Proteine ​​anhand ihrer Molekülmassen aufgetrennt. Proteine ​​sind während 1-DE aufgrund ihrer Löslichkeit in Natriumdodycylsulfat (SDS) stabil genug. Proteine ​​mit einer Molekülmasse von 10-300 kDa können leicht durch 1-DE getrennt werden.

Bei komplexen Proteinmischungen sind die Ergebnisse mit 1-DE jedoch begrenzt, so dass für komplexere Proteinmischungen wie rohes Zelllysat das beste verfügbare Trennwerkzeug die zweidimensionale Gelelektrophorese (2-DE) ist (O’Ferrall, 1975). Hier werden Proteine ​​in der ersten Dimension nach ihren Nettoladungen und in der zweiten Dimension nach ihren Molekülmassen getrennt.

Da ein einzelnes 2-DE-Gel Tausende von Proteinen auflösen kann, bleibt es ein leistungsstarkes Werkzeug für die Katalogisierung von Proteinen. Die zweidimensionale Elektrophorese hat die Fähigkeit, Proteine ​​aufzulösen, die einigen posttranslationalen Modifikationen unterzogen wurden, sowie die Proteinexpression von zwei beliebigen Proben kann quantitativ und qualitativ verglichen werden. Kürzlich wurden pH-Gradienten in 2-DE eingeführt, die die Reproduzierbarkeit dieser Technik stark verbesserten (Bjellqvist et al. 1993).

Es sind jedoch noch wenige Probleme mit 2-DE zu lösen. Trotz der Bemühungen, die Proteinanalyse durch 2-DE zu automatisieren, ist dies immer noch ein arbeits- und zeitaufwändiger Prozess. Eine weitere Haupteinschränkung von 2-DE ist die Unfähigkeit, Proteine ​​mit niedriger Kopienzahl nachzuweisen, wenn ein Gesamtzelllysat analysiert wird (Link et al. 1997, Shevchenko et al. 1996) sowie die Ineffizienz, auch den In-Gel-Verdauungsprozess zu beschleunigen.

Daher wurde nach Alternativen gesucht, um die Proteingelelektrophorese zu umgehen. Ein Ansatz ist der proteolytische Verdau einer Proteinmischung, um sie in Peptide umzuwandeln und dann die Peptide zu reinigen, bevor sie einer Analyse durch Massenspektrometrie (MS) unterzogen werden. Die Peptidreinigung wurde durch Flüssigkeitschromatographie (Link et al. 1999 McCormack et al. 1997), Kapillarelektrophorese (Figeys et al. 1999 Tong et al. 1999) und Umkehrphasenchromatographie (Opiteck et al. 1997) vereinfacht.

Kürzlich haben Juan et al. (2005) haben einen neuen Ansatz entwickelt, um den Proteinidentifizierungsprozess unter Verwendung der ‘Mikrowellen’-Technologie zu beschleunigen. Aus den Gelen ausgeschnittene Proteine ​​werden einem Trypsinverdau durch Mikrowellenbestrahlung unterzogen, wodurch schnell Peptidfragmente erzeugt werden. Diese Fragmente konnten durch MALDI (Matrix Assisted Laser Desorption/Ionization) analysiert werden. Trotz vieler nachgelagerter Forschungen zu bestimmten Alternativen zu 2-DE ist dies die am weitesten verbreitete Technik für Proteomstudien.

(ii) Akquisition von Proteinstrukturen: Proteinidentifizierung:

Eine der frühesten Methoden zur Proteinidentifizierung war die Mikrosequenzierung durch die Edman-Chemie, um N-terminale Aminosäuresequenzen zu erhalten. Diese Technik wurde 1949 von Edman eingeführt. Bei der Edman-Sequenzierung wird der N-Terminus eines Proteins sequenziert, um seine wahre Startstelle zu bestimmen. Die Edman-Sequenzierung ist eine besser anwendbare Sequenzierungsmethode zur Identifizierung von Proteinen, die durch SDS-Polyacrylamid-Gelelektrophorese getrennt wurden.

Diese Methode wurde in den Anfangsjahren der Proteomik ausgiebig verwendet, aber in letzter Zeit sind gewisse Einschränkungen aufgetreten. Eine der Haupteinschränkungen ist die N-terminale Modifikation von Proteinen. Wenn vor der Sequenzierung ein Protein am N-Terminus blockiert ist, ist es sehr schwierig, das Protein zu identifizieren.

Um dieses Problem zu überwinden, wurde kürzlich ein neuer Ansatz der gemischten Peptidsequenzierung (Damer et al. 1998) verwendet. Bei diesem Ansatz wird ein Protein durch Spaltung mit Cyanogenbromid (CNBr) oder Skatol in Peptide umgewandelt, gefolgt von der Edman-Sequenzierung von Peptiden.

Der bedeutendste Durchbruch in der Proteomik war die massenspektrometrische Identifizierung von gelgetrennten Proteinen. Aufgrund ihrer hohen Sensitivität, der Identifizierung von Proteinen in Proteinkomplexen/-gemischen und des hohen Durchsatzes hat sich diese Technik als weit besser als die ES erwiesen.

Bei der Massenspektrometrie werden Proteine ​​im Gel selbst durch geeignete Proteasen wie Trypsin zu Peptiden verdaut, da Proteine ​​als solche nur schwer aus den Gelen eluiert werden können. Darüber hinaus ist das Molekulargewicht von Proteinen normalerweise nicht für die Datenbankidentifikation geeignet. Im Gegensatz dazu können Peptide leicht aus den Gelen eluiert werden und der Abgleich selbst einer kleinen Gruppe von Peptiden mit der Datenbank ist völlig ausreichend, um ein Protein zu identifizieren.

Es gibt zwei Hauptansätze zur massenspektrometrischen Proteinidentifizierung:

(i) “Electrospray ionization” (ESI) beinhaltet die Fragmentierung einzelner Peptide, gefolgt von einer direkten Ionisierung durch Elektrospray in einem Tandem-Massenspektrometer. Bei der ESI fließt eine flüssige Probe aus einem Mikrokapillarröhrchen in die Öffnung des Massenspektrometers, wo eine Potentialdifferenz zwischen der Kapillare und dem Einlass zum Massenspektrometer zur Bildung eines feinen Nebels geladener Tröpfchen führt (Fenn et al. 1989 Hunt et al., 1981).

Es hat die Fähigkeit, Peptide in einer Mischung aufzulösen, eine Spezies nach der anderen zu isolieren und sie in Fragmente mit Amino- oder Carboxy-Terminus zu dissoziieren, die mit ‘b’ bzw.

(ii) Beim “Peptid-Massen-Mapping”-Ansatz (Henzel et al. 1993) wird das Massenspektrum der eluierten Peptidmischung erfasst, was zu einem Peptidmassen-Fingerabdruck des untersuchten Proteins führt. Das Massenspektrum wird durch eine relativ einfache ‘massenspektrometrische Methode – Matrix-unterstützte Laserdesorption/Ionisation’ (MALDI) erhalten.

Bei diesem Ansatz wird ein tryptisches Peptidgemisch analysiert, da Trypsin Proteine ​​an den Aminosäuren Arginin und Lysin spaltet. Da die tryptischen Peptide für jedes Protein theoretisch vorhergesagt werden können, können die vorhergesagten Peptidmassen mit denen verglichen werden, die experimentell durch MALDI-Analyse erhalten wurden. Wenn die ausreichende Anzahl an Peptiden mit der vorhandenen Proteinsequenz in der Datenbank übereinstimmt, ist die Genauigkeit der Proteinidentifizierung hoch.

Nach der Proteasespaltung der Proteine ​​werden diese ebenfalls durch Massenanalyse analysiert. Die Massenanalyse verfolgt die Umwandlung von Proteinen oder Peptiden in Molekülionen. Diese Ionen wurden in einem Massenspektrometer anhand ihres Masse/Ladungs-Verhältnisses (m/z) getrennt. Sie wird durch die Zeit bestimmt, die die Ionen brauchen, um den Detektor zu erreichen. Daher wird das Instrument als Flugzeitinstrument (TOF) bezeichnet.

Die Beziehung, die die Bestimmung des m/z-Verhältnisses ermöglicht, ist E = 1/2 (m/z)v 2 . In dieser Gleichung. E ist die Energie, die den geladenen Ionen als Ergebnis der vom Instrument angelegten Spannung verliehen wird, und V ist die Geschwindigkeit der Ionen entlang der Flugbahn. Wenn Peptidionen in die Stoßkammer eingeführt werden, wechselwirken sie mit Stoßgas und werden entlang des Peptidrückgrats fragmentiert (Abb. 18.4).

Da alle Ionen dem gleichen elektrischen Feld ausgesetzt sind, haben alle ähnlich geladenen Ionen ähnliche Energien. Daher müssen auf der Grundlage der obigen Gleichung Ionen mit einer größeren Masse niedrigere Geschwindigkeiten aufweisen und benötigen daher längere Zeiten, um den Detektor zu erreichen. Die verschiedenen Schritte der Massenspektrometrie sind in einem Flussdiagramm in Abb. 18.3 beschrieben.

(iii) Datenbanknutzung:

Zunächst wurde durch die Sequenzierung einiger Proteine ​​oder Peptide, gefolgt von der gemeinsamen Einreichung von Sequenzen, eine Proteindatenbank namens Proteindatenbank erstellt. Die proteolytische Verdauung vieler Proteine ​​wird ebenfalls theoretisch vorhergesagt und in einer Datenbank hinterlegt. Daher wurden derzeit so viele Informationen angesammelt, dass wir nach einer Homologie zwischen einer neuen Peptidsequenz und den bestehenden Sequenzen in der Datenbank suchen können, um das Protein zu identifizieren.

Das Hauptziel der Datenbanksuche besteht darin, eine große Anzahl von Proteinen schnell und genau zu identifizieren. Alle durch Edman-Sequenzierung oder Massenspektrometrie gesammelten Informationen werden verwendet, um die Proteine ​​zu identifizieren. Bei der Datenbanksuche mit Peptid-Massen-Fingerabdruck wird die Masse eines unbekannten Peptids nach proteolytischem Verdau mit der vorhergesagten Masse des Peptids aus dem theoretischen Verdau von Proteinen in der Datenbank verglichen. Bei der Suche in Aminosäuresequenz-Datenbanken wird die Sequenz von Aminosäuren eines Peptids identifiziert und kann verwendet werden, um Datenbanken zu durchsuchen, um das Protein zu finden, von dem es abgeleitet wurde.

Sammlungen von Proteinsequenzdatenbanken sind daher so konzipiert, dass sie eine unvollständige Liste des Genoms eines Organismus darstellen, d. h. die Gene und alle Proteine, die sie kodieren. Die Proteinfamilien werden normalerweise nach ihrer aus der Sequenzhomologie abgeleiteten Evolutionsgeschichte klassifiziert.

These databases are excellent tools for gene discovery, comparative genomics and molecular evolution. The purpose of database similarity searching is the sensitive detection of sequence homologues, regardless of the species relationship in order to infer similarity of function from similarity of sequence.

Recently, Chromatography-based proteomics is used to measure the concentration of low molecular weight peptides in complex mixtures such as plasma or sera. These technologies use time-of-flight (TOF) spectroscopy with matrix-assisted or surface- enhanced laser desorption/ionization to produce a spectrum of mass-to-charge (m/z) ratios that can be analysed in order to identify unique signatures from its chromatography pattern.

Applications of Proteomics:

1. Post-Translational Modifications:

Proteomics studies involve certain unique features as the ability to analyze post- translational modifications of proteins. These modifications can be phosphorylation, glycosylation and sulphation as well as some other modifications involved in the maintenance of the structure of a protein.

These modifications are very important for the activity, solubility and localization of proteins in the cell. Determination of protein modification is much more difficult rather than the identification of proteins. As for identification purpose, only few peptides are required for protease cleavages followed by database alignment of a known sequence of a peptide. But for determination of modification in a protein, much more material is needed as all the peptides do not have the expected molecular mass need to be analyzed further.

For example, during protein phosphorylation events, phosphopeptides are 80 Da heavier than their unmodified counterparts. Therefore, it gives, rise to a specific fragment (PO 3- mass 79) bind to metal resins, get recognized by specific antibodies and later phosphate group can be removed by phosphatases (Clauser et al. 1999 Colledge and Scott, 1999). So protein of interest (post-translationally modified protein) can be detected by Western blotting with the help of antibodies or 32 P-labelling that recognize only the active state of molecules. Later, these spots can be identified by mass spectrometry.

2. Protein-Protein Interactions:

The major attribution of proteomics towards the development of protein interactions map of a cell is of immense value to understand the biology of a cell. The knowledge about the time of expression of a particular protein, its level of expression, and, finally, its interaction with another protein to form an intermediate for the performance of a specific biological function is currently available.

These intermediates can be exploited for therapeutic purposes also. An attractive way to study the protein-protein interactions is to purify the entire multi-protein complex by affinity based methods using GST-fusion proteins, antibodies, peptides etc.

The yeast two-hybrid system has emerged as a powerful tool to study protein-protein interactions (Haynes and Yates, 2000). According to Pandey and Mann (2000) it is a genetic method based on the modular structure of transcription factors in the close proximity of DNA binding domain to the activation domain induces increased transcription of a set of genes.

The yeast hybrid system uses ORFs fused to the DNA binding or activation domain of GAL4 such that increased transcription of a reporter gene results when the proteins encoded by two ORFs interact in the nucleus of the yeast cell. One of the main consequences of this is that once a positive interaction is detected, simply sequencing the relevant clones identifies the ORF. For this reason it is a generic method that is simple and amenable to high throughput screening of protein-protein interactions.

Phage display is a method where bacteriophage particles are made to express either a peptide or protein of interest fused to a capsid or coat protein. It can be used to screen for peptide epitopes, peptide ligands, enzyme substrate or single chain antibody fragments.

Another important method to detect protein-protein interactions involves the use of fluorescence resonance energy transfer (FRET) between fluorescent tags on interacting proteins. FRET is a non-radioactive process whereby energy from an excited donor fluorophore is transferred to an acceptor fluorophore. After excitation of the first fluorophore, FRET is detected either by emission from the second fluorophore using appropriate filters or by alteration of the fluorescence lifetime of the donor.

A proteomics strategy of increasing importance involves the localization of proteins in cells as a necessary first step towards understanding protein function in complex cellular networks. The discovery of GFP (green fluorescent protein) and the development of its spectral variants has opened the door to analysis of proteins in living cells by use of the light microscope.

Large-scale approaches of localizing GFP-tagged proteins in cells have been performed in the genetically amenable yeast S. pombe (Ding et al. 2000) and in Drosophila (Morin et al. 2001). To localize proteins in mammalian cells, a strategy was developed that enables the systematic GFP tagging of ORFs from novel full-length cDNAs that are identified in genome projects.

3. Protein Expression Profiling:

The largest application of proteomics continues to be protein expression profiling. The expression levels of a protein sample could be measured by 2-DE or other novel technique such as isotope coded affinity tag (ICAT). Using these approaches the varying levels of expression of two different protein samples can also be analyzed.

This application of proteomics would be helpful in identifying the signaling mechanisms as well as disease specific proteins. With the help of 2-DE several proteins have been identified that are responsible for heart diseases and cancer (Celis et al. 1999). Proteomics helps in identifying the cancer cells from the non-cancerous cells due to the presence of differentially expressed proteins.

The technique of Isotope Coded Affinity Tag has developed new horizons in the field of proteomics. This involves the labeling of two different proteins from two different sources with two chemically identical reagents that differ in their masses due to isotope composition (Gygi et al. 1999). The biggest advantage of this technique is the elimination of protein quantitation by 2-DE. Therefore, high amount of protein sample can be used to enrich low abundance proteins.

Different methods have been used to probe genomic sets of proteins for biochemical activity. One method is called a biochemical genomics approach, which uses parallel biochemical analysis of a proteome comprised of pools of purified proteins in order to identify proteins and the corresponding ORFs responsible for a biochemical activity.

The second approach for analyzing genomic sets of proteins is the use of functional protein microarrays, in which individually purified proteins are separately spotted on a surface such as a glass slide and then analyzed for activity. This approach has huge potential for rapid high-throughput analysis of proteomes and other large collections of proteins, and promises to transform the field of biochemical analysis.

4. Molecular Medicine:

With the help of the information available through clinical proteomics, several drugs have been designed. This aims to discover the proteins with medical relevance to identify a potential target for pharmaceutical development, a marker(s) for disease diagnosis or staging, and risk assessment—both for medical and environmental studies. Proteomic technologies will play an important role in drug discovery, diagnostics and molecular medicine because of the link between genes, proteins and disease.

As researchers study defective proteins that cause particular diseases, their findings will help develop new drugs that either alter the shape of a defective protein or mimic a missing one. Already, many of the best-selling drugs today either act by targeting proteins or are proteins themselves. Advances in proteomics may help scientists eventually create medications that are “personalized” for different individuals to be more effective and have fewer side effects. Current research is looking at protein families linked to disease including cancer, diabetes and heart disease.


A paradigm-shifting book from an acclaimed Harvard Medical School scientist and one of Zeit’s most influential people.

It’s a seemingly undeniable truth that aging is inevitable. But what if everything we’ve been taught to believe about aging is wrong? What if we could choose our lifespan?

In this groundbreaking book, Dr. David Sinclair, leading world authority on genetics and longevity, reveals a bold new theory for why we age. As he writes: “Aging is a disease, and that disease is treatable.”

This eye-opening and provocative work takes us to the frontlines of research that is pushing the boundaries on our perceived scientific limitations, revealing incredible breakthroughs—many from Dr. David Sinclair’s own lab at Harvard—that demonstrate how we can slow down, or even reverse, aging. The key is activating newly discovered vitality genes, the descendants of an ancient genetic survival circuit that is both the cause of aging and the key to reversing it. Recent experiments in genetic reprogramming suggest that in the near future we may not just be able to Gefühl younger, but actually werden younger.


Ergebnisse

Cytological analysis of anthers from R2P2 and R2P2CMS

As with our previous cytological analysis of the anthers of OguCMS cabbage [22], the abnormal pollen development of the OguCMS cabbage line was mainly due to the proliferation and expansion of the tapetum at the anther development stage 9–12 according to Sanders et al [28]. and tapetum PCD from stage 5 to the tetrad stage. To further investigate the tapetum development in anthers of OguCMS cabbage, we performed light and transmission electron microscopy. Paraffin sections (Fig 1) revealed enlarged abnormal tapetum at the tetrad stage of the OguCMS line resulting in delayed deposition of sporopollenin. Compared to R2P2 (Fig 1C and 1D), light microscopy of the tetrads (anther development stage:7–8) and the uninucleate stage (anther development stage:9–10) revealed a fat abnormal tapetum in R2P2CMS (Fig 1E and 1F). Furthermore, the hypertrophic abnormal tapetum at the tetrad stage was observed in R2P2CMS (Fig 1H) using transmission electron (TE) microscopy.

Correlation between samples

Correlation analysis of gene expression level among samples was used to verify experimental reliability and sampling accuracy. The correlation value between the two replicates was calculated based on FPKM, and should be ≥0.92 as per the Encode plan. Correlation between R2P2CMS-1 and R2P2CMS-2 was 0.9479 and 0.9341 between R2P2-1 and R2P2-2 (Table 1). High correlation suggests the replicate samples have high reliability and repeatability, ensuring subsequent analysis reflects real differences in gene expression between R2P2CMS and R2P2.

Differentially expressed genes in R2P2CMS and R2P2 by RNA-seq analysis

RNA-seq analysis generated 13,037,109 to 13,066,594 SE50-clean reads, which were assembled into 36,890 unigenes. A total of 1323 genes (307 up- and 1016 down-regulated genes) with probability ≥0.8 &│log2Ratio(R2P2CMS/R2P20029│≥1 were differentially regulated in R2P2CMS. DEGs were mainly assigned (GO analysis) into three groups: (1) response to stimulus including light intensity and reactive oxygen species (2) cell wall organization or biogenesis (3) pollen development. There were 22 DEGs assigned to pollen development, pollen wall assembly and pollen exine formation, and all were down-regulated in R2P2CMS as showed in Table 2.

Validation of RNA-seq-based DEGs by qRT-PCR

There were 23 DEGs selected for validation using qRT-PCR. Correlation analysis was performed to evaluate the two platforms. The RNA-seq data (log2 (R2P2CMS/R2P2)) and qRT-PCR data (log2(2 -ΔΔCt )) for each DEG (S1 Table) was positively correlated at 0.8438 (Fig 2, correlation is significant at the 0.01 level).

Factors related to tapetum programmed cell death (PCD)

Cytological analysis showed that proliferation and expansion of the tapetum appeared at the anther developmental stage 9–12. Furthermore, most of the microspores were compressed by abnormal hypertrophic tapetum cells in R2P2CMS. Two DEGs were identified (Bol017269, log2Ratio: -12.4592 Bol008912:-9.2109) encoding GA-regulated family protein[29,30], MYB101 (Bol013459:-7.9363)[31–33] involved in GA mediated signaling pathway- triggered PCD, TDF1/MYB 35 (Bol042967:-6.6075)[34], PLP4 (Bol028944:-6.7823)[35] and AMS genes (Bol042692:-2.6678 Bol004758:-3.0183)[36,37], and all these genes were significantly down-regulated in R2P2CMS (S2 Table). Four DEGs were identified as belonging to the cysteine proteinase superfamily[38,39] (Bol041049:-14.5119, Bol015354:-2.0250, Bol041861:-7.6149, Bol023341:-11.0642) and were rarely expressed in R2P2CMS. Ausdrucksstufen von MYB101 (Bol013459), GA-regulated family protein (Bol008912) and cysteine proteinase (Bol041049) were verified by qRT-PCR with a value of log2(2 -PCR -4.6459, -6.9604, -11.6789.

Essential biosynthesis pathways and key related genes in exine development

From our pathway enrichment results, sporopollenin biosynthesis such as fatty acid elongation (S3 Table), biosynthesis of unsaturated fatty acid (S4 Table), phenylpropanoid biosynthesis pathway (S5 Table), flavonoid biosynthesis (S6 Table), carotenoid biosynthesis (S7 Table), pathway of cutin, suberine and wax biosynthesis (S8 Table) and protein processing in ER (S9 Table) were among the top 20 significantly enriched pathways (pathways with Q-value ≤ 0.05).

All 8 DEGs identified as being involved in fatty acid elongation and 8 DEGs identified as being involved in biosynthesis of unsaturated fatty acid were down-regulated in R2P2CMS. Most of the genes involved in fatty acid elongation were KCS (3-ketoacyl-CoA synthase) genes.

All 24 DEGs (except Bol017968) involved in the phenylpropanoid biosynthesis pathway and 20 DEGs involved in flavonoid biosynthesis were down-regulated in R2P2CMS. Key genes participated both in flavonoid biosynthesis and phenylpropanoid biosynthesis or metabolic process by KEGG annotation included DRL1 (Bol016365: -1.6646), LAP5 (Bol013698: -2.3969 Bol034656: -3.1199), LAP6 (Bol025267: -1.8631), CYP78A7 (Bol043713: -5.2576) and CYP98A8 (Bol039941: -7.1587). Other key phenylpropanoid biosynthesis genes included ACOS5 (Bol029711: -2.3937) and PAL1 (Bol037689: -1.5571 Bol025522: -2.1679) which were also identified as participating in gametophyte development annotated by GO. Other key DEGs involved in the flavonoid biosynthesis included CYP703A2 (Bol018458: -4.5243 Bol040704: -1.6142), and CHS (Bol043396: -2.2360 Bol034259:-1.3776). Ausdrucksstufen von DRL1 (Bol016365), LAP5 (Bol034656), CYP98A8 (Bol039941), ACOS5 (Bol029711) and CYP703A2 (Bol018458) were verified by qRT-PCR with log2(2 -ΔΔCt ) values of -2.5752, -3.9456, -7.5928, -1.8604, -6.1178, -11.6789, respectively.

All 15 DEGs involved in carotenoid biosynthesis were down-regulated in the CMS line except 3 genes. Key genes were analyzed including GELPs (GDSL-like Lipases, Bol026926:-11.0867 Bol023605:-10.7184 Bol002897:-10.6968 Bol002899:-9.1983 Bol029971:-2.4724 and Bol026928:-10.9374), EXL4 (extracellular lipase 4, Bol039273:-14.7554 and Bol037608:-14.7206), CYP97A3 (Bol005984:-1.6580) and ATA27 (Glycosyl hydrolase superfamily protein, Bol039271:-10.9311). Among them, low expression was observed in the two EXL4, six GELPs (except gene Bol029971) and ATA27 in R2P2CMS, yet expression was high in R2P2. Log2(2 -ΔΔCt ) values of qRT-PCR analysis of two GELPs genes (Bol023605 and Bol002899) were -10.9400 and -10.7869, respectively.

Twelve DEGs identified as being involved in cutin, suberine and wax biosynthesis were down-regulated in R2P2CMS and key related genes were analyzed. Zwei ms2/jojoba FAR2 genes (Bol010336:-1.6689 Bol007277:-1.6803) were annotated in pollen wall assembly using GO analysis. In R2P2CMS, three CYP86C (Bol032609: -6.4276 Bol004019: -7.1397 Bol029152:-12.8476) and four HXXXD-type acyl-transferase family proteins (Bol033609: -7.6484 Bol033614:-13.5615 Bol033616:-14.2310 Bol033612:-10.4104) were inhibited, yet highly expressed in R2P2. Furthermore, key genes CYP704B1 (Bol023932:-1.8321) and GMC oxidoreductase (Bol029117: -4.0004 Bol045261:-2.7731) are identified.

There were 71 DEGs identified as involved in protein processing in ER and most of the up-regulated genes in the CMS line were heat shock proteins (HSPs) involved in response to stress. HSPs in the ER are thought to prevent tapetum differentiation.

Secretion and translocation of sporopollenin precursors

Secretion and translocation of sporopollenin precursors to the microspores should be inhibited in the CMS lines. ABC (ATP binding cassette) transporters and LTPs (lipid transfer proteins) have been shown to play essential roles in secretion of sporopollenin precursors from tapetal cells and in delivery of these precursors. Here, two of the four identified ABC-2 type transporter family proteins (Bol042334: -5.7642 Bol013065: -4.9162) and three, LTP12 (Bol004980: -11.8782 Bol010612: -17.1135 Bol014756: -10.9286) (S2 Table), showed very low expression in R2P2CMS compared to R2P2. For Bol013065, log2Ratio by RNA-seq was -4.9162 and log2(2 -ΔΔCt ) by qRT-PCR was -5.6584, which is consistent.

In addition to producing precursors for sporopollenin development, tapetum also synthesizes and secretes callose synthase (CALS), also termed β-1,3-glucanase, to degrade the callose wall surrounding the microspores after the tetrad stage. Furthermore, it is thought that the callose wall may play an important role in pollen development as a glucose source or as a stress factor forming tectum of the sexine [40]. Here, the expression level of the DEG CALS5 (Bol019328) was extremely low in R2P2CMS, and a log2Ratio by RNA-seq of -6.1683 and log2(2 -ΔΔCt ) by qRT-PCR of -4.0327. A series of tapetum specific genes expressed at the tetrad stage are listed in Table 3. Tapetum specific proteins with unknown function, anther 20, lysine histidine transporter 2, thaumatin-like protein 3 and pectin lyase-like superfamily proteins, were all down-regulated in R2P2CMS. Expression levels of ATLP-3 (Bol039345), TAP35/TAP44 (Bol011923) and ATA20 (Bol011894) were verified with the log2(2 -ΔΔCt ) of -3.3718, -3.97709 and -14.6351.

Proteomic differences in R2P2CMS and R2P2 by ITRAQ analysis

Quantification repeat analysis.

Here, CV was used to evaluate reproducibility. CV is defined as the ratio of the standard deviation (SD) to the mean. The lower the CV, the better the reproducibility. The mean CV for this experiment was 0.079 (Fig 3), indicating our data was reliable for further study.

X-axis is the deviation between the protein ratio of the replicate samples. Y-axis is the percentage that a protein at a certain angle comprise quantified protein amount.

In total, 274,364 spectrum were generated 22,634 peptides and 7,147 unique proteins were identified with the cutoff: MascotPercolator Q-value ≤ 0.01. While, 833 proteins were differentially expressed including 538 up- and 295 down-regulated in R2P2CMS compared to R2P2, with a significant threshold of fold change ≥ 1.2 or ≤1/1.2 (0.8333333) and Q-value ≤ 0.05.

Among the 833 DEPs, 553 (66.39%) were classified into KEGG pathways, 6 of which were characterized as enrichment pathways with p-value < 0.05. These included ribosome (63, 11.39%), spliceome (36, 6.51%), mRNA surveillance pathway (30, 5.42%), other types of O-glycan biosynthesis(2, 0.36%), glycosphingolipid biosynthesis - ganglio series(4, 0.72%) and other glycan degradation (10, 1.81%) as shown in Table 4, which showed that substantial proteins change and glycan degradation in R2P2CMS compared to R2P2. Sporopollenin biosynthesis related pathways among KEGG analysis of DEPs include protein processing in ER (19, 3.44%), carotenoid biosynthesis (10, 1.81%), phenylpropanoid biosynthesis (17, 3.07%), flavonoid biosynthesis (7, 1.27%), biosynthesis of unsaturated fatty acids(4, 0.72%), cutin, suberine and wax biosynthesis (3, 0.54%), pathways and related DEPs were listed in S10 Table. And DEPs like cysteine proteins(Bol041861 Bol037199) and ABC transporters(Bol013065) were all up-regulated in R2P2. Lipid-transfer protein(Bol033811) was down-regulated in R2P2CMS. Key DEPs involved in pathway of protein processing in ER, except for Bol013102, all the HSPs (Bol039505, Bol036095, Bol032900, Bol039198, Bol010195) were up-regulated in the CMS line, which was consistent with the results of transcriptome. In carotenoid biosynthesis pathway, 5 GDSL-like Lipases(Bol026926, Bol035147, Bol026928, Bol035145, Bol002897) and 2 DEPs EXL4 (Bol037608, Bol039273)were all up-regulated in CMS line. Key DEPs CYP98A8 Bol039941) in phenylpropanoid biosynthesis was up-regulated in R2P2CMS, other key DEPs like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were not identified. In flavonoid biosynthesis, key DEPs participated include CYP98A8(Bol039941,+), CHS (Bol043396,-) CYP82F1 (Bol033613, -).

Correlation analysis of DEGs and DEPs

Correlation analysis of DEGs and DEPs was performed between R2P2CMS and R2P2. DEGs and DEPs were divided into four groups according to expression in R2P2CMS compared to R2P2: Group 1, 22 DEGs and DEPs (13 down-regulated and 9 up-regulated) with the same expression Group 2, 70 DEGs and DEPs with opposite expression Group 3, 741 DEPs whose corresponding genes were not differentially expressed Group 4, 1232 DEGs whose corresponding proteins were not differentially expressed. DEGs and DEPs are displayed in the Venn diagram (Fig 4).

KEGG pathways analysis of all the correlated DEGs/DEPs

KEGG pathway analysis of all 92 DEGs/DEPs are shown in Fig 5. Among them, pathways identified include: phenylalanine metabolism (Bol005311, Bol013614), isoflavonoid biosynthesis (Bol041944), fatty acid biosynthesis (Bol008037), ABC transporters (Bol013065), cutin, suberine and wax biosynthesis (Bol032609, Bol004019) and protein processing in ER (HSPS: Bol013102, Bol039505, Bol039198). Except for Bol013102, the expression pattern of other two HSPs in was the same. Key CHS(Bol043396) in flavonoid biosynthesis pathway in both analysis was all down-regulated, while CYP98A8 Bol039941) had the opposite expression pattern. Only one cysteine protein Bol041861 was correlate, but the expression pattern was opposite. 2 DEPs EXL4 (Bol037608, Bol039273) and 3 GDSL-like Lipases Bol026926, Bol002897 and Bol026928 with opposite expression pattern were all correlated in carotenoid biosynthesis pathway. In phenylpropanoid biosynthesis other key genes like DRL1, LAP5, LAP6, ACOS5, and PAL1 found in DEGs were all not identified, only DEPs CYP98A8 Bol039941) up-regulated in R2P2CMS was correlate and it’s expression pattern was opposite. ABC transporters (Bol013065) in both analysis was opposite. In biosynthesis of unsaturated fatty acids, only one NAD(P)-binding Rossmann-fold superfamily protein Bol008037 was correlated with opposite expression pattern. The glycan degradation pathway was identified in both transcriptome and proteome analysis including GELPs (Bol002897 and Bol026928), BGAL (beta-galactosidase, Bol035797 and Bol000448) and EXL6 (extracellular lipase 6, Bol039272) and were expressed at a very low level in R2P2CMS. GELPs (Bol002897 and Bol026928) are also involved in the carotenoid biosynthesis pathway, and EXL6 may play an essential role in pollen development in B. rapa and Arabidopsis [41]. Among DEGs and DEPs with the same trend pattern, EF hand calcium-binding protein family(Bol026249, -3.8032 Bol015339, -3.8569), embryo-specific protein 3 (ATS3, Bol020675, AT5G62210–3.5356) which was participated in reproduction developmental process by GO annotation, late embryogenesis abundant domain-containing protein(Bol042711, AT2G03740–16.9392) which was verified to be accumulated late in embryogenesis of cotton[42], lipid-transfer protein(Bol033811, -11.5318), CHS Bol043396, -2.2360) may be important for resulting in the sterility in R2P2CMS.

X-axis represents the numbers of DEGs or DEPs.


Transcriptome Analysis of Adrenocortical Cells in Health and Disease

The transcriptome is the complete set of transcripts in a specific type of cell or tissue. Generally, the goal of transcriptome analysis is to identify genes differentially expressed among different conditions, leading to a new understanding of the genes or pathways associated with the conditions. Transcriptome analysis requires an appropriate statistical method with a multiple comparison test to interpret global changes in the expression of thousands of genes. This chapter reviews and describes recent progress in transcriptome analysis of adrenocortical cells. Strategies for determining transcriptomes and data mining to interpret analysis are discussed. Representative studies are introduced, including a mouse model for human lipoid adrenal hyperplasia that proposes, as a new pathophysiological hallmark, a reciprocal interaction between adrenocortical cells and infiltrated macrophages. Analysis of global transcript profiling will be an essential tool for future research on the nature of adrenocortical cells.


Why analyse transcriptome instead of proteome? - Biologie

Proteomics is the large-scale study of proteins, particularly their structures and functions. The proteome is the entire complement of proteins, including the modifications made to a particular set of proteins, produced by an organism or system. This will vary with time and distinct requirements, or stresses, that a cell or organism undergoes.

While proteomics generally refers to the large-scale experimental analysis of proteins, it is often specifically used for protein purification and mass spectrometry. After genomics and transcriptomics, proteomics is considered the next step in the study of biological systems. It is much more complicated than genomics mostly because while an organism’s genome is more or less constant, the proteome differs from cell to cell and from time to time. This is because distinct genes are expressed in distinct cell types. This means that even the basic set of proteins which are produced in a cell needs to be determined. In the past, this was done by mRNA analysis, but this was found not to correlate with protein content. It is now known that mRNA is not always translated into protein. The amount of protein produced for a given amount of mRNA depends on the gene it is transcribed from and the current physiological state of the cell.

Proteomics confirms the presence of the protein and provides a direct measure of the quantity present. Not only does the translation from mRNA cause differences, but many proteins are also subjected to a wide variety of chemical modifications after translation which are critical to the protein’s function such as phosphorylation, ubiquitination, methylation, acetylation, glycosylation, oxidation, and nitrosylation. Some proteins undergo ALL of these modifications, often in time-dependent combinations, aptly illustrating the potential complexity one has to deal with when studying protein structure and function.

Proteomics typically gives us a better understanding of an organism than genomics. First, the level of transcription of a gene gives only a rough estimate of its level of expression into a protein. An mRNA produced in abundance may be degraded rapidly or translated inefficiently, resulting in a small amount of protein. Second, as mentioned above many proteins experience post-translational modifications that profoundly affect their activities. For example, some proteins are not active until they become phosphorylated. Third, many transcripts give rise to more than one protein through alternative splicing or alternative post-translational modifications. Fourth, many proteins form complexes with other proteins or RNA molecules. They only function in the presence of these other molecules. Finally, protein degradation rate plays an important role in protein content.

One way in which a particular protein can be studied is to develop an antibody which is specific to that modification. For example, there are antibodies that only recognize certain proteins when they are tyrosine-phosphorylated, known as phospho-specific antibodies. There are also antibodies specific to other modifications. These can be used to determine the set of proteins that have undergone the modification of interest. For more quantitative determinations of protein amounts, techniques such as ELISAs can be used.

Most proteins function in collaboration with other proteins. One goal of proteomics is to identify which proteins interact. This is especially useful in determining potential partners in cell signaling cascades. Several methods are available to probe protein–protein interactions. The traditional method is yeast two-hybrid analysis. New methods include protein microarrays, immunoaffinity, and chromatography followed by mass spectrometry, dual polarisation interferometry, Microscale Thermophoresis, and experimental methods such as phage display and computational methods.

Robotic preparation of MALDI mass spectrometry samples: Matrix-assisted laser desorption/ionization (MALDI) is a soft ionization technique used in mass spectrometry. It allows for the analysis of biomolecules and large organic molecules which tend to be fragile and fragment when ionized by more conventional ionization methods.

One of the most promising developments to come from the study of human genes and proteins has been the identification of potential new drugs for the treatment of disease. This relies on genome and proteome information to identify proteins associated with a disease, which computer software can then use as targets for new drugs. For example, if a certain protein is implicated in a disease, its 3-D structure provides the information to design drugs to interfere with the action of the protein. A molecule that fits the active site of an enzyme, but cannot be released by the enzyme, will inactivate the enzyme. Understanding the proteome, the structure and function of each protein and the complexities of protein–protein interactions will be critical for developing the most effective diagnostic techniques and disease treatments in the future. Moreover, an interesting use of proteomics is using specific protein biomarkers to diagnose disease. A number of techniques allow testing for proteins produced during a particular disease, which helps to diagnose the disease quickly.


Abschluss

In summary, there is clearly enormous potential in the integration and use of (multi)omics data for a better understanding of the molecular mechanisms, processes and pathways discriminating health and disease.

The success of this new model of science will depend on the gradual shift from a reductionist to a global approach, sustained by a lively and proactive flow of data across and between different fields of expertise, and funding programmes promoting and supporting this endeavour [ 153]. It is reassuring that governments are starting to acknowledge the importance of translating this comprehensive biomedical knowledge to the bedside and thus fostering the implementation of plans supporting the logistics and regulatory actions for such transformation to take place.

Together, this will eventually aid the development of measures for disease prevention, early diagnosis, disease monitoring and treatment, thus making precision medicine a forthcoming possibility.

We present an overview on the basics and exponential growth of genomics, transcriptomics and proteinomics.

We summarize the principal bioinformatics and biostatistics tools for omics analysis.

Genetics, functional biology, bioinformatics and biostatistics established specific jargons, impacting communication and data interpretation. We particularly aim at targeting a broad range of scientific professionals (including students) seeking knowledge outside their field of expertise.

We provide a critical view of strengths and weaknesses of these omic approaches.


Informationen zum Autor

Mitgliedschaften

Department of Pharmaceutical Sciences, University of Toronto, Toronto, ON, Canada

Mahmoud Labib & Shana O. Kelley

Department of Chemistry, University of Toronto, Toronto, ON, Canada

Institute for Biomaterials and Biomedical Engineering, University of Toronto, Toronto, ON, Canada

Department of Biochemistry, University of Toronto, Toronto, ON, Canada

Sie können auch in PubMed Google Scholar nach diesem Autor suchen

Sie können auch in PubMed Google Scholar nach diesem Autor suchen

Beiträge

Die Autoren trugen gleichermaßen zu allen Aspekten des Artikels bei.

Korrespondierender Autor


Schau das Video: What is transcriptome? Introduction part 1: Learn from scratch for beginners. (Kann 2022).