Information

Konservierte Proteine ​​sind nicht immunogen

Konservierte Proteine ​​sind nicht immunogen


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich habe gelesen, dass hochkonservierte Proteine ​​nicht immunogen sind.

Wieso ist es so ? Was ist das Besondere, das es nicht immunogen macht (Antikörper dagegen sind schwer herzustellen) ?


Immunogenität hat nichts damit zu tun, wie konserviert ein Protein ist. Wie Nico bereits betonte, handelt es sich um einen Mechanismus zur Verhinderung von Autoimmunität. Dies gilt jedoch nur für Proteine, die menschlichen Proteinen ähnlich sind.

Wer einen Impfstoff entwickelt, versucht, möglichst konservierte Proteine ​​als Impfstoffkandidaten zu wählen. Dies macht den Impfstoff universeller (da konservierte Proteine ​​von verschiedenen Bakterien- oder Virusstämmen geteilt werden) und verhindert auch, dass er wirkungslos wird, wenn das Zielprotein mutiert. Ein Beispiel wäre das Grippevirus, bei dem Sie die Stämme vorhersagen müssen, die im Umlauf sein werden, um einen Impfstoff zu formulieren. Wenn es möglich wäre, ein konserviertes Protein zu finden, das von allen Viren geteilt wird (und natürlich keine Ähnlichkeit mit menschlichen Proteinen hat), dann hätte man einen universellen Grippeimpfstoff.

Antikörper können (und werden) künstlich hergestellt werden, dies geschieht beispielsweise bei verkapselten Bakterien wie Menningococcus B, für die es bisher keinen Impfstoff gab. Diese Impfstoffe sind entweder relativ kurze Peptide oder einzelne Proteine ​​des Erregers. Die Proteine ​​für den Impfstoff werden dann meist biotechnologisch hergestellt, gereinigt und können als Impfstoff verwendet werden. Dieser Ansatz wird umgekehrte Vakzinologie genannt.


Immunogenität ist

die Fähigkeit einer bestimmten Substanz, beispielsweise eines Antigens oder Epitops, im Körper eines Menschen oder Tieres eine Immunantwort hervorzurufen. Mit anderen Worten, Immunogenität ist die Fähigkeit, eine humorale oder/und zellvermittelte Immunantwort zu induzieren.

Wenn ein Protein zwischen Spezies hoch konserviert ist, bedeutet dies, dass seine Epitope als . erkannt werden selbst von den meisten Arten, daher wird der Organismus die Produktion von Antikörpern gegen sie vermeiden, um Autoimmunität zu verhindern.

Vielleicht möchten Sie über die zentrale Toleranz lesen, um zu sehen, wie T- und B-Zellen nicht-reaktiv gegenüber sich selbst gemacht werden.


Räumlich konservierte Motive in Komplementkontrollproteindomänen bestimmen die Funktionalität in Regulatoren von Proteinen der Komplementaktivierungsfamilie

Die Regulierung der Komplementaktivierung in den Wirtszellen wird hauptsächlich durch die Regulatoren der Proteine ​​der Komplementaktivierungs-(RCA)-Familie vermittelt, die von sich tandemartig wiederholenden Komplementkontrollprotein-(CCP)-Domänen gebildet werden. Die funktionelle Annotation dieser Proteine ​​ist jedoch eine Herausforderung, da zusammenhängende CCP-Domänen in Proteinen mit unterschiedlichen Funktionen gefunden werden. Hier identifizieren wir mithilfe eines in silico-Ansatzes fünf Motive, die in den regulatorischen CCP-Domänen bekannter RCA-Proteine ​​in einer bestimmten Reihenfolge räumlich konserviert sind. Wir berichten, dass die Anwesenheit dieser Motive in einem spezifischen Muster ausreicht, um regulatorische Domänen in RCA-Proteinen zu annotieren. Wir zeigen, dass der Einbau des verlorenen Motivs in die vierte langhomologe Wiederholung (LHR-D) in Komplementrezeptor 1 seine regulatorische Aktivität wiedererlangt. Darüber hinaus trug das Motivmuster auch dazu bei, das menschliche Polydom als Komplementregulator zu benennen. Daher schlagen wir vor, dass die hier identifizierten Motive die Determinanten der Funktionalität in RCA-Proteinen sind.


2. Materialien und Methoden

In diesem Abschnitt wird zunächst die Datenaufbereitung ausgearbeitet, gefolgt von der Diskussion über die Pipeline der vorgeschlagenen Arbeit. Zum Nutzen der Leser werden in der ergänzenden Datei kurze Diskussionen über auf Epitopen basierende Impfstoffe, T-Zell- und B-Zell-Epitope und ihre Vorhersagewerkzeuge, physikalisch-chemische Eigenschaften von Epitopen und das Andocken von T-Zell-Epitopen gegeben. Darüber hinaus werden Vorhersagewerkzeuge für T-Zell- und B-Zell-Epitope in den ergänzenden Tabellen S1 und S2 berichtet.

2.1. Datenaufbereitung

Um die SARS-CoV-2-Proteine ​​zu kartieren, haben wir das Referenzgenom von SARS-CoV-2 verwendet ( <"type":"entrez-nucleotide","attrs":<"text":"NC_045512.2", "term_id":"1798174254","term_text":"NC_045512.2">> NC_045512.2) 2 und 44583 verfügbare Proteinsequenzen des National Center for Biotechnology (NCBI). Um die Proteinsequenz zu generieren, haben wir die Referenzsequenz des SARS-CoV-2-Genoms genommen und die Leserasterkonzepte betrachtet. Ein Leserahmen teilt die Nukleotidsequenz der Referenzsequenz in einen Satz aufeinanderfolgender, nicht überlappender Tripletts. Es gibt drei mögliche Leseraster: Frame 1, der mit dem ersten Nukleotid einer Referenzsequenz beginnt und die Tripletts erzeugt, Frame 2, der mit dem zweiten Nukleotid beginnt und die Tripletts erzeugt und Frame 3, der mit dem dritten Nukleotid beginnt und die Tripletts erzeugt. Für jeden Frame werden diese Tripletts dann basierend auf der Codon-Tabelle 3 in die entsprechenden Proteine ​​übersetzt. Schließlich haben wir 25 solcher einzigartigen Proteine ​​erhalten, die am besten zu Frame 2 passen. Außerdem wurden die jüngsten Genomsequenzen des indischen SARS-CoV-2-Virus von der Global Initiative on Sharing All Influenza Data (GISAID) 4 im Fasta-Format gesammelt. Es enthält 566 vollständige und nahezu vollständige Genome mit Sequenz-ID. Die durchschnittliche Länge der 566 Genome beträgt 29.831਋p. Diese 566 SARS-CoV-2-Sequenzen werden unter Verwendung von Multiple-Sequencing-Alignment-(MSA)-Techniken ausgerichtet, um die konservierten Regionen zu extrahieren. Außerdem wird das mit jeder konservierten Region assoziierte kodierte Protein extrahiert. Für das Alignment von Sequenzen wird die High Performance Computing (HPC)-Anlage von NITTTR, Kolkata, verwendet. Der HPC-Cluster verfügt über einen Master-Knoten mit dualem Intel Xeon Gold 6130 Prozessor mit 32 Kernen, 2,10 GHz, 22 MB L3-Cache und 128 GB DDR4 RAM und 2 GPU und 4 CPU Rechenknoten mit dualem Intel Xeon Gold 6152 Prozessor mit 44 Kerne, 2,1 GHz, 30 MB L3-Cache und jeweils 192 GB DDR4 RAM, während GPU-Knoten über NVIDIA Tesla V100 GPU mit jeweils 16 GB Arbeitsspeicher verfügen. MSA wurde mit den 2 GPU- und 4 CPU-Rechenknoten durchgeführt.

2.2. Pipeline des Workflows

Die Pipeline des Workflows ist in Abb. 1 dargestellt. Zunächst haben wir uns darauf konzentriert, die konservierten Regionen in der 566 indischen SARS-CoV-2-Genomsequenz zu finden, die nicht von genetischen Mutationen betroffen sind. Aus diesem Grund haben wir zunächst einen Consensus Multiple Sequence Alignment (CMSA)-Ansatz entwickelt, bei dem wir vier verschiedene Alignment-Techniken verwendet haben: ClustalW, MUSCLE, ClustalO und MAFFT, um die 566 SARS-CoV-2-Sequenzen auszurichten. Anschließend werden Consensus-konservierte Regionen (CCnR) identifiziert, nachdem die konservierten Regionen aus jedem ausgerichteten Ergebnis der Ausrichtungstechniken gefunden wurden. ClustalW führt zunächst ein paarweises Alignment aller Sequenzen unter Verwendung der k-Tupel-Methode durch. Danach wird MSA durch fortschreitendes Ausrichten der am engsten verwandten Sequenzen basierend auf der Neighbor-Joining-Führungsbaummethode erzeugt. Bei der MUSCLE-Technik werden zwei Distanzmaße verwendet: k-mer für nicht ausgerichtete Paare und die Kimura-Methode für ausgerichtete Paare von Sequenzen. Zunächst wird ein MSA-Entwurf in MUSCLE mit der k-mer-Methode erstellt. Dann wird eine progressive Ausrichtung basierend auf dem Führungsbaum konstruiert, wie er durch das UPGMA-Verfahren erzeugt wird. Dieser anfängliche Baum wird dann unter Verwendung des Kimura-Distanzverfahrens erneut geschätzt, wonach das UPGMA-Verfahren erneut verwendet wird, um einen neuen Leitbaum zu erzeugen, wodurch ein zweiter MSA erzeugt wird. Neue MSAs werden schließlich erstellt, indem die beiden zuvor erstellten Sequenzen neu ausgerichtet werden. ClustalO verwendet die k-Tupel-Methode, um eine paarweise Ausrichtung zu erzeugen. Dann wird mBed verwendet, um die Sequenzen zu clustern, gefolgt von einem k-Means-Clustering-Algorithmus. Als nächstes wird der Leitbaum unter Verwendung der Methode der ungewichteten Paargruppe mit der Methode des arithmetischen Mittels (UPGMA) erstellt. Schließlich wird MSA mit dem HHalign-Paket erstellt. MAFFT verwendet zwei verschiedene heuristische Methoden, progressive (FFT-NS-2) und iterative Verfeinerung (FFT-NS-i). Das Hauptziel von MAFFT ist es, lokale und globale Algorithmen für MSA zusammenzuführen. Anfänglich wird FFT-NS-2 verwendet, um alle paarweisen Distanzen zu berechnen, um eine vorläufige MSA zu erstellen, aus der verfeinerte Distanzen berechnet werden. Dann wird FFT-NS-i durchgeführt, um das endgültige MSA zu erhalten. Danach werden diese ausgerichteten Sequenzen verwendet, um die Entropie (E) zu berechnen, um die konservierten Regionen zu identifizieren.

wo istx y gibt die Häufigkeit jedes Rests an x Auftreten an Position ja und 5 stellt die vier möglichen Reste als Nukleotid plus Lücke dar. Um die konservierten Regionen (CnRs) für jede Ausrichtungstechnik zu identifizieren, wird eine minimale Segmentlänge von 15 mit einer maximalen durchschnittlichen Entropie von 0,2 berücksichtigt. Weiterhin wird die maximale Entropie pro Position als 0,2 ohne Lücken angenommen, nachdem die Konsensussequenz für die 566 genomischen Sequenzen gefunden wurde. Alle diese Werte wurden nach dem Befolgen der Literatur genommen. Danach werden die CCnRs unter Berücksichtigung der CnRs aller Ausrichtungstechniken identifiziert. Als nächstes wird ein Verfeinerungsprozess für die CCnRs durchgeführt, basierend auf dem Kriterium, dass ihre Länge größer oder gleich 60 nt ist und kein Stoppcodon in der zugehörigen Proteinsequenz vorhanden ist. Darüber hinaus wird Nucleotide BLAST verwendet, um die Spezifität der CCnRs auch als Abfrageabdeckung zu überprüfen. Anschließend werden T-Zell- und B-Zell-Epitope aus diesen CCnRs identifiziert. Um die T-Zell- und B-Zell-Epitope vorherzusagen und ihre entsprechenden immunogenen Scores zu finden, wird jeder CCnR IEDB 5 bzw. ABCPred 6 unterzogen. Wie von IEDB empfohlen, werden für die Vorhersage von MHC-I- und MHC-II-T-Zell-Epitopen NetMHCpan 7 bzw Netzwerk. Dann werden unter Verwendung der vorhergesagten Epitope mit Hilfe von VaxiJen2.0 9 antigene Scores berechnet. Für jeden CCnR werden mehrere T-Zell- und B-Zell-Epitope zusammen mit ihren entsprechenden immunogenen und antigenen Scores identifiziert. Anschließend werden für jeden CCnR die höchsten immunogenen und antigenen Scores berücksichtigt, um die entsprechenden Epitope auszuwählen. Darüber hinaus werden diese Bewertungen verwendet, um die CCnRs basierend auf dem geometrischen Mittel, wie in Gl. (2). Die Verwendung des geometrischen Mittels dient dazu, die Schiefe von immunogenen und antigenen Scores zu vermeiden, die für T-Zell- und B-Zell-Epitope erhalten wurden, so dass eine richtige Rangfolge der konsenserhaltenden Regionen durchgeführt werden kann. Um die identifizierten Epitope zu validieren, werden außerdem die konformativen 2D-nicht-kovalenten Strukturen der identifizierten Epitope mit LigPlot+ untersucht [41] . Darüber hinaus wird der BepiPred2.0-Server 10 [42] für die Überprüfung der vorhergesagten B-Zell-Epitope verwendet. Außerdem werden die physikalisch-chemischen Eigenschaften der Epitope zusammen mit dem Ramachandran-Plot über PyMOL [43] und seine umfangreichen Bibliotheken Autodock Vina . berichtet (zum Andocken) [44] und PyMOD 3 [45] während für die Z-Score-Berechnung der Online-Server ProSA 11 [46] verwendet wird.

wo, RCCnR repräsentiert den Rang der Consensus Conserved Region (CCnR) basierend auf dem geometrischen Mittel der immunogenen und antigenen Scores von T-Zell- und B-Zell-Epitopen, ISich und wieich sind die skalierten immunogenen und antigenen Scores für MHC-I, MHC-II bzw. B-Zell-Epitope.


Ergebnisse

Designstrategie

Um konservierte Reste in natürlich vorkommenden PHBH-Enzymen zu identifizieren, wurde die DDBJ-Datenbank durchsucht Acidobakterien und 1 von a Bazillus Belastung. Die längste Sequenz enthielt 410 Reste und die kürzeste Sequenz enthielt 389 Reste. Die meisten α-proteobakteriellen PHBH-Enzyme umfassten 389–393 Reste, während β-Proteobakterien-Enzyme im Allgemeinen aus 407 oder 410 Resten bestanden und die meisten γ-Proteobakterien-Enzyme 394 oder 395 Reste enthielten (Ergänzende Abb. S1). Ein unbewurzelter phylogenetischer Baum wurde konstruiert (Ergänzende Abb. S2), der vier Kladen enthüllte, was eindeutig darauf hinweist, dass nach der evolutionären Verzweigung von Proteobakterien und anderen Bakterien die Trennung von PHBHs von α-, β- und/oder γ-Proteobakterien stammt. Einige Sequenzen, die von β- oder γ-Proteobakterien stammten, legten ebenfalls einen Fall eines alten horizontalen Gentransfers nahe.

Beim Alignieren der PHBH-Sequenzen wurde festgestellt, dass 49 Stellen nur 1 Aminosäuretyp enthielten (Gruppe A), während 43 Stellen 2 Aminosäurentypen enthielten (Gruppe B) (Ergänzende Tabelle SI und ergänzende Fig. S3). Ein Alignment dieser Sequenzen zeigte 11 Regionen mit hohem Konservierungsgrad, d. h. I7–L17, R44–E49, G157–G160, Y181–G187, E198–Y201, G207–R214, R220–Q224, P275–D305, L333 –W337, F342–T347 und A382–G387, obwohl einige Gebiete der Gruppen A und B in Regionen mit geringem Schutzniveau beobachtet wurden. Die Reste der Gruppen A und B machten etwa 20 % der Volllängensequenz aus, wobei sich 18 % der Stellen in der FAD-Bindungsdomäne, 24 % in der Substratbindungsdomäne und 29 % in der Grenzflächendomäne befanden ( Supplementary Table SI) (Entsch und van Berkel, 1995).

Um eine einzelne Mutantendatenbank durch Substitution mit natürlich vorkommenden Aminosäuren zu konstruieren, wurden alle 49 Stellen in Gruppe A und 4 Stellen aus Gruppe B als Ziele ausgewählt. Vier Reste (G9, L199, S212 und L299) aus Gruppe B wurden basierend auf kristallographischen Informationen ausgewählt. G9 befindet sich im GxGxxG-Motiv, das in Flavin-enthaltenden Oxygenasen konserviert ist. L199 befindet sich in der Nähe des Substrats, P-Hydroxybenzoat, und seine Seitenkette wurde nahe dem 3′ C-Terminus des Substratmoleküls beobachtet. S212 befindet sich ebenfalls in der Nähe des Substrats, und seine Seitenkette verbindet sich mit einer carboxylierten Kette von P-Hydroxybenzoat ( Moran et al., 1999). Der letzte Rest in Gruppe B, L299, befindet sich in der Nähe der P293-Schleife und seine Seitenkette bildet Wasserstoffbrücken mit R44, A45, G46, Y100 und Q102. Bezüglich natürlich vorkommender Substitutionen wurden 1 G9A, 1 L199V, 1 S212T und 12 L299M in einem Alignment der 92 PHBH-Sequenzen beobachtet. Schließlich wurden die folgenden konservierten Reste identifiziert: 12 Gly, 3 Ala, 1 Val, 5 Leu, 1 Ile, 2 Ser, 1 Gln, 3 Pro, 2 Phe, 5 Tyr, 3 Trp, 4 Asp, 2 Glu, 2 His , keine Lys- und 5 Arg-Reste (Ergänzende Tabelle SII).

Um die Korrelation zwischen der Position jedes konservierten Rests und den Auswirkungen der Substitution auf die Struktur und Funktion von PHBHs zu untersuchen, wurde der Abstand zwischen den 53 konservierten Resten durch Clusteranalyse bestimmt. Tatsächlich korreliert der Abstand zwischen zwei beliebigen Resten in der Primärsequenz eines Proteinmoleküls nicht unbedingt mit dem tertiären Abstand in der 3D-Proteinstruktur (Ergänzende Fig. S4). Diese Analyse ergab ein Dendrogramm mit 3 Taxagruppen 1, 2 und 3 und 5 anderen Resten, die kombiniert wurden, um Gruppe 4 zu bilden (Ergänzende Fig. S5).

2 veranschaulicht die Positionen der 53 konservierten Reste der Gruppen 1, 2, 3 und 4 in tertiären und primären Monomerstrukturen des PHBH. Vierzehn konservierte Reste in Gruppe 1 gruppierten sich um FAD, 14 konservierte Reste in Gruppe 2 agierten anscheinend um eine Substratbindungsstelle und 20 konservierte Reste in Gruppe 3 waren hauptsächlich um die P293-Schleife herum lokalisiert. Es sollte jedoch beachtet werden, dass keine Korrelation der konservierten Restverteilung zwischen der FAD-Bindungsdomäne und Gruppe 1 oder zwischen der Substratbindungsdomäne und Gruppe 2 beobachtet wurde, z. die 18 konservierten Reste in der FAD-Bindungsdomäne bestanden aus 9 Resten aus Gruppe 1, 7 Resten aus Gruppe 3 und 2 Resten aus Gruppe 4 (Ergänzende Tabelle SII).

Lokalisierung von 53 konservierten Resten oder 19 vermutlich funktionellen Resten in den Primär- und Tertiärstrukturen von PHBH. Konservierte Rückstände (ein) in Subtaxa a, b und c der Gruppe 1 sind in Gelb, Dunkelgelb bzw. Braun dargestellt (B) in Subtaxa a, b und c der Gruppe 2 in Rot, Pink und Hellrosa (C) in den Subtaxa a, b, c und d der Gruppe 3 in Hellblau, Dunkelblau bzw. Violett und (D) in Gruppe 4 in Mintgrün. (e) Vermutlich funktionelle Reste in den Gruppen 5, 6 und 7 sind in Gelb, Hellblau bzw. Violett dargestellt. (F) Cys- und Met-Reste sind in Ocker. Das PHBH-Molekül wird basierend auf der Struktur von 1pbe gezeigt. Sequenzlogos wurden unter Verwendung von 92 PHBH-Aminosäuresequenzen erzeugt, die aus DDBJ extrahiert wurden.

Lokalisierung von 53 konservierten Resten oder 19 vermutlich funktionellen Resten in den Primär- und Tertiärstrukturen von PHBH. Konservierte Rückstände (ein) in Subtaxa a, b und c der Gruppe 1 sind in Gelb, Dunkelgelb bzw. Braun dargestellt (B) in Subtaxa a, b und c der Gruppe 2 in Rot, Pink und Hellrosa (C) in den Subtaxa a, b, c und d der Gruppe 3 in Hellblau, Dunkelblau bzw. Violett und (D) in Gruppe 4 in Mintgrün. (e) Vermutlich funktionelle Reste in den Gruppen 5, 6 und 7 sind in Gelb, Hellblau bzw. Violett dargestellt. (F) Cys- und Met-Reste sind in Ocker. Das PHBH-Molekül wird basierend auf der Struktur von 1pbe gezeigt. Sequenzlogos wurden unter Verwendung von 92 PHBH-Aminosäuresequenzen erzeugt, die aus DDBJ extrahiert wurden.

Um die Auswirkungen von Substitutionen an konservierten und nicht konservierten Resten zu vergleichen, wurden nicht konservierte Reste, die direkt oder indirekt mit der Struktur und/oder Funktion von PHBHs assoziiert sind, auf der Grundlage früherer Studien zur Analyse ausgewählt: Studien zur Kristallstruktur von PHBHs legen nahe, dass S13, E32, R33, R42, R44, A45, G46, V47, Q102, D286, L299 und N300 Wasserstoffbrücken mit einem FAD-Molekül bilden ( Schreuder et al., 1988 Schreuder et al., 1989). Von diesen Resten waren fünf nicht früher als konservierte Reste identifiziert worden: S13, E32, R33, R42 und V47 (Gruppe 5) (Ergänzende Fig. S3). Da behauptet wurde, dass Q34, T35 und Y38, die sich in der Helixstruktur befinden, direkt oder indirekt mit einem FAD-Molekül interagieren können ( Eppink et al., 1999a), wurden neun Reste, d. h. A34, S35, A36, D37, Y38, V39, Q40, G41 und I43, ausgewählt (Gruppe 6) (Ergänzende Fig. S3). Studien haben gezeigt, dass F161, H162, Q167, P267 und R269 an der Interaktion zwischen FAD und NADPH beteiligt sein können ( van Berkel et al., 1988 Moran et al., 1996 Eppink et al., 1998a Eppink et al., 1999b) wurden diese Reste als Gruppe 7 ausgewählt (Ergänzende Fig. S3). 2 zeigt die primären und tertiären Orte dieser nicht konservierten Reste sowie die der konservierten Reste.

Aufbau einer einzigen Mutantendatenbank

Eine Einzelmutanten-Datenbank wurde konstruiert, indem eine umfassende Substitution jedes konservierten und nicht konservierten Rests in der durchgeführt wurde P.fluoreszenz NBRC14160 PHBH mit 1 der 19 anderen natürlich vorkommenden Aminosäuren. Die Datenbank enthielt 619 aktive Einzelmutanten, darunter 365 aktive Einzelmutanten an konservierten Resten der Gruppen 1, 2, 3 und 4 und 254 aktive Einzelmutanten an nicht konservierten Resten der Gruppen 5, 6 und 7. Die Hauptaktivität, Unteraktivität für NADPH und die NADPH-Reaktionsspezifität jeder Mutante wurden aufgezeichnet (Ergänzungstabelle SIII). Fig. 3 veranschaulicht die Verteilung der Hauptaktivität und der NADPH-Reaktionsspezifität in der Mutantendatenbank (Ergänzende Fig. S6).

Verteilung der Hauptaktivität und Spezifität der NADPH-Reaktion unter den erhaltenen Einzelmutanten. (ein) Mutanten an Resten in Gruppe 1 sind gelb (B) in Gruppe 2 in rot (C) in Gruppe 3 in blau (D) in Gruppe 4 in Mintgrün (e) in den Gruppen 5, 6 und 7 in Gelb, Hellblau bzw. Violett und (F) in Cys- und Met-Resten in Ocker. In den Boxplots ist die Farbcodierung für (g) und (h) sind gleich.

Verteilung der Hauptaktivität und Spezifität der NADPH-Reaktion unter den erhaltenen Einzelmutanten. (ein) Mutanten an Resten in Gruppe 1 sind gelb (B) in Gruppe 2 in rot (C) in Gruppe 3 in blau (D) in Gruppe 4 in Mintgrün (e) in den Gruppen 5, 6 und 7 in Gelb, Hellblau bzw. Violett und (F) in Cys- und Met-Resten in Ocker. In den Boxplots ist die Farbcodierung für (g) und (h) sind gleich.

Die Substitution der 14 konservierten Reste in Gruppe 1 ergab 79 Einzelmutanten mit messbarer Hauptaktivität, d. h. aktive Einzelmutanten. Es wurden jedoch auch 187 Einzelmutanten beobachtet, die stabil exprimiert wurden, aber keine Hauptaktivität zeigten. In ähnlicher Weise wurden 76 aktive Einzelmutanten an 14 konservierten Resten in Gruppe 2, 132 aktive Einzelmutanten an 20 konservierten Resten in Gruppe 3 und 78 aktive Einzelmutanten an 5 konservierten Resten in Gruppe 4 erhalten.

Die Korrelation zwischen der Position jedes konservierten Rests und der Anzahl der erhaltenen aktiven Einzelmutanten wurde genau analysiert. Es wurden keine aktiven Mutanten für Substitutionen an G14 und G160 in Gruppe 1 erhalten E198, R220 und R246 in Gruppe 2 und Q102, G187, N300 und F342 in Gruppe 3. Nur eine aktive Einzelmutante wurde an G9, G11 und D286 in Gruppe 1 erhalten Y201, H214 und G187 in Gruppe 2 und G295 in Gruppe 3. Bei 12/14 konservierten Resten in Gruppe 1, 10/14 konservierten Resten in Gruppe 2 und 14/20 konservierten Resten in Gruppe 3 wurden weniger als 10 Mutanten erhalten von den fünf konservierten Resten in Gruppe 4 produzierten mehr als 10 Mutanten (Ergänzende Fig. S7). Für 9 von 53 konservierten Resten wurden keine aktiven Mutanten erhalten, aber für die verbleibenden 44 Reste wurden 365 aktive Mutanten erhalten. Die Zahl der aktiven Einzelmutanten relativ zur vorhergesagten Zahl betrug 30, 29 und 35 % in den Gruppen 1, 2 bzw. 3, jedoch betrug die Ausbeute in Gruppe 4 82 % (Ergänzungstabelle SIV). Die Mehrheit der konservierten Reste in Gruppe 4 befindet sich in der äußeren Region und ist nicht an andere konservierte Reste gebunden, was darauf hindeutet, dass Substitutionen an einigen Resten der Gruppe 4 eine geringe Wirkung auf die enzymatische Aktivität haben können.

Die umfassende Substitution jedes nicht konservierten Rests in den Gruppen 5, 6 und 7 ergab eine Datenbank aktiver Einzelmutanten: 39 an 5 Resten in Gruppe 5, 169 an 9 Resten in Gruppe 6 und 46 an 5 Resten in Gruppe 7 (Abb. 3 und ergänzende Tabelle SIII). Nur eine aktive Einzelmutante wurde bei S13, E32 und R42 in Gruppe 5 produziert, drei wurden bei H162 und F267 produziert und zwei wurden bei R269 in Gruppe 7 produziert. Alle 19 aktiven Einzelmutanten wurden jedoch bei 1 Rest, V47, produziert Gruppe 5 an 8 Resten, Q34, T35S, P36A, D37, V39, L40Q, G41 und I43, in Gruppe 6 und an 2 Resten, F161 und Q167, in Gruppe 7.

Basierend auf ihrer Substitutionstoleranz wurden die konservierten Reste in drei Klassen eingeteilt: Die erste Klasse bestand aus Mutationen, die Produkte inaktivierten oder destabilisierten, die zweite Klasse war in der Substitutionstoleranz eher eingeschränkt und die letzte Klasse war gegenüber allen Substitutionen tolerant. In ähnlicher Weise wurden nicht konservierte Reste in zwei Gruppen unterteilt, d. h. Bipolarisierung. Diese Trends unterschieden sich deutlich von denen der vorherigen Einzelmutantendatenbank bei 12 Cys/Met, die eine Normalverteilung aufwies (Abb. 3). Diese Cys/Met-Reste sind schwach konserviert, aber nicht mit Struktur und Funktion verbunden. Alle 19 Substitutionen bei 12 Cys/Met ergaben aktive Produkte (Suemori und Iwakura, 2007).

Gruppe 1 ergab keine aktiven Mutanten mit höherer Aktivität als das Wildtyp-Enzym. In ähnlicher Weise zeigten nur 1, 2, 4, 0, 2 und 0 Mutanten eine größere Hauptaktivität als der Wildtyp in den Gruppen 2, 3, 4, 5, 6 bzw. 7. Die Verteilung der Hauptaktivität von Mutanten an jedem konservierten Rest wurde analysiert (ergänzende Fig. 8). Die konservierten Reste umfassten 12 Gly, 3 Ala, 1 Val, 5 Leu, 1 Ile, 2 Ser, 1 Gln, 3 Pro, 2 Phe, 3 Tyr, 3 Trp, 4 Asp, 2 Glu, 2 His, 0 Lys und 5 Arg (Ergänzende Tabelle II). Gly, das an 12 von 53 konservierten Resten im Wildtyp-Enzym beobachtet wurde, neigte dazu, eine Substitution nicht zuzulassen, mit Ausnahme von G94 in Gruppe 4 wurde die Substitution von Gly mit anderen kleinen Aminosäuren häufiger toleriert. Mit Ausnahme von Y181, W234 und W337 (Gruppe 4) neigten aromatische Aminosäuren zu einer Substitutionsunverträglichkeit. Hydrophobe und relativ kleine Aminosäuren waren gegenüber Substitution toleranter, unabhängig von der Position im PHBH-Enzym. Für die polare Aminosäuresubstitution wurden keine Trends beobachtet.

Von den 365 aktiven Mutanten der 53 konservierten Reste zeigten 64 eine höhere NADPH-Reaktionsspezifität als das Wildtyp-Enzym: jeweils 11 Mutanten an L199 und L210 in Gruppe 2 18, 5, 1 und 4 an R44, G46, L48 und L299 in Gruppe 3 jeweils 3 bei G94 und D108 und 11 bei Y181 in Gruppe 4. Im Gegensatz dazu zeigten von den 254 aktiven Mutanten der 19 nicht konservierten Reste nur 2 eine höhere NADPH-Reaktionsspezifität als das Wildtyp-Enzym . Einige Mutanten an L199, L210, R44 und Y181 zeigten eine beträchtlich höhere NADPH-Reaktionsspezifität, wie Y181S (0,7%), Y181T (0,8%) und L199Y (0,8%). Tabelle I listet die kinetischen Parameter von Y181S und Y181T auf, für die die KD und kD Werte waren niedriger als die für den Wildtyp. In der 12 Cys/Met-Mutantendatenbank, die 65 aktive Einzelmutanten mit einer höheren NADPH-Reaktionsspezifität als das Wildtyp-Enzym umfasste, betrug die höchste NADPH-Reaktionsspezifität 2,1 %, verglichen mit 4,7 % für das Wildtyp-Enzym ( Suemori und Iwakura, 2007). Dieser Befund legte nahe, dass die Mutationen der konservierten Reste Mutanten mit unerwartet höherer NADPH-Reaktionsspezifität als das Wildtyp-Enzym ergaben, so dass selbst die Substitution konservierter Reste die Hauptaktivität oder Stabilität stören würde.

Charakterisierung von für Y181 . relevanten Einzel- oder Doppelmutanten

. A45G. Y181R/L268G . Y181S . Y181T . Wildtyp . A45V .
KD (mM) mit P-Hydroxybenzoat 0.7 3.5 4.1 3.9 9.5 1800
KD (mM) mit 2,4-Dihydroxybenzoat 2200 1000 800 800 22 800
KD (mM) mit Protokatechuat 14 65 93 82 230 ND
kKatze (s −1 ) 0.06 1.1 1.6 2.1 5.7 <0.007
. A45G. Y181R/L268G . Y181S . Y181T . Wildtyp . A45V .
KD (mM) mit P-Hydroxybenzoat 0.7 3.5 4.1 3.9 9.5 1800
KD (mM) mit 2,4-Dihydroxybenzoat 2200 1000 800 800 22 800
KD (mM) mit Protokatechuat 14 65 93 82 230 ND
kKatze (s −1 ) 0.06 1.1 1.6 2.1 5.7 <0.007

Die Aktivität wurde bei pH 6,5 und 4 °C gemessen.

Charakterisierung von für Y181 . relevanten Einzel- oder Doppelmutanten

. A45G. Y181R/L268G . Y181S . Y181T . Wildtyp . A45V .
KD (mM) mit P-Hydroxybenzoat 0.7 3.5 4.1 3.9 9.5 1800
KD (mM) mit 2,4-Dihydroxybenzoat 2200 1000 800 800 22 800
KD (mM) mit Protokatechuat 14 65 93 82 230 ND
kKatze (s −1 ) 0.06 1.1 1.6 2.1 5.7 <0.007
. A45G. Y181R/L268G . Y181S . Y181T . Wildtyp . A45V .
KD (mM) mit P-Hydroxybenzoat 0.7 3.5 4.1 3.9 9.5 1800
KD (mM) mit 2,4-Dihydroxybenzoat 2200 1000 800 800 22 800
KD (mM) mit Protokatechuat 14 65 93 82 230 ND
kKatze (s −1 ) 0.06 1.1 1.6 2.1 5.7 <0.007

Die Aktivität wurde bei pH 6,5 und 4 °C gemessen.

Aufbau einer Doppelmutantendatenbank

Y181S zeigte die höchste NADPH-Reaktionsspezifität, daher wurden die Y181X-Einzelmutationen mit einer L268G-Mutation kombiniert, die nach der Rational-Design-Methode selektiert wurde. Die Substitution ergab 19 aktive Y181X/L268G-Doppelmutanten (Ergänzungstabelle SIII). 4 zeigt die Hauptaktivität und NADPH-Reaktionsspezifität der Y181X-Einzelmutanten und Y181X/L268G-Doppelmutanten. Zum Beispiel führte eine Veränderung der NADPH-Reaktionsspezifität von Y181S zu Y181S/L268G zu einer Veränderung von 0,7 auf 0,5%, die Veränderungen reichten von 0,8% für Y181T bis 0,5% für Y181T/L268G. Die NADPH-Reaktionsspezifität von Y181R/L268G unterschied sich jedoch wesentlich von der von Y181R (0,5 vs. 4,1% für die einzelne Y181R-Mutante). Tabelle I listet die kinetischen Parameter der Y181R/L268G-Doppelmutante auf, die niedrigere KD und kD Werte als das Wildtyp-Enzym.

Vergleich der Hauptaktivitäten und NADPH-Reaktionsspezifitäten von Y181X-Einzelmutanten und Y181X/L268G-Doppelmutanten. Y181X-Einzelmutanten und Y181X/L268G-Doppelmutanten sind als Kreise bzw. Quadrate gezeigt. Bei Y181X-Einzelmutanten oder Y181X/L268G-Doppelmutanten sind X = G, A, V, L und I grau X = S, T, N und Q sind hellgrün X = C und M sind gelb X = P, F, Y und W sind lila X = D, E, H und K sind orange und X = R ist rot. Das Wildtyp-Enzym ist schwarz auf einem Quadrat dargestellt.

Vergleich der Hauptaktivitäten und NADPH-Reaktionsspezifitäten von Y181X-Einzelmutanten und Y181X/L268G-Doppelmutanten. Y181X-Einzelmutanten und Y181X/L268G-Doppelmutanten sind als Kreise bzw. Quadrate gezeigt. Bei den Y181X-Einzelmutanten oder Y181X/L268G-Doppelmutanten sind X = G, A, V, L und I grau X = S, T, N und Q sind hellgrün X = C und M sind gelb X = P, F, Y und W sind lila X = D, E, H und K sind orange und X = R ist rot. Das Wildtyp-Enzym ist schwarz auf einem Quadrat dargestellt.


Inhalt

Der Imd-Weg weist eine Reihe von Ähnlichkeiten mit dem TNFR-Signalweg von Säugetieren auf, obwohl viele der intrazellulären regulatorischen Proteine ​​des Imd-Signalwegs auch Homologie zu verschiedenen Signalkaskaden menschlicher Toll-like-Rezeptoren aufweisen. [6]

Ähnlichkeit mit TNFR-Signalisierung Bearbeiten

Die folgenden Gene sind analog oder homolog zwischen Drosophila melanogaster (fett) und humane TNFR1-Signalgebung: [7] [8]

  • Imd: menschliches Ortholog = RIP1
  • Tak1: menschliches Ortholog = Tak1
  • TAB2: menschliches Ortholog = TAB2
  • Dredd: menschliches Ortholog = Caspase-8
  • FADD: menschliches Ortholog = FADD
  • Schlüssel/Ikkγ: menschliches Ortholog = NEMO [8]
  • Ird5: menschliches Ortholog = IKK2
  • Genießen: menschliche Orthologe = p65/p50 und IκB
  • Iap2: menschliches Ortholog = cIAP2
  • UEV1a: menschliches Ortholog = UEV1a
  • Biege: menschliches Ortholog = UBC13

Während die genaue Epistase der Signalisierungskomponenten des Imd-Signalwegs ständig überprüft wird, ist die mechanistische Reihenfolge vieler Schlüsselkomponenten des Signalwegs gut etabliert. In den folgenden Abschnitten wird die Imd-Signalisierung behandelt, wie sie in Drosophila melanogaster, wo es außergewöhnlich gut charakterisiert ist. [6] Die Imd-Signalgebung wird durch eine Reihe von Schritten ab der Erkennung einer bakteriellen Substanz aktiviert (z.B. Peptidoglycan) auf die Übertragung dieses Signals, das zur Aktivierung des NF-κB-Transkriptionsfaktors Relish führt. [7] Aktiviertes Relish bildet dann Dimere, die in den Zellkern wandern und an DNA binden, was zur Transkription antimikrobieller Peptide und anderer Effektoren führt.

Peptidoglycan-Erkennungsproteine ​​(PGRPs) Bearbeiten

Die Wahrnehmung bakterieller Signale erfolgt durch das Peptidoglycan-Erkennungsprotein LC (PGRP-LC), ein Transmembranprotein mit einer intrazellulären Domäne. Die Bindung von bakteriellem Peptidoglycan führt zu einer Dimerisierung von PGRP-LC, die die erforderliche Konformation erzeugt, um das Imd-Protein zu binden und zu aktivieren. Es können jedoch auch alternative Isoformen von PGRP-LC mit unterschiedlichen Funktionen exprimiert werden: PGRP-LCx erkennt polymeres Peptidoglycan, während PGRP-LCa Peptidoglycan nicht direkt bindet, sondern zusammen mit PGRP-LCx an monomeren Peptidoglycan-Fragmenten (sogenanntes Trachealzytotoxin oder "TCT" ). Ein anderes PGRP (PGRP-LE) wirkt ebenfalls intrazellulär, um TCT zu binden, das die Zellmembran durchquert hat oder von einer intrazellulären Infektion stammt. PGRP-LA fördert die Aktivierung der Imd-Signalgebung in Epithelzellen, der Mechanismus ist jedoch noch unbekannt. [6] [7]

Andere PGRPs können die Aktivierung der Imd-Signalgebung hemmen, indem sie bakterielle Signale binden oder Wirts-Signalproteine ​​hemmen: PGRP-LF ist ein Transmembran-PGRP, dem eine intrazelluläre Domäne fehlt und das kein Peptidoglycan bindet. Stattdessen bildet PGRP-LF Dimere mit PGRP-LC, die die PGRP-LC-Dimerisierung und folglich die Aktivierung der Imd-Signalgebung verhindern. Eine Reihe von sekretierten PGRPs haben Amidase-Aktivität, die den Imd-Weg herunterregulieren, indem sie Peptidoglycan in kurze, nicht immunogene Fragmente verdaut. Dazu gehören PGRP-LB, PGRP-SC1A, PGRP-SC1B und PGRP-SC2. Darüber hinaus ist PGRP-LB der wichtigste Regulator im Darm. [9]

Intrazelluläre Signalisierungskomponenten Bearbeiten

Das wichtigste intrazelluläre Signalprotein ist Imd, ein Todesdomäne-enthaltendes Protein, das mit FADD und Dredd unter Bildung eines Komplexes bindet. Dredd wird nach der Ubiquitinierung durch den Iap2-Komplex (mit Iap2, UEV1a, bend und eff) aktiviert, was es Dredd ermöglicht, den 30-Reste-N-Terminus von Imd zu spalten, wodurch es auch von Iap2 ubiquitiniert werden kann. [7] Danach bindet der Tak1/TAB2-Komplex an die aktivierte Form von Imd und aktiviert anschließend den IKKγ/Ird5-Komplex durch Phosphorylierung. This IKKγ complex activates Relish by phosphorylation, leading to cleavage of Relish and thereby producing both N-terminal and C-terminal Relish fragments. The N-terminal Relish fragments dimerize leading to their translocation into the nucleus where these dimers bind to Relish-family NF-κB binding sites. Binding of Relish promotes the transcription of effectors such as antimicrobial peptides. [6] [7]

While Relish is integral for transcription of Imd pathway effectors, there is additional cooperation with other pathways such as Toll and JNK. The TAK1/TAB2 complex is key to propagating intracellular signalling of not only the Imd pathway, but also the JNK pathway. As a result, mutants for JNK signalling have severely reduced expression of Imd pathway antimicrobial peptides. [10]

The Imd-mediated antimicrobial response Edit

Imd signalling regulates a number of effector peptides and proteins that are produced en masse following immune challenge. [11] This includes many of the major antimicrobial peptide genes of Drosophila, particularly: Diptericin, Attacin, Drosocin, Cecropin, and Defensin. [12] The antimicrobial response following Imd activation greatly relies on the production of antimicrobial peptides, as flies lacking these peptides are severely immune-deficient. [13]

The Imd pathway appears to have evolved in the last common ancestor of centipedes and insects. [1] However certain lineages of insects have since lost core components of Imd signalling. The first-discovered and most famous example is the pea aphid Acyrthosiphon pisum. It is thought that plant-feeding aphids have lost Imd signalling as they bear a number of bacterial endosymbionts, including both nutritional symbionts that would be disrupted by aberrant expression of antimicrobial peptides, and defensive symbionts that cover for some of the immune deficiency caused by loss of Imd signalling. [14] It has also been suggested that antimicrobial peptides, the downstream components of Imd signalling, may be detrimental to fitness and lost by insects with exclusively plant-feeding ecologies. [fünfzehn]

Crosstalk between the Imd and Toll signalling pathways Edit

While the Toll and Imd signalling pathways of Drosophila are commonly depicted as independent for explanatory purposes, the underlying complexity of Imd signalling involves a number of likely mechanisms wherein Imd signalling interacts with other signalling pathways including Toll and JNK. [6] While the paradigm of Toll and Imd as largely independent provides a useful context for the study of immune signalling, the universality of this paradigm as it applies to other insects has been questioned. In Plautia stali stinkbugs, suppression of either Toll or Imd genes simultaneously leads to reduced activity of classic Toll and Imd effectors from both pathways. [16]


Materialen und Methoden

Similarity searching of non-coding sequence between Fugu and human genomes.

GENSCAN [70] (using a suboptimal exon probability cutoff of 0.1) and tRNA-scan-SE (release 1.1) [71] were used to predict coding exons and tRNA genes within the Fugu draft genome assembly (release 3.0 Rosalind Franklin Centre for Genomics Research Comparative Genomics Group http://fugu.rfcgr.mrc.ac.uk/). These predicted sequences were then masked in the Fugu sequence by supplying them as a “repeat library” to Repeatmasker35. The masked sequence was similarity searched against human genomic sequence from the Ensembl [41] database v18.34.1 in 1-Mb sections using MegaBLAST [40] version 2.2.6 (word size 20 and mismatch penalty –2). Human and Fugu sequences with alignments of 100 bp or over were selected to form the initial CNE sequence dataset.

All CNEs with a significant similarity to an expressed transcript in the EMBL database or protein sequence in Swiss-Prot/TrEMBL were removed from the dataset unless located within a UTR. CNEs with significant similarity to non-coding RNAs were also removed. These were located by comparing the CNEs to the microRNA Registry [72] and the Rfam database (version 5.0) [73] using BLASTn [74]. CNEs were also searched against Rfam using the INFERNAL software. This resulted in the detection of 1 microRNA, four U1 snoRNAs, six U2 snoRNAs, three U5 snoRNAs, one U6atac RNA, three 7S RNAs, one 7Sk RNA, and one 5S RNA. The CNEs were also searched against the UTRdb (http://www.ba.itb.cnr.it/BIG/UTRScan/, which is a collection of functional sequence patterns located in 5′ or 3′ UTR sequences, but no significant hits were found. We used the program QRNA [75] to see whether any of the BLAST matches had a pattern of mutation consistent with RNA secondary structure. However, the known RNAs detected above had the most significant hits from this analysis. QRNA uses the mutational pattern in a pairwise alignment to detect non-coding RNAs, but in general the sequence identity of the CNEs is too high for this to be of use.

Analysis of the distribution of CNEs in the human genome.

In order to test whether CNEs were randomly distributed, a new random location was allocated uniformly for each CNE within its chromosome. This process was repeated 1,000 times for each chromosome, and the average cluster sizes were calculated for the different distances given in Figure 1B. These cluster sizes were then compared to the cluster sizes of the CNEs. χ 2 tests were carried out comparing the number of clusters containing five or fewer CNEs with the number of clusters containing six or more CNEs. Die P-values obtained from the χ 2 test statistics on one degree of freedom are also shown in Figure 1B. They give very strong evidence against the CNEs being randomly distributed.

Identification of genes associated with CNEs.

The closest gene (using the transcription start site as defined in Ensembl) to the start of each CNE was determined from a list of all human genes supported by external evidence (“known” genes) downloaded using EnsMart, available from the Ensembl Web site (release 24.34e.1 http://www.ensembl.org/). The GOstat program was used to find statistically over-represented GOs in this group of genes [44], using the “goa_human” GO gene association database as a comparator. The minimum length of a considered GO path was five. The false discovery rate option was used to adjust for multiple comparisons.

MLAGAN alignments.

More sensitive global alignment of the CNE regions surrounding 25 orthologous genes in human, Fugu, and other vertebrate species was carried out using the MLAGAN alignment tool kit [50]. To locate the orthologous regions in mouse and rat, local similarity searches with BLASTn were carried out using the most outlying CNE associated with each gene. The relevant genomic regions were extracted from Ensembl for human, mouse, and rat. Zum Fugu the genomic regions were extracted from the Medical Research Council Rosalind Franklin Centre for Genomics Research Fugu Genomics Project Web site (http://fugu.rfcgr.mrc.ac.uk/) (where there is additional mapping information for scaffolds. All sequences were orientated prior to alignment so that the coding sequence of the gene was in positive orientation in all sequences. The MLAGAN alignment was visualised using the VISTA program [76], enabling the identification of conserved sequences. Because of the larger evolutionary distance between fish and mammals, conservation was measured using a 40-bp window and a cutoff score of 60% identity. Fugu was always used as the baseline sequence.

Similarity searching of human CNEs against other vertebrate and invertebrate genomes.

To look for the presence of CNEs in other available vertebrate genomes, CNEs were similarity searched against Ensembl mouse (v19.32.2), rat (v21.3.2), chicken (v22.1.1), and zebrafish (v21.3.2) genome sequences using BLASTn with default parameters. All invertebrate sequences in the EMBL database were searched in the same way using BLASTn with non-stringent parameters (mismatch penalty –1, gap open penalty 1, word size 9, and soft masking). More sensitive alignment of flanking orthologous sequence around the SOX21 gene (up to the coding sequence of the genes on either side) from Ensembl C. elegans (v21.25), D. melanogaster (v21.3.1), and Anopheles gambiae (v21.2.2) was carried out using MLAGAN as above.

Fish care.

Zebrafish were raised and bred and embryos staged following standard protocols [77,78] stages are described as the approximate number of hours post-fertilisation (hpf) when embryos are raised at 28.5 °C. To prevent pigment formation, some embryos were raised in 0.003% phenylthiocarbamide in embryo medium from tailbud stage.

Functional Assay.

We assayed for enhancer activity in embryos co-injected with candidate enhancer elements or control DNA and a minimal promoter–reporter construct in a method adapted from Muller and colleagues [37] as described below:

For the preparation of DNA and micro-injection, CNEs, rCNEs, and negative controls were PCR-amplified from Fugu genomic DNA (see Figure S1 for PCR primer sequences primers are represented by the first and last 20 bp of each sequence). The reporter construct consisting of EGFP (Clontech, Palo Alto, California, United States) under the control of a minimal promoter from the mouse β-globin gene, was PCR-amplified from a plasmid vector (available upon request). Amplified DNA was purified using the GFX PCR purification kit (#27–9602-01 Amersham Biosciences, Amersham, United Kingdom) or the QIAquick PCR purification kit (#28106 Qiagen, Valencia, California, United States). Element DNA or control DNA (at 150–300 ng/μl), reporter construct DNA (at 25 ng/μl), and phenol red (at 0.1%, used as a tracer) were combined and co-injected into embryos produced from natural matings between the one-cell stage and early cleavage stages, using an Eppendorf (Hamburg, Germany) FemtoJet pressure injection system. Any embryos developing abnormally were discarded before screening.

For screening of embryos and data collection, on the second day of development (approximately 26–33 hpf), injected embryos were anaesthetised in Tricaine [77] and analysed for GFP expression by observation under fluorescence illumination using an Olympus (Tokyo, Japan) IX81 motorised inverted microscope. Images were captured using an FVII CCD monochrome digital camera and analySIS image-processing software.

GFP-expressing cells were classified according to the following tissue categories: forebrain, midbrain, hindbrain, spinal cord, eye, ear, notochord, muscle, blood (circulating)/blood islands, heart/pericardial region (Please note: Some cells classified in this category may be circulating blood cells), epidermis/EVL, or fins. Cells that did not fall into one of these major expression categories (or that were not possible to unequivocally identify from morphology or localisation) were categorised as “other”. The location and tissue category of each GFP-expressing cell for each embryo was recorded schematically using Adobe Photoshop software (Adobe Systems, San Jose, California, United States), by manually drawing colour-coded schematised cells in appropriate positions onto an overlay of a camera lucida drawing of a 31-hpf embryo (from staging series by C. Kimmel, downloaded from “Zebrafish: The Living Laboratory”, courtesy of the Zebrafish CD Exchange Project contact Mark Cooper at E-mail: [email protected] relating to tissue category was also recorded on a spreadsheet.

GFP expression data were collected from between 25 and 55 expressing embryos per element injected. Cumulative overlaid schematised expression data for each element were compressed into a single JPEG file (displayed in Figure 5). Thus, the JPEG image for each element is designed to give an overall impression of the spatial pattern to which the element directs expression. Coupled with the accompanying graphs, the data present an overview of the spatial localisation of GFP expression as well as an idea of the number of cells per tissue in which GFP expression was detected, indicating the strength of the element's enhancing properties or the size of the cell population to which expression is directed.

Anti-GFP immunostaining.

Embryos were fixed in 4% paraformaldehyde and stained with rabbit polyclonal anti-GFP (#TP401 at 1/1,000 dilution AMS Biotechnology, Abingdon Oxon, United Kingdom) using standard protocols [79] and the ABC amplification system (Vectastain Vector Laboratories, Burlingame, California, United States). Stained embryos were cleared in glycerol, flatmounted, and observed/imaged as above.


REVIEW Artikel

Adenoviral vectors are a safe and potently immunogenic vaccine delivery platform. Non-replicating Ad vectors possess several attributes which make them attractive vaccines for infectious disease, including their capacity for high titer growth, ease of manipulation, safety, and immunogenicity in clinical studies, as well as their compatibility with clinical manufacturing and thermo-stabilization procedures. In general, Ad vectors are immunogenic vaccines, which elicit robust transgene antigen-specific cellular (namely CD8 + T cells) and/or humoral immune responses. A large number of adenoviruses isolated from humans and non-human primates, which have low seroprevalence in humans, have been vectorized and tested as vaccines in animal models and humans. However, a distinct hierarchy of immunological potency has been identified between diverse Ad vectors, which unfortunately limits the potential use of many vectors which have otherwise desirable manufacturing characteristics. The precise mechanistic factors which underlie the profound disparities in immunogenicity are not clearly defined and are the subject of ongoing, detailed investigation. It has been suggested that a combination of factors contribute to the potent immunogenicity of particular Ad vectors, including the magnitude and duration of vaccine antigen expression following immunization. Furthermore, the excessive induction of Type I interferons by some Ad vectors has been suggested to impair transgene expression levels, dampening subsequent immune responses. Therefore, the induction of balanced, but not excessive stimulation of innate signaling is optimal. Entry factor binding or receptor usage of distinct Ad vectors can also affect their in vivo tropism following administration by different routes. The abundance and accessibility of innate immune cells and/or antigen-presenting cells at the site of injection contributes to early innate immune responses to Ad vaccination, affecting the outcome of the adaptive immune response. Although a significant amount of information exists regarding the tropism determinants of the common human adenovirus type-5 vector, very little is known about the receptor usage and tropism of rare species or non-human Ad vectors. Increased understanding of how different facets of the host response to Ad vectors contribute to their immunological potency will be essential for the development of optimized and customized Ad vaccine platforms for specific diseases.


In vitro Methods for Assessing Immunogenicity Risk

Extensive validation in vitro assays may be cost-prohibitive, thus current practice is to initiate the analysis with advanced in silico tools (127). Folge in silico analysis, HLA binding and T cell assays can be performed or outsourced to commercial research organizations. These assays can be applied (i) at the very early stages of drug development to design de novo therapeutics with low predicted immunogenicity, (ii) at a later stage to de-immunize a clinical asset exhibiting high immunogenicity in First in Human studies, (iii) retrospectively after program termination, to decipher the mechanisms and immunogenicity risk factors underlying the high observed clinical immunogenicity. Clearly, for new (and generic versions of older) biologic drugs to be successful, immunogenicity risk assessment is most cost-effective if performed in the pre-clinical phase of development.

In vitro Tests

HLA Binding Assay

The first step in generating a T cell response is recognition of a peptide antigen presented on a HLA class II / MHC class II molecule to a T cell by an APC. Once a potential epitope is identified by in silico analysis, the prediction can be first validated through HLA binding assays, such as the assay described by Steere et al. (131), to assess the ability of a peptide to bind one or more HLA supertype alleles. Supertype alleles refers to families of HLA-DR alleles that share epitope binding motifs. By taking advantage of these supertype families, it is possible to perform binding assays on a relatively small number of alleles while covering 㺕% of the human population worldwide. A standard binding assay is described in Figure 3.

Figur 3. HLA binding assays and optimal peptide design. In brief, the peptide of interest is incubated with an allele-specific labeled tracer peptide and a soluble HLA supertype monomer are incubated to equilibrium. The following day the binding reaction is halted and the mixture is transferred to assay plates precoated with a pan anti-HLA-DR antibody and incubated overnight. Following this incubation, the plates are developed and peptide binding is indirectly measured by time resolved fluorescence spectroscopy. By using a fixed concentration of the labeled tracer peptide and a range of concentrations for the test peptide, one can generate a multi-point dose ranging curve that enables the calculation of an IC50 value which provides information not only about the ability of the peptide to bind HLA (yes/no) but also about the relative affinity of the peptide to a given HLA-DR supertype. Once can utilize the IC50 values to divide peptides into categories based on their affinity for a given HLA allele, such as high, moderate, low, and non-binding. As new technology becomes available and accessible, it will be useful to look at the kinetics of the binding reaction as well.

A key factor in generation of meaningful binding assay data is the design of the peptide sequence to be tested, and source of the test peptide. The core binding region of a class II peptide contains nine amino acids that sit within the peptide binding groove of an HLA molecule. This interaction is stabilized by flanking residues on either side of the core binding region and extend outside of the binding groove. When designing peptides for binding assays, it is important to properly center the binding motif within the peptide. Failing to do so can lead to the absence of binding despite the presence of an HLA binding motif. This is often seen in data generated by making use of overlapping peptides (83, 132).

The negative impact of improper centering of the T cell epitope in the peptide sequence (centered, with flanking residues on either side) is shown in Figure 4.

Figur 4. Optimizing test peptides for the HLA peptide binding assay. HLA binding data for Infliximab peptides, published by (83) are shown as described in the publication and compared to in silico Vorhersagen. The peptides were re-synthesized with centered HLA binding motifs and the assays were performed using a seven-point concentration curve in a competition assay. In silico predicted core residues are shown in dark blue and flanking residues predicted to stabilize binding but not to interact with the binding groove are shown in gray. Residue positions in source protein are indicated next to the results for HLA binding assays to four HLA DR alleles (Columns). (Links) Shows the results for HLA binding of original (15mer, overlapping by 5) peptides tested in vitro and published data, as compared to in silico Vorhersagen. The agreement between predicted and published is only 65%. (Rechts) Shows repeat data with optimized peptides (MOD) with centered HLA-binding motifs, and repeat assays using a more sensitive assay (competition assays, see Figure 2) as compared to in silico Vorhersagen. Centering the HLA binding motif and using a more sensitive assay improved the agreement between in silico und in vitro assays to 84%. Assay performed by BJR, peptides synthesized at Twenty-first Century Peptides, Waltham, MA).

Peptide purity can also affect the outcome of a binding assay. Purity from some manufacturers can be as low as 60% due to the manufacturing process and the purity of the raw materials. Impurities within the peptides can lead to false positives and lead to faulty conclusions. Peptides for binding assays should be at a minimum 85% pure and should be ordered as net peptide. Spurious results can also be attributed to faulty synthesis. For example, non-binding peptides may have been synthesized on the same machine as earlier runs used to synthesize HLA binding peptides. This type of contamination can derail a drug development program, see for example, reference (133).

Ex-vivo Tests

PBMC Assays

Peripheral blood mononuclear cells (PBMCs) isolated from whole blood are the most prevalent source of responder cells for in vitro cell based assays for immunogenicity prediction (19, 29). The PBMCs used in experiments can be freshly isolated from healthy volunteer or diseased individuals or thawed from a cryopreserved bank of material potentially covering an appropriate representation of disease relevant or common well-documented HLA alleles. Due to the high throughput and ease of execution, PBMC assays using whole PBMCs, or CD8+ T cell depleted PBMCs remain the most commonly performed in vitro cell based assay for measuring the potential of immunogenicity (83, 119, 134�).

In addition to typical biological products like protein, antibodies etc., product co-impurities including such as host cell proteins components, protein aggregates, synthesized peptide fragments, and others can also be evaluated in these assays. Multiple rounds of stimulation can be performed by replacing cell supernatants with fresh media spiked with the desired stimulant during extended culturing in order to expand populations of antigen specific T cells for further characterization (29, 119, 137). Schultz et al. recently reported success with a variation of the PBMC cell based assay that allows the enrichment of the number of CD4+ T cells prior to co-culture with irradiated syngeneic PBMCs in an effort to increase throughput and sensitivity (138).

The biological outcomes for T cell activation can be measured in these in vitro assays (both PBMC based and DC-T cell (see below) using a number of readouts. T-cell proliferation as assessed by thymidine incorporation and CFSE dye dilution are used frequently (7, 139, 140). Activation induced cytokine secretion may be measured using a focused (IL-2, IL-4, IFN-γ) or large multiplexed cytokine immunoassay panels and ELISPOT and are used as markers for T-cell activation and immunogenicity potential (136, 141, 142). Flow cytometry based detection of T cell responders allows a further characterization of the response in terms of intracellular cytokines, regulation of cell surface markers of activation, signal transduction events, and proliferation of specific T cell types (143, 144).

DC-T Cell Assays

In vitro co-cultures of monocyte derived dendritic cells (moDCs) and autologous CD4+ T cells are being increasingly used to evaluate immunogenicity potential of drug candidates and product CQAs. The DC-T cell or DC-PBMC methods pare the system down to the basic components of cell mediated immunity: CD4+ T cells interacting with an APC at relevant cell ratios, enhancing sensitivity as the total number of potential responder cells in the experimental system is much greater than the whole PBMC method. However, this method is time consuming and requires isolation and differentiation of monocytes into dendritic cells followed by an antigen loading/pulsing step which may be reagent, operator and material dependent.

Monocytes may be isolated from PBMC starting material using plastic adherence or isolation steps using magnetic bead separation methods. Differentiation and maturation of moDCs using cytokines or other factors is then performed (7, 57, 144�), concurrently with the addition of the desired biotherapeutic, peptide fragments, or aggregates. The matured, pulsed moDCs are then typically combined in a co-culture with autologous, purified CD4+ T cells to allow for antigen presentation and T cell activation depending on immunogenicity potential. The responses are measured as is performed for PBMC assays as described above. An advanced variation of the moDC-T cell system is the Modular Immune In vitro Construct (MIMIC ® ) model which is capable of reproducibly generating both antigen-specific innate and adaptive immune responses against biologic such as proteins, peptides, mAbs as well as novel modalities including nucleic acids (147, 148) has also been described for these purposes.

Flow Cytometry Analysis of T Cell Phenotype

Flow cytometry has become a valuable tool in the assessment of immunogenicity that allows for the characterization of an immune response down to the single cell level (149). As the instruments become more sophisticated by adding more laser and filter combinations as well as advances in staining and detection methods, a wealth of information can be obtained from a sample of patient's blood.

T cell epitopes have the capacity to be either immunogenic or tolerogenic. While it may be difficult to measure the expansion of Tregs in cell culture, the presence of Treg epitopes can be confirmed by co-incubation with effector T cells in the presence of immunogenic peptides. In this 𠇋ystander assay,” activated Tregs inhibit the antigen-specific T effector response to the immunogenic peptides (150).

A standard bystander assay makes use of the immunologic memory toward antigens such as tetanus toxin, to which the majority of the population has had previous exposure through vaccination or natural exposure. PBMCs are cultured for 10 days in the presence of inactivated tetanus toxoid and the Tregitope at varying concentrations. Cells are stained for analysis by flow cytometry (Teff cells are defined as CD3𫳔�ʿoxP3low, Treg cells are defined as CD3𫳔�lowCD25ʿoxP3hi) and proliferation can then be measured by CFSE dilution. In the presence of Tregitope, we have observed a reduced proliferation of effector T cells to tetanus toxoid compared to the tetanus toxoid alone (151).

Proteomik

MAPPS Assays

In the early 1990s an additional method called MAPPs was first described (152). This assay has proved valuable in identifying processed peptides presented on the surface of antigen presenting cells by relevant HLA. Additionally this approach attempts to understand the variability in antigen processing contributed by enzyme cleavages in healthy and diseased subjects and sequencing of the peptide associated with HLA can provide confirmation/validation to the sequences identified by algorithms.

Recent advancements in LC/MS sensitivity and proteomics analysis have enabled HLA bound mapping assays to be utilized pre-clinically to map potential antigenic sequence contained within a biological therapeutic. Studies have shown that not all potential HLA binding peptides are processed and presented by APC due to a combination of partial unfolding HLA binding and cathepsin trimming. Additionally, editing functions of HLA DM and HLA DO further enhance selectivity of the peptides selected for presentation (153).

In these assays (presented as a schematic in Figure 5) antigen presenting cells are generated in vitro and incubated with the therapeutic protein of interest for 24 h followed by a cytokine/mitogen induced maturation step to upregulate HLA expression. After cell lysis HLA receptor peptide complexes are isolated by immune precipitation followed by an acid elution step to dissociate the peptide from the HLA complex and sequenced by LC/MS. Subtraction of endogenous peptides and mapping of the peptides to the therapeutic can be done using proteomics protein database algorithms. These assays are likely to point toward antigenic peptides that can be targeted for deimmunizing protein engineering. Furthermore, whole blood from relevant diseased state can provide insights into altered presentation as well as tolerance for recombinant replacement therapeutics.

Abbildung 5. MAPPs assay design. Overview of MAPPS assay. Monocytes are isolated from whole PBMCs and differentiated into Dendritic Cells (DCs) in the presence of IL-4 and GMCSF (EIN). Immature DCs are matured by incubating cells with LPS and antigen (B). Mature DCs (C), are lysed (D). releasing peptide-loaded HLA molecules from the plasma membrane which are collected by immunoprecipitation (E). Next peptides are eluted from the HLA molecules (F) and analyzed by Mass Spec (G). Peptides are identified by screening them against a database of known antigens (H).

A case study showing the use of algorithms, innate and adaptive phase outputs as well as MAPPs was applied to anti-IL-21 receptor ATR-107 (144). In silico analysis of the primary sequence predicted two overlapping CD4 T cell epitopes in the heavy chain Complementary Determining Region (CDR) 2, and one single epitope in the light chain CDR2. The MAPPs confirmed the epitope in LC CDR2 as a dominant peptide presented by DCs. ATR-107 induced DC activation as attested by an increased expression of cell surface activation markers and cytokine production, and specific proliferation of autologous CD4 T cells in co-culture conditions. As illustrated in Figure 5, the validation of in silico predictions using MAPPS can be reassuring for developers.

However, elution of a peptide in a MAPPs assays does not confirm whether the peptide drives T-cell dependent immune response (13). T cell responses may differ depending on the phenotype of the T cells that are responding to the sequence. Using MAPPs without additional tools that explore the phenotype of T cells that respond to the eluted peptides, may over predict immunogenicity.

The importance of individual epitopes driving immunogenicity was also reinforced in a recent demonstration by Cassotta et al. who conducted a MAPPS analysis of natalizumab immunogenicity, a humanized antibody directed against alpha4 integrins (82). Taking advantage of a combination of in silico and in cellular in vitro assays, in particular a MAPPs assay performed with B cells isolated from patient peripheral blood, the authors established that two multiple sclerosis patients treated with Natalizumab who developed neutralizing ADA mounted a T cell response against a CD4 T cell epitope located in the V region of the light chain.


Materialen und Methoden

Generation of the pCAG Prdm1β Vector and pCAG CAT 1b8 Transgenic Line

The coding sequence of the murine truncated form of Prdm1 (Prdm1β) ( Gyory et al. 2003) cloned by rapid amplification of cDNA-ends by polymerase chain reaction (RACE PCR) (Vincent SD, unpublished data) linked to an IRES green fluorescent protein (GFP) was cloned into the conditional pCAG CAT vector (kindly provided by Y. Saga, National Institute of Genetics, Japan) ( Watanabe et al. 2006). Efficient conditional expression of the Prdm1β protein was checked by co-transfection in C2C12 cells with a plasmid expressing Cre followed by green fluorescent protein (GFP) expression and western blot analysis. Linearized vector was microinjected by the Centre d'Ingénierie Génétique Murine platform (Institut Pasteur, France) to generate transgenic mouse lines. Three independent lines were established, only one of which showed bright GFP expression after Cre recombination. This line, Tg(pCAG CAT 1b8), was employed in this study, using the Myf5 Cre/+ line.

Mouse Strains and Genotyping

Die Blimp1-mEGFP, Mrf4 − (Myf6 tm1Eno ), Myf5 Cre , Myf5 lox , Myf5 nlacZ , Myod1 − , Pax3 Cre , Prdm1 BEH , Prdm1 CA , Schh − , Smo − alleles have been described elsewhere ( Rudnicki et al. 1992 Zhang et al. 1995 Tajbakhsh, Bober, et al. 1996 Tallquist et al. 2000 Zhang et al. 2001 Shapiro-Shelef et al. 2003 Kassar-Duchossoy et al. 2004 Engleka et al. 2005 Ohinata et al. 2005 Vincent et al. 2005). Die Myog − (Myogenin) allele was obtained from the Myog flox allele ( Knapp et al. 2006) by crossing with the PGKCre transgenic line ( Lallemand et al. 1998). Mouse care and procedures were in accordance with institutional and national guidelines. Embryonic day (E) 0.5 was counted from the appearance of a vaginal plug.

Whole-Mount In Situ Hybridization and Immunolocalization

Whole-mount in situ hybridization was performed according to standard protocols ( Nagy et al. 2003). Prdm1 ( Vincent et al. 2003) and Myog ( Sassoon et al. 1989) probes have been previously described. Einer der Sox6 probes was produced from a plasmid template kindly given by N. Hagiwara (University of California, Davis): The template was linearized with NotI and the probe was transcribed using SP6 RNA polymerase (Promega). Der Zweite Sox6 probe was transcribed using SP6 RNA polymerase from a template generated by PCR (GCA GCC ACA CGG AGT TGA TG and CAT TTA GGT GAC ACT ATA GTG ATG GTG TGG TCG TTG CC primers). Both probes gave similar results.

Embryos were dissected at E10.5 and then fixed for 2 h in 4% paraformaldehyde at 4 °C. After three rinses, embryos were transferred to 15% sucrose/phosphate buffered saline and embedded in 7% gelatin and 15% sucrose. Embryos were sectioned on a Leica cryostat, to give 20-μm thick slices (or 50-μm thick slices for Sox6 und Myog whole-mount in situ hybridized embryos). As primary antibodies, a chick polyclonal for GFP (Invitrogen), rabbit polyclonal antibodies Myogenin (Santa Cruz), and Mrf4 (Invitrogen), mouse monoclonal antibodies MF20 (all MyHC) (DSHB), Pax3 (DSHB), and Ki67 (BD Biosciences), and a rat monoclonal antibody for Prdm1 (6D3 Santa Cruz) were used. As secondary antibodies, conjugated Alexa 488/546 against the different species (Invitrogen) were used. Immunolocalization was performed as described and analyzed with a Zeiss ApoTome system.

Quantitative Reverse Transcription–PCR Analysis

Total RNA was prepared from E10.5 and E11.5 embryos. Briefly, individual embryos were staged by counting the somite number and lysed in TRIzol (Invitrogen). After genotyping, total RNA was prepared according to the manufacturer’s protocol (Applied Biosystem). RNA was purified on PureLink RNA mini kit columns (Invitrogen). RNA was then quantified using a nanodrop spectrophotometer. Five hundred nanograms of RNA were retro-transcribed with random hexamers and Superscript II (Invitrogen). Quantitative PCR was performed using the Power SYBR Green PCR Master Mix on a StepOne Plus Real-Time PCR system (Applied Biosystem), with RNA extracted from embryos with the same number of somites. Three mutant and two control embryos with the same somite number were analyzed as triplicates. Primer sequences have been published elsewhere ( Niro et al. 2009). Results were standardized to GAPDH und Myog Transkripte. Data were analyzed using the Mann–Whitney non parametric test (http://www.anastats.fr/).


Are innate immune signaling pathways in plants and animals conserved?

Although adaptive immunity is unique to vertebrates, the innate immune response seems to have ancient origins. Common features of innate immunity in vertebrates, invertebrate animals and plants include defined receptors for microbe-associated molecules, conserved mitogen-associated protein kinase signaling cascades and the production of antimicrobial peptides. It is commonly reported that these similarities in innate immunity represent a process of divergent evolution from an ancient unicellular eukaryote that pre-dated the divergence of the plant and animal kingdoms. However, at present, data suggest that the seemingly analogous regulatory modules used in plant and animal innate immunity are a consequence of convergent evolution and reflect inherent constraints on how an innate immune system can be constructed.