Information

Welche Möglichkeiten gibt es, die Enzymaktivität in Nicht-Modell-Insektengewebe quantitativ nachzuweisen?

Welche Möglichkeiten gibt es, die Enzymaktivität in Nicht-Modell-Insektengewebe quantitativ nachzuweisen?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Evolution/Genomiker hier: Welche Möglichkeiten gibt es, um die Aktivität oder das Vorhandensein breiter Kategorien von Enzymen – wie Peroxidasen oder Katalasen – zu messen, die in einem bestimmten Gewebe (in einem Nicht-Modellinsekt) aktiv sind?

Mir ist bewusst, dass Antikörper, z.B. ELISA kann ein Ansatz sein, bin mir aber nicht sicher, ob es die beste Option ist oder welche Alternativen es gibt. Sind sequenzbasierte Ansätze verfügbar, wenn ich die Peptidsequenz (oder zumindest eine bestimmte Funktionsdomäne, dh Pfam ID) kenne?


Grenzen in der Physiologie

Die Zugehörigkeiten der Herausgeber und Gutachter sind die neuesten Angaben in ihren Loop-Forschungsprofilen und spiegeln möglicherweise nicht ihre Situation zum Zeitpunkt der Überprüfung wider.



TEILEN EIN

Zugangsoptionen

Erhalten Sie vollen Zugriff auf Zeitschriften für 1 Jahr

Alle Preise sind Nettopreise.
Die Mehrwertsteuer wird später an der Kasse hinzugefügt.
Die Steuerberechnung wird während des Bezahlvorgangs abgeschlossen.

Erhalten Sie zeitlich begrenzten oder vollständigen Artikelzugriff auf ReadCube.

Alle Preise sind Nettopreise.


I. EINLEITUNG

Vor 20 Jahren wurde die erste Version des menschlichen Genoms sequenziert und veröffentlicht (Venter et al., 2001). Seitdem sind Sequenziertechnologien und die von ihnen erzeugten „Omics-Datensätze“ aus der biologischen Forschung nicht mehr wegzudenken. Der Fortschritt in den letzten zwei Jahrzehnten von der Sanger-Sequenzierung zur Next-Generation-Sequenzierung (NGS) und in jüngerer Zeit zur Long-Read-Sequenzierung von DNA und RNA hat zu Kostensenkungen, verbesserter Zugänglichkeit, technologischem Fortschritt und Verfügbarkeit von unterstützenden Werkzeugen und Ressourcen geführt . Viele Open-Source-Softwarepakete und Annotationspipelines wurden entwickelt, nicht nur für die Genomik, sondern auch für die breitere Familie der Omics-Disziplinen, einschließlich Proteomik, Metabolomik (z. B. Glykomik und Lipidomik) und andere. Für die Zwecke dieser Übersicht bezieht sich der Begriff „Omics“ ausschließlich auf die Ansätze der Genomik, Transkriptomik und Proteomik, die in der Bioadhäsionsliteratur in den letzten zehn Jahren immer beliebter geworden sind. Die isolierte Charakterisierung einzelner Gene oder Proteine ​​stellt keine Genomik oder Proteomik dar. „Omics-Studien produzieren Daten für das gesamte untersuchte System, die dann auf verschiedene Weise verfeinert werden, um die interessierenden Gene oder Proteine ​​​​und ihre Funktionen aufzudecken. Transkriptomik über Die RNA-Sequenzierung (RNA-seq) bietet eine „bottom-up“-Methode zur Identifizierung mutmaßlicher Proteine, basierend auf dem Prinzip, dass Moleküle der Boten-RNA (mRNA) verwendet werden, um Gene quantitativ in Proteine ​​zu übersetzen. Die Proteine ​​werden dann in einem unmodifizierten Zustand oder als posttranslational modifizierte Varianten sezerniert, die durch Proteomik identifiziert werden können. Gene von Interesse können auf verschiedene Weise gezielt werden, häufig jedoch durch die Kombination unterschiedlicher Gewebeproben-, Analyse- und Vorhersagemethoden.

Zum Zeitpunkt des Schreibens waren über 55000 Genomdatensätze (https://www.ncbi.nlm.nih.gov/genome/) auf den Servern des National Center for Biotechnology Information (NCBI) öffentlich verfügbar. Die Anzahl der öffentlich zugänglichen Transkriptom- und Proteom-Datensätze ist aufgrund der Hinterlegung der Daten in einer Vielzahl von Archiven weniger eindeutig. Allerdings gehen auch die Gesamtzahlen für diese Art von Datensätzen in die Tausende. Beispielsweise bietet eine Suche im NCBI SRA-Archiv mit dem Schlüsselwort „transcriptomic“ Links zu über 5000 BioProjekten und über 11000 proteomische Datensätze sind auf dem EMBL-EBI PRIDE-Server verfügbar. Diese Zahlen stehen beispielhaft für die „Omics-Revolution in den gesamten Biowissenschaften, von der Erforschung menschlicher Krankheiten über die Kulturpflanzenproduktion bis hin zur Entdeckung neuer Verbindungen (Fukushima et al., 2009 Tanaka, 2010). Es überrascht daher nicht, dass der Omics-Ansatz auch in der Bioadhäsionsforschung übernommen wurde, und es ist an der Zeit zu fragen, wie sich dies auf unser grundlegendes Verständnis der Bioadhäsionsmechanismen ausgewirkt hat.

Adhäsion über ein sezerniertes chemisches Bioadhäsiv kann entweder reversibel oder irreversibel sein, was eine vorübergehende oder dauerhafte Befestigung erleichtert (Hennebert et al., 2015B Lengerer & Ladurner, 2018). Viele Arten nutzen Adhäsion für essentielle Prozesse, von denen ihr Überleben abhängt. Bioadhäsion hat sich wahrscheinlich mehrmals unabhängig voneinander entwickelt und war in jedem Fall eine Anpassung eines anderen bereits bestehenden physiologischen Prozesses. Bioadhäsionsmechanismen sind zwar vielfältig und komplex, wurzeln aber auch in physiologischen Kernprozessen, die mit „omics-basierten Ansätzen“ abgefragt werden können. Tatsächlich ist es möglich, dass „omics-basierte Adhäsionsstudien“ entweder alte physiologische Prozesse wie die Speichelsekretion identifizieren könnten (Sehnal & Akai, 1990 Yan et al., 2020), aus denen sich die Adhäsion in verschiedenen Abstammungslinien entwickelte, oder Ähnlichkeiten zwischen den Abstammungslinien durch das Vorhandensein funktioneller Gen- und Proteindomänen. Die wünschenswerten Eigenschaften bioadhäsiver Grenzflächen in der Natur werden natürlich nicht allein durch die Chemie bereitgestellt. Sogenannte „nass“ (Wilhelm et al., 2017 ) und „trocken“ (Labonte et al., 2016 ) Adhäsionssysteme verlassen sich auf die Mechanik, um ihre Leistung zu verbessern: modulierende Klebstoffkontaktfläche (Crawford et al., 2016 ), Energiedissipation unter Belastung an der Mikro- (Cohen et al., 2019 ) und Nanoskalen (Phang et al., 2010 ) und ermöglicht eine kontrollierte Ablösung (Federle & Labonte, 2019 ). Der Maßstab ist wichtig, da es unwahrscheinlich ist, dass Extrapolationen aus Experimenten auf der Nanoskala die wahren Eigenschaften auf der Mikro- oder Makroskala widerspiegeln (Desmond et al., 2015). Diese mechanischen Phänomene liegen außerhalb des Rahmens dieser Übersicht, deren Schwerpunkt auf der Identifizierung und Charakterisierung von sekretierten Materialien liegt.

Klebstoffe, die von wirbellosen Wassertieren sezerniert werden, enthalten Proteine, Glykane (Polysaccharide) und Lipide in unterschiedlichen Anteilen. Oft sind Metalle beteiligt und tragen maßgeblich zur Vernetzung bei (Richter, Grunwald & von Byern, 2018). Das Interesse an Bioklebstoffen wurde in erheblichem Maße durch die Nachfrage nach neuartigen biomimetischen Klebstoffen getrieben, deren Fähigkeiten über die derzeit für Verbraucher verfügbaren synthetischen Klebstoffe hinausgehen. Das Verständnis der Mechanismen, die die Adhäsion in aquatischen Systemen steuern, gilt als zentral für die Entwicklung bioinspirierter Klebstoffe für die Bau-, Biomaterial- und Fertigungsindustrie sowie für klinische Therapien (Palacio & Bhushan, 2012). Viele gegenwärtige synthetische Klebstoffe schädigen die Oberflächen, auf die sie aufgetragen werden, und sind kontaminierend, giftig oder umweltgefährdend. Darüber hinaus haben die meisten der derzeit erhältlichen Produkte eine geringe Wirksamkeit auf hydratisierten Oberflächen. Der Ersatz durch bioinspirierte Klebstoffe könnte daher geeignetere und nachhaltigere Alternativen bieten (Richter et al., 2018 ).

Marine Bioadhäsive von biomimetischem Interesse wurden kürzlich von Almeida, Reis & Silva ( 2020 ) überprüft. Der Zweck dieser Überprüfung besteht nicht darin, einen ähnlichen anwendungsorientierten Überblick zu geben. Vielmehr wollen wir die Trends in der Bioadhäsionsforschung identifizieren, die das aktuelle Verständnis beeinflusst haben, und fragen: „Wo als nächstes?“. Der wiederauflebende Fokus auf die Grundlagenbiologie aquatischer Adhäsionssysteme ist zu begrüßen und wurde teilweise durch die „Omics-Revolution“ vorangetrieben. Aber jetzt ist es an der Zeit, über die Verwendung dieser Daten hinaus zu schauen, Wege zu finden, um Strenge und Konsistenz in die Analysen zu integrieren und sicherzustellen, dass die Schlussfolgerungen der Studien sowohl ausreichend als auch aussagekräftig sind. In diesem Artikel werden daher Stärken, Chancen, Grenzen und zukünftige Herausforderungen von Omics im Kontext der Bioadhäsionsforschung behandelt. Um einige Kernpunkte besser zu veranschaulichen, haben wir gegebenenfalls Originaldaten und Analysen beigefügt.


REAGENZIEN UND LÖSUNGEN

Erststrangpuffer, 5×

  • 375 mM KCl
  • 15 mM MgCl2
  • 250 mM Tris·Cl, pH 8,3
  • Bis zu 1 Jahr bei -20 °C lagern

Pfu-sso7d-Puffer, 5×

  • 0,5 mg/ml Rinderserumalbumin (BSA Sigma B6917)
  • 50 mM KCl
  • 10 mM MgSO4
  • 50 mM Ammoniumacetat
  • 150 mM Tris·Cl, pH 10
  • 0,5% (v/v) Triton X-100
  • Bis zu 1 Jahr bei -20 °C lagern

Natriumcitratpuffer, pH 6,4, 0,1 M

Kaufen Sie Zitronensäure-Monohydrat (210,14 g/mol) und Natriumcitrat-Dihydrat (294,12 g/mol). Bereiten Sie 80 ml destilliertes Wasser in einem geeigneten Behälter vor. 0,21 g Citronensäure-Monohydrat zu der Lösung geben. 2,65 g Natriumcitrat-Dihydrat zu der Lösung geben. Stellen Sie die Lösung mit HCl oder NaOH auf den gewünschten endgültigen pH-Wert ein. Fügen Sie destilliertes Wasser hinzu, bis das Volumen 0,1 Liter beträgt.


Zellfreie Strategien für die nachhaltige Materialbioherstellung

Lebende Zellen und Organismen haben hochkomplexe Enzyme und Stoffwechselprozesse entwickelt, die eine äußerst vielfältige Biochemie hervorbringen. Die Erforschung dieser natürlichen Biochemie kann zu wichtigen grundlegenden Fortschritten in unserem Verständnis der Naturstoffsynthese führen. Grundlegende Entdeckungen in der funktionellen Genomik, im Zellstoffwechsel und in der Naturstoffsynthese sind ebenfalls wichtig, da sie neue Biosynthesewegedesigns für die Produktion biologischer Materialien inspirieren könnten. In der synthetischen Biologie können zellfreie Metabolic-Engineering-Ansätze (CF-ME) ganze Biosynthesewege rekonstruieren, indem entweder Zellextrakte aus verschiedenen Arten, gentechnisch veränderte Zellen und/oder zellfrei synthetisierte rekombinante Enzyme verwendet werden (Karim und Jewett, 2018 Martin et al., 2018 Yim et al., 2019 Bowie et al., 2020) (Abbildung 1). Außerdem können zellfreie Proteinsynthese- und Zellextrakt-Biotransformationsreaktionen kombiniert werden, um komplexere zellfreie Reaktionen zu erzeugen (Karim und Jewett, 2018, Kelwick et al., 2018). Ein weiterer wichtiger Vorteil bei der Verwendung zellfreier Ansätze besteht darin, dass durch die direkte Zugabe der erforderlichen rekombinanten Enzyme, Enzym-Cofaktoren oder chemischen Substrate, die für jede Stufe eines Biosynthesewegs benötigt werden, Engpässe bei Reaktionswegen identifiziert werden können (Dudley et al., 2015 .). ). Immer ausgefeiltere kombinatorische CF-ME-Strategien wurden zusammen mit Hochdurchsatzautomatisierung, Deep Data Omics und Design of Experiments (DoE)-Ansätzen zur zellfreien Reaktionsoptimierung eingesetzt (Caschera et al., 2018 Jiang et al., 2018 Dopp et al., 2019). Diese Fortschritte haben die Durchführbarkeit der Refaktorisierung und Optimierung feinchemischer oder Naturstoffbiosynthesewege innerhalb kurzer Zeiträume erheblich verbessert (Dudley et al., 2015 Korman et al., 2017 Moore et al., 2017a Wilding et al., 2018).

Zellfreie Ansätze der synthetischen Biologie wurden auch auf die de novo Bioproduktion biologischer Materialien, einschließlich Biopolymere oder deren Monomere, Cellulosematerialien und Nanopartikel (Tabelle 1). Die maximalen zellfreien Bioproduktionsausbeuten oder Reaktionseffizienzen mehrerer berichteter Materialien waren jedoch im Allgemeinen niedrig oder nicht spezifiziert. Beispiele für zellfrei hergestellte Materialien und ihre berichteten maximalen Produktionsausbeuten und Reaktionseffizienzen umfassen Bio-Cellulose (3,726 ± 0,05 g/L 57,68 %) (Ullah et al., 2015), Chitin (Ausbeuten nicht angegeben) (Jaworski et al., 1963 Endoh et al., 2006), Milchsäure (6,6 ± 0,1 mM 47,4 ± 3,9 %) (Kopp et al., 2019), Goldnanopartikel (Ausbeuten nicht angegeben) (Chauhan et al., 2011 Krishnan et al., 2016), (R)-3-Hydroxybutyrat-CoA (32,87 ± 6,58 μM) (Kelwick et al., 2018), Silbernanopartikel (Ausbeute nicht angegeben) (Costa Silva et al., 2017) und Seidenfibroin (Ausbeute nicht angegeben) (Greene et al., 1975 Lizardi et al., 1979). Schlechte zellfreie Produktionsausbeuten und -effizienzen können auf eine Vielzahl von Faktoren zurückzuführen sein, darunter eine schnelle Erschöpfung der Komponenten des Reaktionsenergiemixes (z. B. ATP, Aminosäuren), die Bildung von hemmenden Abfallprodukten (z. B. anorganische Phosphate) oder unerwünschte Nebenreaktionen, die lenken Reaktionsflüsse von wünschenswerten Pfaden ab (Caschera und Noireaux, 2014). Aufgrund dieser Einschränkungen ist die zellfreie synthetische Biologie möglicherweise keine ideale Produktionsmethode für einige biologische Materialien. Obwohl die tatsächlichen Ausbeuten bei der Produktion von zellfreiem Material relativ gering sein können, sind diese Ansätze dennoch vorteilhaft für die Prototypenerstellung verschiedener Biosynthesewege, Substrate oder Reaktionsbedingungen, um beides zu verbessern in vitro und Gesamtzellproduktionserträge. Ein Beispiel ist die Verwendung zellfreier Assays zur Charakterisierung von Biosynthesewegen von Polyhydroxyalkanoaten (PHAs) aus phaCAB Operons, die auch verbesserten in vivo PHA-Produktion (Kelwick et al., 2018). Darüber hinaus zeigte dieselbe Studie auch, dass die Zellextrakt-Biotransformation von Molkepermeat in 3-Hydroxybutyrat (3HB) gleichzeitig mit der zellfreien Proteinsynthese eines potentiellen Acetyl-CoA-Recycling-Enzyms gekoppelt werden könnte (Kelwick et al., 2018 ). Somit wird hervorgehoben, dass kombinatorische zellfreie Reaktionsformate eine nützliche Strategie für die Prototypenerstellung und Optimierung von Bioplastik-Pfad sein können.

Interessanterweise kann in einigen Fällen die zellfreie Bioproduktion tatsächlich ein wünschenswerterer Herstellungsweg sein. Zum Beispiel mehrere in vitro Studien zur Produktion von Gold- oder Silbernanopartikeln berichteten über wünschenswerte Eigenschaften von Nanopartikeln (z. B. Größe/Zeta-Potenzial) und/oder einfachere Reinigungsprotokolle innerhalb zellfreier Bioproduktionsreaktionen als Verfahren zur Ganzzellproduktion (Krishnan et al., 2016 Costa Silva et al., 2017 ). Die zellfreie Bioproduktion kann auch in industriell relevanten Maßstäben durchgeführt werden, wie Sutro biopharma veranschaulicht, die eine hochgradig skalierbare GMP-konforme Plattform für die zellfreie Proteinsynthese entwickelt haben, um therapeutische Proteine ​​innerhalb von 100 L Bioreaktor-Reaktionsvolumen herzustellen (Zawada et al., 2011). Für die zellfreie Materialproduktion wurde ein hocheffizientes synthetisches Biochemiemodul entwickelt, um Glucose in biobasierte Chemikalien umzuwandeln, darunter das PHA-Biokunststoffmonomer Polyhydroxybutyrat (PHB) (Opgenorth et al., 2016). Um dies zu erreichen, wurden gereinigte rekombinante Enzyme verwendet, um Kernelemente der Pentose-, Bifido-, Glykolyse- und PHB-Wege zu rekonstituieren (Opgenorth et al., 2016). Die Ausbeuten (40 g/L) und Effizienzen (90 %) der zellfreien PHB-Produktion waren beeindruckend und liegen vielversprechend nahe an industriell attraktiven Maßstäben (Opgenorth et al., 2016). Diese Verbesserungen bei der PHB-Produktion sind ebenfalls zu begrüßen, da PHB sowie andere PHA-Biopolymere biologisch abbaubar sind und möglicherweise als 𠆍rop-in’-Ersatz für ölbasierte Kunststoffe (z. B. Lebensmittelverpackungen) oder als Biomaterialien für Tissue verwendet werden können Ingenieurwesen (Choi SY et al., 2019 Tarrahi et al., 2020). PHAs sind auch aufgrund ihrer industriellen Bedeutung und der Vielfalt zellfreier Strategien, die in der PHA-Forschung angewendet wurden, ein interessantes Beispiel (Tabelle 1). Aufbauend auf diesen Beispielen könnten CFME-Ansätze verwendet werden, um eine größere Vielfalt von PHAs-Biopolymeren zu erforschen, da PHA-Biopolymere aus einer Vielzahl verschiedener Wildtyp- und/oder synthetischer Monomere (� verschiedene Monomere existieren) zusammengesetzt sein können, um komplexe Copolymere zu erzeugen , mit einer Reihe von Materialeigenschaften (Choi SY et al., 2019). Zukünftige zellfreie Untersuchungen der synthetischen Biologie von PHAs werden wahrscheinlich neue PHAs-Biopolymere mit einzigartigen Eigenschaften freisetzen (Chen und Hajnal, 2015) und daher die Entwicklung von Biokunststoffmaterialien beschleunigen.

Mikrobielle (in vivo) Die Herstellung von PHAs wurde in den letzten Jahrzehnten im industriellen Maßstab kommerziell hergestellt. Leider wurden die kommerziellen Auswirkungen von PHA-basierten Biokunststoffen in der Vergangenheit durch ihre höheren Produktionskosten als aus Öl gewonnene Kunststoffe verhindert (Chen et al., 2020). Durch das rationale Design von wurden jedoch effizientere Produktionsprozesse für PHAs entwickelt phaCAB Biosynthesewege (Hiroe et al., 2012 Kelwick et al., 2015b Li et al., 2016 Tao et al., 2017 Zhang X. et al., 2019), Schlüsselprozesse des Metabolitenrecyclings (z. B. Acetyl-CoA) (Matsumoto et al., 2013 Beckers et al., 2016), alternative mikrobielle Produktionswirte (z. B. Halomonas sp., Tan et al., 2011) und die Verwendung von industriell gewonnenen, kostengünstigen Rohstoffen (z. B. Molkepermeat) (Wong und Lee, 1998 Ahn et al., 2000 Kim, 2000 Nikel et al., 2006 Cui et al al., 2016 Nielsen et al., 2017). Interessanterweise sind mehrere dieser mikrobiellen PHA-Produktionsstrategien auch mit zellfreien synthetischen Biologiereaktionen kompatibel. Insbesondere die Verwendung lokal bezogener, kostengünstiger Rohstoffe (z. B. Molkepermeat) kann dazu beitragen, die Produktion von PHAs auf Zellextraktbasis wirtschaftlich rentabler zu machen (Kelwick et al., 2018). Ein ähnlicher Ansatz wurde bereits für die zellfreie Milchsäureproduktion aus verbrauchtem Kaffeesatz pilotiert (Kopp et al., 2019) und könnte zu einer verallgemeinerten Strategie für eine nachhaltige Bioproduktion von zellfreien Materialien werden (Abbildung 2). Wir würden argumentieren, dass die Kombination zellfreier Extrakte mit lokalen Rohstoffen den sofortigen Zugang zu sehr unterschiedlichen zellulären Biochemien und kostengünstigen Substraten (z und Fong, 2015 Le Feuvre und Scrutton, 2018). Ebenso wie lyophilisierte zellfreie Reaktionen die On-Demand-Produktion von Biotherapeutika ermöglichen (Pardee et al., 2016b), stellen wir uns auch vor, dass zellfreie Reaktionen eines Tages zu einer schnellen und verteilten On-Demand-Produktion biologischer Materialien führen könnten oder Biofunktionalisierung.

Figur 2. Nachhaltige zellfreie Bioherstellung von biologischen Materialien. Das Schema zeigt die lokale, auf Abruf zellfrei vermittelte Bioherstellung von biologischen Materialien. Lokale Einsatzmaterialien können potentiell als Ersatz für teure Reaktionsenergie-Mix-Komponenten verwendet werden oder um die enzymatischen Co-Faktoren und Biosyntheseweg-Substrate bereitzustellen, die erforderlich sind, um biologische Materialien von Interesse herzustellen.


Material & Methoden

Insektenkulturen, Bakterienwachstum und Verfahren der weiblichen Infektion

Alle in dieser Studie verwendeten Insekten stammten aus Stammkulturen, die unter Standardlaborbedingungen (24 ± 2 °C, 70 % RH in permanenter Dunkelheit) gehalten wurden. Sie wurden bereitgestellt nach Belieben mit Kleiemehl, Wasser und einmal wöchentlich mit Apfel ergänzt.

Weibchen wurden mit dem Gram-positiv geprimt Bacillus thuringiensis (Bt) und das Gram-negativ Serratia entomophila (Se). Diese Bakterien sind bekannte natürliche Krankheitserreger von T. molitor [30] und sie induzieren bei diesem Insekt kontrastierende Immun-Priming-Reaktionen innerhalb und zwischen den Generationen [15,16,19]. Die Bakterien wurden alle vom Institut Pasteur (Bt: CIP53.1 Se: CIP102919) und Suspensionen für das Immunpriming wurden wie in [15] beschrieben hergestellt. Kurz gesagt wurden die Bakterien über Nacht bei 28ºC in flüssigem Nährmedium (10 g Bactotrypton, 5 g Hefeextrakt, 10 g NaCl in 1000 ml destilliertem Wasser, pH 7) gezüchtet.Sie wurden dann in 0,5% Formaldehyd, hergestellt in PBS, 30 min inaktiviert und dreimal in PBS gespült. Die Inaktivierung wurde getestet, indem eine Probe der Bakterienlösung auf sterilem Nährmedium mit 1 % Bakterienagar ausplattiert und 24 Stunden bei 28 °C inkubiert wurde. Aliquots wurden bis zur Verwendung bei –20°C aufbewahrt.

Bei allen Experimenten wurde bei jungfräulichen Weibchen (10 ± 2 Tage nach dem Auflaufen) ein Immun-Priming durchgeführt, indem sie zunächst 10 Minuten lang zur Immobilisierung auf Eis gekühlt und dann eine 5-μl-Suspension inaktivierter Bakterien injiziert wurde (Bt oder Se) oder nur Puffer (Verfahrenskontrolle für die Wirkung der Injektion). Die Injektionen erfolgten durch die Pleuramembran zwischen dem zweiten und dritten Abdominalsegment unter Verwendung von sterilen Glaskapillaren, die mit einem Elektrodenzieher (Narashige PC-10) zu einer feinen Spitze herausgezogen wurden. Für beide injizierten Bakterien wurde die Konzentration unter Verwendung einer verbesserten Zellzählkammer von Neubauer auf 10 8 Mikroorganismen pro ml eingestellt [16]. Unmittelbar nach der Behandlung wurden die Weibchen mit einem jungfräulichen und immunologisch naiven Männchen gleichen Alters gepaart und in einer Petrischale mit Weizenmehl, Apfel und Wasser unter Standardlaborbedingungen (24 °C, 70 % RH dunkel .) Eier produzieren gelassen ).

De novo Montage T. molitor Illumina-Transkriptom (RNAseq)

In Abwesenheit des Genoms eine Referenz T. molitor Transkriptomdatenbank (Abb. 1-1) war notwendig, um Kandidatenproteine ​​aus der proteomischen Studie zu identifizieren. Da wir eine Datenbank erstellen wollten, die mit Transkripten angereichert ist, die an Immun- und Stressreaktionen beteiligt sind, wurde die Sequenzierung an gepoolter RNA von Individuen verschiedener Entwicklungsstadien (dritte Larven, Puppen, Erwachsene), Geschlecht (Männchen und Weibchen) und physiologischen Bedingungen durchgeführt. Genauer gesagt wurden Gruppen von 10 Individuen von Larven im dritten Larvenstadium, ausgewachsene Männchen oder ausgewachsene Weibchen, entweder nicht behandelt oder mit injiziert B. thüringensis, oder mit S. Entomophilie Bakterien wie oben beschrieben oder mit dem Wirkstoff Phenobarbital (0,1%) injiziert, von dem bekannt ist, dass er bei Insekten eine Entgiftungsreaktion auslöst [69]. Wir verwendeten auch RNA von 30 Puppen (unbehandelt wegen ihrer höheren Stressempfindlichkeit), was zu einer Gesamtzahl von 150 Individuen führte. RNA wurde 48 Stunden nach dem Priming extrahiert, unter Verwendung der Trizol-Methode (TRIzol LS Reagent, Invitrogen) gemäß den Anweisungen des Herstellers.

Die Sequenzierung erfolgte auf einer Illumina HiSeq2000 Genome Analyzer-Plattform unter Verwendung der Paired-End-(2x100bp)-Read-Technologie mit RNA, die auf durchschnittlich 380 Nukleotide fragmentiert war. Die Sequenzierung von zwei technischen Replikaten wurde von Eurofins-mwg-operon durchgeführt und führte zu insgesamt 70 bzw. 51 Millionen Paired-End-Reads. Qualitätskontrollmaßnahmen, einschließlich der Filterung hochwertiger Reads basierend auf dem in fastq-Dateien angegebenen Qualitätsscore (FactQC, Version 0.10.1), Entfernung von Reads mit Primer-/Adaptersequenzen und Trimmen der Read-Länge, wurden mit Trimmomatic (Version 0.3.1 [70]). Reads mit einem Phred-ähnlichen Score <20 und einer Read-Länge von weniger als 40 Nukleotiden wurden entfernt. Nach dieser Qualitätsfilterung ergaben die beiden technischen Replikate insgesamt 58 und 44 Millionen Reads, die gepoolt wurden, um ein Referenztranskriptom zu erhalten. Die de novo Transkriptom-Assembly wurde mit Trinity (Version 2014/09/07 [71]) mit k-meren der Größe 25, T = 50 und Jaccard-Ähnlichkeitskoeffizienten (Option von Trinity, um chimäre Transkripte zu reduzieren) durchgeführt. Unsere de-novo Transkriptom enthält 110.963 Transkripte mit einer N50 (Sequenzlänge des kürzesten Contigs bei 50% der gesamten Transkriptomlänge) von 1261 Nukleotiden und einer ExN50 von 1135 Nukleotiden. Wir haben Bowtie (Version 0.12.9 [72]) verwendet, um Reads in unserem Transkriptom auszurichten. Vollständige Metriken finden Sie in Tabelle 1. Um die Anzahl der Transkripte zu reduzieren, haben wir mit TGICL (Version 2.1 [73]) eine Superassemblierung mit Standardeinstellungen durchgeführt.

Die Übersetzung des Transkriptoms erfolgte mit FrameDP (Version 1.2.0 [74]) und Uniprot (uniprot.org, Version vom 29. April 2015) wurde als Datenbank für die maschinelle Lernphase zur Erkennung des besten genetischen Codes verwendet. Die resultierenden vorhergesagten Proteine ​​(45.505) wurden mit BLASTP (Version 2.2.30+, e-Wert von 10 −5 ) und verglichen Tr. Castaneum Proteom verfügbar bei Uniprot (Version 14April2015). Die funktionelle Proteom-Annotation wurde mit InterProScan (Version 5 [75]) auf der GALAXY-BBRIC INRA-Plattform (bbric.toulouse.inra.fr) unter Verwendung der InterPro-Datenbank (Version 52) vorhergesagt. Die CEGMA-Analyse wurde verwendet, um die Qualität des Transkriptom-Proteoms zu validieren [76]. Unser Referenztranskriptom, sein Proteom und seine Annotation wurden in den folgenden Experimenten als Quelle für Kandidatengene und Proteine ​​verwendet. Sie stehen zum Download auf der IHPE-Laborwebsite (http://ihpe.univ-perp.fr/acces-aux-donnees) und in der NCBI-Datenbank unter der BioProject ID PRJNA646689 mit den SRA-Nummern SRR12235350 und SRR12235349 zur Verfügung.

Globale Ei-Proteom- und AMPs-Analyse

Proteomische und peptidomische Analysen wurden an Eiern durchgeführt, die gelegt oder direkt aus den Eierstöcken von geprimten und Kontroll-Weibchen extrahiert wurden. Zwei komplementäre Experimente, 2D-DiGE (Abb. 1-2a) und Massenspektrometrie (Abb. 1-2b), wurden durchgeführt, um die Proteine ​​und Peptide zu charakterisieren, die zwischen Eiern, die von geprimten Weibchen stammen, bzw. denen von Kontrollen unterschiedlich reichlich vorhanden sind.

Bedenkt, dass T. molitor Es wurde berichtet, dass Weibchen ihre Eier von Tag 2 bis Tag 8 nach dem mütterlichen Priming durch TGIP schützen [17], nur Eier, die nach dem dritten Tag nach der mütterlichen Immunbehandlung produziert wurden, wurden gesammelt ( 6A ). Die Eier wurden entweder direkt in den Eierstöcken gesammelt oder frisch in die Petrischale gelegt. Im letzteren Fall wurden die abgelegten Eier immer innerhalb von 16 Stunden nach dem Legen gesammelt, um sicherzustellen, dass der Embryo seine Entwicklung noch nicht begonnen hat. Um dies zu ermöglichen, wurden die Paare drei Tage nach der mütterlichen Behandlung in eine neue Petrischale überführt, die mit frischem Mehl, Apfel und Wasser versorgt wurde. Eier, die in diese neue Petrischale produziert wurden, wurden 16 Stunden nach dem Transfer des Paares gesammelt ( 6A ). Zum Zeitpunkt der Eisammlung wurden die Weibchen 10 min auf Eis gekühlt und dann in eiskaltem PBS seziert, um die Eierstöcke zu entfernen. Isolierte Eier aus Eierstöcken wurden dann in sauberem kaltem PBS gespült, um kleine klebrige Eierstockgewebe zu entfernen, und dann vorsichtig einige Sekunden lang auf sterilem Filterpapiergewebe getrocknet, bevor sie gesammelt und sofort in flüssigem Stickstoff eingefroren und bis zur Verwendung bei -80ºC gelagert wurden. Weibchen, die zum Sammeln von gelegten Eiern verwendet wurden, wurden nicht seziert. Ihre Eier wurden gesiebt und wie oben behandelt.

Eizellenentnahmestrategien für den proteomischen Ansatz (Tafel A), antimikrobielle Aktivität nach RNAi-Experiment (Tafel B), Kinetik der Genexpression durch RT-qPCR (Tafel C) und antibakterielle Aktivität nach dem Priming der Mutter (Tafel D) weisen darauf hin. Eine vollständige Beschreibung des Verfahrens für jedes Experiment wird ausführlich im entsprechenden Teil des Abschnitts Material und Methoden beschrieben.

Ein zweidimensionaler Differenz-Gelelektrophorese-Ansatz (2D-DiGE) wurde verwendet, um die unterschiedliche Häufigkeit von Proteinen (mit einer Größe von

10 bis 150 kDa) zwischen den Bedingungen (Eier von geprimten Weibchen vs Eier von naiven Weibchen, Eier grundiert mit Bt vs Eier grundiert mit Se). 2D-DiGE verwendet die direkte Markierung von Proteinen mit Fluoreszenzfarbstoffen (CyDyes: Cy2, Cy3 und Cy5) vor ihrer Isoelektrofokussierung, um das bekannte Quantifizierungs- und Reproduzierbarkeitsproblem der 2D-Elektrophorese zu lösen.

Insgesamt 433 Eier wurden 3 Tage nach der Grundierung (70–74 pro Bedingung) von 117 verschiedenen Weibchen (16–24 pro Bedingung) gesammelt, die zu 2 oder 5–7 verschiedenen Zeitpunkten für Eier in die Eierstöcke injiziert und frisch gelegt wurden (Probenahme innerhalb von 16 h nach dem Verlegen) bzw. Für jede Bedingung wurden die Eier in 6 verschiedene biologische Replikate gepoolt, von denen jedes aus 11–17 Eiern von 2–7 verschiedenen Weibchen bestand, die nach Möglichkeit am gleichen Datum injiziert wurden. Alle Informationen zum Priming-Datum der Weibchen, zur Eizellentnahme und zum Pooling sind in S6-Tabelle verfügbar. Für jedes Replikat wurden Eier in UTTC-Puffer (Harnstoff, 7 M Thioharnstoff, 2 M Tris, 30 mM CHAPS, 4% pH 8,5) unter Verwendung eines sterilen Pistills gemahlen und 2 Stunden bei RT inkubiert. Nach Zentrifugation (5 min bei 10.000 g) wurde der Überstand gesammelt und die Proteinkonzentration mit dem 2D-Quant Kit (GE Healthcare) nach Herstellerangaben quantifiziert, bevor er bis zur Verwendung bei -80 °C gelagert wurde. 50 Mikrogramm Proteine ​​wurden entweder mit Cy3 oder Cy5 markiert, während 50 µg eines äquimolaren Pools von Proteinen aus allen Extrakten mit Cy2 als internem Standard markiert wurden. Die CyDye-Minimalmarkierung der gereinigten Proteine ​​wurde gemäß den Anweisungen des Herstellers (GE Healthcare) durchgeführt. Ein Farbstoffaustausch wurde durchgeführt, um sicherzustellen, dass die beobachteten Unterschiede zwischen den drei verschiedenen Priming-Bedingungen für gelegte Eier und Eier in Eierstöcken nicht auf unterschiedliche Markierungseffizienzen der Farbstoffe zurückzuführen waren. Das DiGE-Etikettierungs-Setup ist in der S6-Tabelle verfügbar. Markierte Proteine ​​wurden dann zusammengemischt und mit Rehydrationspuffer (Harnstoff, 7 M Thioharnstoff, 2 M CHAPS, 4 % DTT, 65 mM) mit 0,2 % Bio-Lyte 3/10 Ampholyt (Bio- Rad). Die Isoelektrofokussierung wurde wie zuvor beschrieben durchgeführt [77]. Kurz gesagt, die Probe wurde auf einen 17 cm ReadyStrip IPG-Streifen mit einem nichtlinearen pH-Gradienten von 3–10 (Bio-Rad) für passive (5 h) und aktive Rehydratation (14 h bei 50 V) geladen. Die Fokussierung wurde mit folgendem Programm durchgeführt: 50 V für 1 h, 250 V für 1 h, 8.000 V für 1 h und ein letzter Schritt bei 8.000 V für insgesamt 50.000 Vh mit einer langsam ansteigenden Spannung (quadratisch ansteigende Spannung) bei jeder Schritt. Rehydratation und Fokussierung wurden beide auf einem Protean IEF Cell System (Bio-Rad) durchgeführt. Nach Reduktion mit DTT und Alkylierung der Proteine ​​mit Iodacetamid wurden Streifen auf ein 12%/0,32% Acrylamid/Piperazindiacrylamid-Gel aufgetragen und 30 min mit 25 mA/Gel, gefolgt von 75 mA/Gel für 8 h unter Verwendung von a . laufen gelassen Protean II XL-System (Bio-Rad). Proteinstandards (Unstained Precision Plus Protein Standards (Bio-Rad)) wurden auf Whatman-Papiere aufgetragen, die auf dem linken Teil der Gele angeordnet waren. Die Gele wurden mit einem ChemiDoc MP Imaging System (Bio-Rad) in Verbindung mit der Image Lab-Softwareversion 4.0.1 (Bio-Rad) gescannt, wobei Blau (530/28-Filter), Grün (605/50-Filter) und Rot (695/ 55-Filter) Epi-Beleuchtungsparameter zum Scannen von Cy2-, Cy3- bzw. Cy5-markierten Proteinen. Die qualitative und quantitative vergleichende Analyse digitalisierter Proteomkarten wurde mit der Bildanalysesoftware PDQuest 7.4.0 (Bio-Rad) durchgeführt. Es wurden nur Flecken berücksichtigt, die signifikant (p < 0,05, Mann-Whitney-Test) 1,5-fach unterschiedlich häufig zwischen den Bedingungen waren. Um die Proteine ​​in den verschiedenen interessierenden Stellen zu identifizieren, wurde eine klassische 2D-SDS-PAGE für jede Bedingung separat durchgeführt und die Gele wurden nach einem massenspektrometrisch kompatiblen Silberfärbungsverfahren gefärbt, das zuvor in [77] beschrieben wurde. Die Spots wurden unter Verwendung eines Onetouch Plus Spot Picker Disposable (Harvard-Gerät) ausgeschnitten, das mit speziellen 1,5-mm-Methanol-gewaschenen Spitzen ausgestattet war. Für jeden Spot wurde das Protein im Gelpfropfen mit Trypsin verdaut und die verdauten Peptide wurden mit einem Nano-LC1200-System analysiert, das wie zuvor an ein Q-TOF 6550-Massenspektrometer gekoppelt war, das mit einer Nanospray-Quelle und einer HPLC-Chip-Würfel-Schnittstelle (Agilent Technologies) ausgestattet war beschrieben [77]. Die Proteinidentifizierung erfolgte durch Extrahieren der Peaklisten und Vergleich mit den T. molitor übersetzte Transkriptom-Datenbank unter Verwendung der Proteomics-Workbench von PEAKS studio 7.5 (Bioinformatics Solutions Inc., Build 20150615). Die Suche wurde mit den folgenden spezifischen Parametern durchgeführt: Enzymspezifität, Trypsin drei verpasste Spaltungen erlaubten feste Modifikation, Carbamidomethylierung (C) variable Modifikationen, Oxidation (M), Pyro-Glu von E und Q monoisotopische Massentoleranz für Vorläuferionen, 20 ppm Masse Toleranz für Fragmentionen, 50 ppm MS-Scan-Modus, Quadrupol- und MS/MS-Scan-Modus, Flugzeit. Für Top-Hits wurden nur signifikante Treffer mit einer falschen Entdeckungsrate (FDR ≤ 1%) für Peptid- und Protein-Cutoff (−logP ≥ 13 (entspricht einem p-Wert von 0,05) und Anzahl einzigartiger Peptide ≥ 3) berücksichtigt. Um eine korrekte Identifizierung der Proteine ​​sicherzustellen, wurde eine BLAST-Suche gegen die NCBI nr-Datenbank durchgeführt und die konservierten Domänen der Sequenz wurden unter Verwendung der NCBI-CD-Suche, verfügbar unter https://www.ncbi.nlm.nih.gov/Structure ., abgerufen /cdd/wrpsb.cgi [78]. Für jedes Protein wurden pI und Molekularmasse mit dem ExPASy Compute pI/Mw-Tool (verfügbar unter http://web.expasy.org/compute_pi) berechnet.

Eine Grenze des 2D-DiGE-Ansatzes ist seine Unfähigkeit, kleine Proteine ​​(<10 kDa) und Peptide zuverlässig aufzudecken, einschließlich der AMPs, deren Rolle bei TGIP bereits nachgewiesen wurde [8,16,21,23,27,29,79, 80]. Wir untersuchten ihre Häufigkeit in frisch gelegten Eiern (innerhalb von 16 Stunden nach dem Legen) von Müttern 3 Tage später Bt und Se Priming im Vergleich zu PBS-geprimten. Für die Kontrolle wurden zwei Replikate bestehend aus 51 und 31 Eiern sowie 49 und 43 Eiern hergestellt B. thüringensis Bedingungen bzw. Nur 52 Eier waren verfügbar von S. Entomophilie-geprimte Mütter und sie stellten das einzige Replikat für diesen Zustand dar. Die Eier stammten von insgesamt 54 verschiedenen Weibchen, die zu 8 verschiedenen Terminen geprimt wurden (S6-Tabelle). Aufgrund der begrenzten Anzahl von Replikaten wurden nur qualitative Unterschiede aus den Daten extrapoliert, um Kandidatenproteine ​​zu identifizieren. Wir inkubierten zuerst jeden Eierpool in Trifluoressigsäure (TFA) 0,1%, um eine saure Extraktion von Peptiden durchzuführen, die dann mit einem Sep-Pak C . gereinigt wurden18 Plus Light Cartridge (Wasser) gemäß den Anweisungen des Herstellers. Peptide wurden in 5 ml Acetonitril 60%/TFA 0.1% eluiert und über Nacht lyophilisiert. Die Proteinkonzentration wurde anhand ihrer Absorption bei 205 nm mit dem NanoDrop One Spektrophotometer (Thermo Fisher Scientific) abgeschätzt, was darauf hindeutet, dass wir ca. 60 µg Protein pro Eiprobe. Die Peptide wurden dann in 50 μL Acetonitril 2 % / TFA 0,1 % suspendiert und ihre Qualität wurde zuerst durch MALDI-TOF (Matrix Assisted Laser Desorption Ionization – Time of Flight) Fingerprinting mit der HCCA Biotyper Matrix (Bruker Daltonic, Deutschland) gemischt mit drei verschiedene Verdünnungen für jede Probe. Die MALDI-Analyse wurde auf einem Autoflex III Smartbeam (Bruker) durchgeführt, der von der Bruker Compass 1.4-Software gesteuert wurde. Nach der Validierung wurden die Proben in Ammoniumbicarbonat (ABC) 100 mM verdünnt, durch Zugabe von DTT reduziert (11 mM Endkonzentration, Inkubation 30 min bei 56 °C) und mit Iodacetamid alkyliert (34 mM endgültig, 1 h bei Raumtemperatur, im dunkel). Die Proben wurden dann mit verdünnter TFA angesäuert, 10 min bei 15.000 g bei 4°C zentrifugiert und das Überstandsvolumen wurde durch Schnellvakuum reduziert. Die Überstände wurden dann durch Top-Down-LC-MS/MS analysiert: Ein Zehntel jeder Probe wurde auf ein Ultimate 3000 Nano-HPLC-System mit 75 μm C . injiziert18 Säule und verbunden mit einem hochauflösenden Massenspektrometer Q-Exactive Orbitrap, das im datenabhängigen positiven Erfassungsmodus betrieben wird (alle von Thermo Scientific, Deutschland). Komponenten, Lösungsmittel und Betriebsparameter für die Nano-LC-MS/MS-Analyse wurden von [81] beschrieben. Spektren aus den erfassten MS/MS-Dateien wurden mit den Sequenzen der Datenbank von T. molitor Proteine, die wir für diese Studie gebaut haben, unter Verwendung der Software Proteome Discoverer (Version 1.4) mit den folgenden Parametern: kein Enzym und 12 / 144 Aminosäuren als minimale bzw. maximale Peptidlänge, Toleranz von 10 ppm / 0,02 Da für Vorläufer und Fragment Ionen, Carbamidomethylierung von Cystein als feste Modifikation, C-terminale Proteinamidierung und Methionin- und Tryptophan-Oxidationssatz als variable Modifikationen, Analyse im Hochkonfidenzmodus (Falschentdeckungsrate 1%). Für die Datenbanksuche wurde der in der Proteome Discoverer-Software implementierte Sequest HT-Algorithmus verwendet. Eine kurze Liste von fünfzehn bekannten oder Kandidaten-AMPs-Proteinen wurde aus dieser Datenbank extrahiert, indem die mit der Transkriptom-Datenbank erhaltenen Annotationen und durch eine Literaturrecherche durchsucht wurden. Hohe Werte zeigen sowohl eine zuverlässige Identifizierung als auch eine Fülle von übereinstimmenden Peptiden an, was möglicherweise eine hohe Häufigkeit des verwandten Proteins widerspiegelt. Niedrige Scores, normalerweise unter 20, deuten eher auf eine schwache Identifizierung des Proteins und/oder eine geringe Häufigkeit in der Probe hin. Aus Gründen der Lesbarkeit wurden in Tabelle 3 nur Punktzahlen über 20 hervorgehoben, aber alle Punktzahlen (niedrig und hoch) werden diskutiert. Die Proteomics-Daten der Massenspektrometrie wurden dem ProteomeXchange-Konsortium über das PRIDE-Partner-Repository mit der Datensatzkennung PXD018772 hinterlegt.

Funktionelle Inaktivierung von Kandidaten-Immungenen durch RNA-Interferenz

Dieses Experiment zielte darauf ab, den Beitrag von AMP-Kandidatengenen zum Eischutz durch TGIP zu testen, indem ihre Expression unter Verwendung der RNAi-Technologie unterdrückt wurde (Abb. 1-3). Trotz umfangreicher Untersuchungsbemühungen verhinderten wichtige individuelle Variationen der AMPs-Expressionsniveaus die Beobachtung einer festen Wirkung der Injektion einer einzelnen AMP-ds-RNA auf die Unterexpression von AMPs bei Müttern. Die Bemühungen, die Variabilität zu reduzieren, umfassten die Verwendung einer nicht-intrusiven Verabreichungsmethode der dsRNA-Aufnahme [60,61], das Testen der Wirkung einer einzelnen oder doppelten Exposition gegenüber dsRNA und das Testen mehrerer Zeitpunkte nach der Exposition gegenüber dsRNA. Keine dieser Studien führte zu verringerten Variationen der AMP-Expressionsspiegel bei Müttern und zu einer signifikanten Wirkung auf die antimikrobielle Aktivität der Eier. Bemerkenswert, es wurde gezeigt in Drosophila Modell, dass der Knock-Down einzelner TEP (Thioester-Containing Protein)-Gene mit redundanten Funktionen nicht ausreichte, um den Insekten-Phänotyp signifikant zu beeinflussen, und dass eine Änderung der mikrobiellen Infektionsresistenz nur bei gleichzeitigem Knock-Down aller 4 TEP-Gene beobachtet wurde [ 82]. Daher haben wir uns entschieden, den Weibchen einen Cocktail verschiedener AMP-Kandidatengene zu injizieren, um die potenzielle phänotypische Wirkung auf die Eier zu maximieren. Zu diesem Zweck wurden den Weibchen am Tag 1 10 Tage nach dem Auflauf entweder 5 µL von i) PBS als Kontrolle für das Injektionsverfahren, ii) GFP-dsRNA (0,6 µg/µL) als Kontrolle für nicht relevante dsRNA, oder iii) ein Cocktail von dsRNA aus Tenecin 1 und 4, Coleoptericine A und B, und Attacin-2 (jeweils 0,12 μg/μl, 0,6 μg/μl für die gesamte ds-RNA), nachdem sie 10 min auf Eis gekühlt wurde. Doppelsträngige RNA (dsRNA) wurden synthetisiert durch in vitro Transkription mit dem MEGAscript T7-Kit (Ambion, UK) gemäß den Empfehlungen des Herstellers. Regionen von ungefähr 200 bp wurden synthetisiert aus Tenecin-1 (GenBank-Zugangsnummer Q27023), Tenecin-4 (GenBank-Zugangsnummer AB669089), Coleoptericin-A (GenBank-Zugangsnummer KF957599.1), Coleoptericin-B (GenBank Zugangsnummer KF957600.1), und Attacin-2 (GenBank-Zugangsnummer MF754108.1). Nicht relevante dsRNA, die als Negativkontrolle verwendet wurde, bestand aus einem 208 bp-Anteil des grün fluoreszierenden Proteins der Qualle (gfp5) RNA (GenBank-Zugangsnummer L29345).

Die Weibchen wurden einzeln in eine 12-Well-Platte gelegt, die Kleiemehl und einen 10 ul Tropfen Gelose zur Hydratation (1 % Agar-Agar, 10 % Saccharose) enthielt, bis zum Tag 3. An Tag 3 wurden alle Weibchen durch Injektion von . immungeprimt eine 5 μl Suspension von inaktiviertem B. thüringensis (10 8 Bakterien/ml) wie oben beschrieben (Fig. 6B). An Tag 4 wurde den Weibchen erneut entweder i) PBS als Kontrolle für das Injektionsverfahren, ii) GFP-dsRNA (0,6 μg/μl) als Kontrolle für nicht relevante dsRNA oder iii) ein Cocktail von dsRNA aus Tenecin 1 und 4, Coleoptericine a und B, und Attacin-2 und dann einzeln in Petrischalen mit 55 mm Durchmesser überführt, die ein 15 Tage altes Männchen, Kleiemehl und Gelose zur Hydratation enthielten (Fig. 6B). Die Paare wurden in Petrischalen gehalten, um die Fortpflanzung bis zum 7. Tag zu ermöglichen, als die Weibchen von den Männchen getrennt und in frische individuelle Petrischalen mit Kleiemehl und Gelose für die Eierproduktion gelegt wurden. Die Weibchen wurden am Tag 9 aus den Petrischalen genommen und die Eier, die 6 Tage nach dem Immunpriming gelegt wurden, wurden für 3–4 Tage der Reifung in Petrischalen gehalten. Eier (3–4 Tage alt) wurden durch Sieben des Mehls (Maschenweite 600 μm) [31] isoliert und sofort in flüssigem Stickstoff zur zukünftigen Analyse ihrer antimikrobiellen Aktivität eingefroren (Abb. 6B). Für jede Behandlung wurden insgesamt 33 Weibchen verwendet, die zur Ablage von 123 Eiern führten (Kontrolle, GFP-dsRNA und AMPs-dsRNA).

Zeitliche Dynamik der Expression von Immungen-Kandidaten

Um die zeitliche Dynamik der TGIP-Antwort in Eiern von geprimten Müttern zu bestimmen, untersuchten wir die Produktion der Transkripte von Kandidaten-Immungenen, die in den vorherigen Experimenten sowohl bei Weibchen als auch bei Eiern unterschiedlich exprimiert auf der proteomischen Ebene gefunden wurden (Fig. 1-4). Wir wollten insbesondere die Produktion dieser Transkripte sowohl bei Weibchen als auch bei Eiern am Tag 1, 5 und 12 nach dem Primen quantifizieren, um Eier vor dem Schutz, bei maximalem Schutz bzw. nach Abschluss des Schutzes zu erhalten [17] (Abb. 6C .). ). Da der antibakterielle Schutz in mütterlich geprimten Eiern mit der Zeit nach der Eiablage (Alter der Eier) je nach Erreger, der die Mutter immunisiert hat, variiert [19], haben wir außerdem den Einfluss des Alters der Eier auf die Menge an Transkripten untersucht (Abb 6C). Zu diesem Zweck wurden Gruppen von 10 Tagen (± 2 Tagen) jungfräulichen Weibchen nach dem Auflaufen, wie oben erläutert, durch Injektion mit B. thüringensis (N = 44) oder S. Entomophilie (N = 47) oder mit PBS als Kontrolle injiziert (N = 43). Jedes Weibchen wurde dann unmittelbar nach der Priming-Injektion mit einem immunologisch naiven und jungfräulichen Männchen gleichen Alters gepaart und durfte Eier produzieren. Innerhalb jeder Immunbehandlungsmodalität wurde ein Minimum von 9 Paaren zufällig am Tag 1, 5 und 12 nach der Grundierung getötet, während sie 6 Eier bereitgestellt hatten. Die verbleibenden Paare wurden am Tag vor ihrer Tötung in eine neue Petrischale überführt, um das Alter der Eier zu kontrollieren. Unmittelbar nach der Tötung jedes Weibchens wurden sie in flüssigem Stickstoff gelagert und von jedem wurden auch 2 Eier eingefroren und in flüssigem Stickstoff gelagert. Die verbleibenden Eier (2 für jeden Zeitpunkt) wurden 3 Tage oder 7 Tage nach der Eiablage altern gelassen, bevor sie in flüssigem Stickstoff gelagert wurden. Daher trug jedes Weibchen innerhalb jeder Eiablagesequenz zu Eiern bei, die nach der Eiablage 1, 3 oder 7 Tage altern durften, bevor sie zur späteren Untersuchung in flüssigem Stickstoff eingefroren wurden. Einzelheiten zu den Weibchen, der Anzahl der verwendeten Eier und dem Injektionsdatum sind in der S6-Tabelle enthalten.

Gesamt-RNA wurde sowohl aus erwachsenen Weibchen als auch aus Eiern mit dem Direct-zol-RNA-MiniPrep-Kit (Zymo Research, Irvine, CA, USA) extrahiert. Kurz gesagt wurden gefrorene Eier oder erwachsene Weibchen mit einem Gewebezerkleinerer in TRIzol-Reagens (Life Technologies, Carlsbad, CA, USA) lysiert. Die RNA wurde dann gemäß den Anweisungen des Herstellers gereinigt, einschließlich der optionalen DNAse I-Behandlung in der Säule, und bei –80°C gelagert. RNA-Konzentration und -Reinheit wurden durch Absorptionsmessung unter Verwendung eines Epoch-Spektrophotometers (Biotek, Winooski, VT, USA) kontrolliert. Die reverse Transkription von RNA in cDNA wurde mit dem Maxima H-Minus-Erststrang-cDNA-Synthesekit (TermoFisher Scientific, Waltham, MA, USA) unter Verwendung von Zufallshexamer gemäß den Anweisungen des Herstellers durchgeführt. Je nach extrahierter RNA-Menge wurde für die RT nach Möglichkeit 1 µg (aus erwachsenen Weibchen und älteren Eiern) oder weniger (aus jüngeren Eiern) verwendet.

Quantitative PCR-Analysen wurden auf der Plattform „qPCR Haut Débit (qPHD) Montpellier GenomiX“ mit dem Labcyte Echo 525 Liquid Handler für die Prä-PCR-Vorbereitung und dem LightCycler 480 System (Roche, Basel, Schweiz) für den PCR-Lauf durchgeführt. Die PCR-Reaktionen wurden in einem Gesamtvolumen von 1,5 µL durchgeführt, das 0,5 µL cDNA (verdünnt 1:80 bzw. 1:20 mit Reinstwasser von der erwachsenen Mutter bzw. Liege, Belgien) und 100 nM jedes Primers. Die PCR-Amplifikationseffizienzen wurden für jedes Ziel- und Haushaltsgen durch Kalibrierungskurven unter Verwendung von zweifachen seriellen Verdünnungen von cDNA (von 1:20 bis 1:2580) in dreifacher Ausführung ermittelt. Die Verstärkungseffizienzen wurden unter Verwendung von Steigungswerten des log-linearen Teils der Kalibrierungskurven von LightCycler 480 Software Release 1.5 (Roche) berechnet. Nur Primerpaare mit einer Amplifikationseffizienz von 2 wurden beibehalten. Alle Details zu den verwendeten Primern sind in der S7-Tabelle angegeben. Das Zyklusprogramm war wie folgt: Denaturierungsschritt bei 95 °C für 3 min, 45 Amplifikationszyklen (Denaturierungsschritt bei 95 °C für 10 s, Annealing- und Elongationsschritt bei 60 °C für 45 s). Die quantitative PCR wurde durch einen Schmelzkurvenschritt von 65 auf 97 °C mit einer Aufheizrate von 0,11 °C/s und kontinuierlicher Fluoreszenzmessung beendet. Für jede Bedingung wurden in PCR-Experimenten 6–18 biologische Replikate von erwachsenen Weibchen und 3–4 biologische Replikate von Eiern (Pool von 6 Eiern von 3 verschiedenen Weibchen, 2 Eier pro Weibchen) zusätzlich zu drei technischen Replikaten verwendet. Der Mittelwert von Ct wurde berechnet. Korrigierte Schmelzkurven wurden mit der Tm-Calling-Methode des LightCycler 480 Software Release 1.5 überprüft. Die relative Expression jedes Gens wurde mit der ΔΔCt-Methode berechnet, da die Effizienz aller Primerpaare (Ziel- und Haushaltsgene) die gleiche PCR-Amplifikationseffizienz zeigte. Für jedes Zielgen wurde der ΔCt in Bezug auf den Mittelwert von zwei Referenzgenen berechnet, die für 18S und 28S ribosomale RNA kodieren. Für erwachsene Mütter wurde die ΔΔCt in Bezug auf die ΔCt-Werte von Müttern mit Kontrollzustand (PBS-injiziert), die 1 Tag nach der Injektion getötet wurden, berechnet. Für die Eier wurde der ΔΔCt für jeden Legetag unabhängig von den ΔCt-Werten der Eier berechnet, die von PBS-injizierten Müttern gelegt wurden. Relative Expressionswerte (R) von Genen zwischen verschiedenen Bedingungen wurden nach der Formel R = 2 -ΔΔCt berechnet [83].

Antibakterieller Test

Die antibakterielle Aktivität in den Eiern, die es ermöglicht, den Eischutz auf phänotypischer Ebene zu überprüfen, wurde unter Verwendung eines Standard-Diffusionszonen-Assays gemessen [16,17,19]. Auf der einen Seite ermöglichte dieser Assay, die Wirkung der RNAi-Ungültigkeit auf die antibakterielle Aktivität von Eiern in dem Experiment zu testen, das darauf abzielte, die Expression von AMP-Kandidaten in Eiern, die 5 Tage nach dem mütterlichen Priming und 3 Tage nach der Eiablage gelegt wurden, ungültig zu machen ( 6B ). Andererseits wurde es im Experiment verwendet, um die antibakterielle Aktivität von Eiern von naiv und von PBS zu verknüpfen. B. thüringensis und S. Entomophilie-behandelte Mütter, wenn sie 1 und 5 Tage nach der Grundierung und 7 Tage nach der Eiablage gelegt wurden ( 6D ), mit der Quantifizierung von AMP-Kandidaten-Gentranskripten in Eiern von ähnlich behandelten Müttern ( 6C ).

Einzelne Eiproben wurden auf Eis aufgetaut und Eiextrakte wurden hergestellt, indem Eier in eine Essigsäurelösung (0,05 %, 5 ml pro Ei) zerdrückt wurden. Nach der Zentrifugation (3.500 g, 2 min, 4 °C) wurden 2 ml des Überstands verwendet, um die antibakterielle Aktivität auf den mit dem Bakterium beimpften Hemmplatten zu messen Arthrobacter globiformis, erhalten vom Institut Pasteur (CIP105365). Eine Übernachtkultur des Bakteriums wurde zu Broth-Medium mit 1% Agar gegeben, um eine Endkonzentration von 10 5 Zellen pro ml zu erreichen. Sechs Milliliter dieses beimpften Mediums wurden dann in eine Petrischale gegossen und erstarren gelassen. Probenvertiefungen wurden unter Verwendung einer Pasteur-Pipette hergestellt, die mit einer Kugelpumpe ausgestattet war. Die Platten wurden dann über Nacht bei 28ºC inkubiert. Der Durchmesser der Hemmzonen wurde dann für jede Probe gemessen.

Statistische Analysen

Die Größe der Hemmungszonen der Eier nach RNA-Interferenzbehandlungen wurde mit dem Shapiro-Wilk-Test auf Normalität und dem Student-T-Test analysiert, um die Unterschiede in der Hemmzonengröße (p<0,05) zu testen, während die Analyse des Anteils der Eier mit antibakterieller Aktivität gemäß auf RNA-Interferenzbehandlungen wurden unter Verwendung von exakten Fisher-Tests (p<0,05) analysiert. Vorhandensein einer antibakteriellen Aktivität unter den Eiern, die von der Kontrolle gelegt wurden, PBS-, B. thüringensis- und S. Entomophilie-behandelte Weibchen nach 1 Tag oder 5 Tagen nach dem Priming wurden mit binomialen logistischen Regressionen analysiert.

Die Expression von AMPs durch RT-qPCR nach RNAi-Behandlung bei Müttern wurde zwischen dsAMP und dsGFP-behandelten Müttern unter Verwendung eines Mann-Whitney-Tests verglichen, wobei berücksichtigt wurde, dass diese Daten gemäß dem Shapiro-Wilk-Test nicht normal verteilt waren (p<0,01).

Die relative Expression der 11 Kandidaten-Immungene, gemessen bei erwachsenen geprimten Weibchen mit B. thüringensis und S. Entomophilie und in ihren 7 Tage alten Eiern, die nach 1, 5 und 12 Tagen nach dem Primen im Vergleich zu PBS-injizierten Kontrollweibchen gelegt wurden, wurden unter Verwendung von Mann-Whitney-Tests (p<0,05) nach einer Normalitätsverifizierung unter Verwendung des Shapiro-Wilk-Tests analysiert. Die Analysen wurden mit der Software IBM® SPSS® Statistics 19 durchgeführt.


Sensitivitätsanalyse für k max vivo Werte

Analyse der Flussvariabilität.

FBA erfordert eine objektive Funktion zur Optimierung, und es gibt verschiedene Alternativen (z. B. Biomasse, Wachstumsrate, ATP-Ausbeute usw.). Der pFBA minimiert die Gesamtsumme der Flüsse und stimmte gut mit den gemessenen Flüssen und Expressionsdaten überein in E coli (63, 65). Beim sparsamen Algorithmus ist der Lösungsraum sehr klein. Dennoch kann der Fluss bei wenigen Reaktionen immer noch beträchtlich abweichen und somit den Wert ihrer k max vivo beeinflussen. Um die Variabilität unserer pFBA-Lösung abzuschätzen, führen wir eine Flussvariabilitätsanalyse (FVA) für alle Reaktionen mit gemessenen k max vivo-Werten durch. Dazu berechnen wir den minimalen Fluss (v min ) und den maximalen Fluss (v max ), die von jeder Reaktion unter den Bedingungen unterstützt werden, unter denen k max vivo erhalten wurde. Wir beschränken das Modell durch eine feste Gesamtsumme der Flüsse (aus pFBA) und feste Wachstumsrate und Umgebungsbedingungen (aus Messungen). Für jede Reaktion erhalten wir einen Bereich für k max vivo : Bereich von k max vivo = [ v min E , v max E ] . [S1] Abb. S2 zeigt den Bereich von k max vivo relativ zum Wert, der aus der ursprünglichen pFBA-Lösung erhalten wurde. pdxH ist das einzige Enzym, das eine signifikante Variabilität zeigt. Weil E coli hat ein alternatives anaerobes Enzym für diese Reaktion (71), das v min bis pdxH kann auf Null sinken (d. h. wenn nur das anaerobe Enzym verwendet wird), was zu einer großen Variabilität in k max vivo von führt pdxH. Da wir in unserer Analyse nur aerobe Bedingungen verwenden, ist die vorgeschlagene Variabilität wahrscheinlich irrelevant.

Der Bereich von k max vivo relativ zu k cat-Messungen. Die Flussvariabilitätsanalyse wurde für die pFBA-Lösung für alle Reaktionen durchgeführt (n = 132). Datenpunkte entsprechen Fig. 2 im Haupttext. Die ja = x Linie ist schwarz dargestellt, gestrichelte braune Linie stellt die beste Anpassung durch orthogonale Regression in log 10 Fehlerbalken dar (normalerweise so klein, dass sie innerhalb der Größe der Punkte selbst liegen) repräsentieren den Bereich zwischen den oberen und unteren k max vivo-Schätzungen.

ATP-Anforderung.

Der nicht wachstumsbedingte ATP-Bedarf (auch ATP-Erhaltungsbedarf genannt) im iJO1366-Modell wird basierend auf experimentellen Daten auf 3,15 mmol gCDW −1 h −1 ATP eingestellt (23). Dieser Wert kann sich jedoch je nach Bedingungen ändern. Da unsere Analyse der katalytischen Enzymraten unter vielen Bedingungen durchgeführt wird, führten wir eine Sensitivitätsanalyse durch, indem wir k max vivo-Werte bei 0 % oder 200 % des Flusses durch die ATP-Erhaltungsreaktion im Modell berechneten, und fanden einen vernachlässigbaren Effekt auf k max vivo-Werte, wie in Abb. S3 zu sehen ist.

Der nicht wachstumsbedingte ATP-Bedarf hat einen vernachlässigbaren Effekt auf die k max vivo-Werte. (EIN) k max-vivo-Werte bei einem Fluss von 6,30 mmol gCDW −1 h −1 (200% des berichteten Erhaltungswerts, x Achse) im Vergleich zu 3,15 mmol gCDW −1 h −1 (ja Achse) durch die ATP-Erhaltungsreaktion. (B) k max-vivo-Werte bei einem Fluss von Null (x Achse) im Vergleich zu 3,15 mmol gCDW −1 h −1 (ja Achse) durch die ATP-Erhaltungsreaktion. Blaue Linie zeigt die ja = x Leitung.


Resultate und Diskussionen

Sequenzierung und Montage

Die Eingabedaten für die Gesamtgenom-Assembly umfassten fünf Bibliotheken (siehe Tabelle S1). Die meisten Daten waren Sequenzen von den Enden kurzer (400 bp) Fragmente. Wir erzeugten auch drei längere Fragmentbibliotheken von 3, 10 und 12,5 kbp, die stark bei der Verknüpfung von Contigs zu Gerüsten halfen. Nach dem Trimmen, um minderwertige Daten zu entfernen, enthielt der Datensatz 248 Millionen Paare oder etwa 500 Millionen Reads von 151 bp. Bei einer geschätzten Genomgröße von 606 Mbp entspricht dies einer etwa 120-fachen Abdeckung des Genoms. Die Gesamtlänge des zusammengesetzten Genoms betrug 667 Mb, etwa 10 % oder 24 % länger als die mittels Durchflusszytometrie geschätzte Genomgröße (606 Mb) (Horjales et al., 2003 ) oder K-mer-Tiefenverteilung sequenzierter Reads (538–540 Mb, Abbildung S1). Sowohl MaSuRCA als auch SOAPdenovo2 produzierten gute Baugruppen, aber die MaSuRCA-Baugruppe hatte eine N50-Gerüstgröße von 366 541 gegenüber 355 832 für SOAPdenovo2. Als Qualitätsprüfung haben wir Reads aus einer der Paired-End-Bibliotheken zurück auf beide Assemblys ausgerichtet und etwa 12% mehr Read-Paare konsistent – ​​im richtigen Abstand und in der richtigen Ausrichtung – auf die MaSuRCA-Assembly ausgerichtet. Daher haben wir die MaSuRCA-Assembly als Basis für die Annotation und die anschließende Analyse gewählt. Die SOAPdenovo2-Assembly war jedoch für das Mitochondrium und den Chloroplasten überlegen. Es baute den Chloroplasten zu einem einzigen Molekül und das Mitochondrium zu sieben Contigs zusammen. Wir verwendeten diese als letzte Organellenbaugruppen und entfernten alle Gerüste aus der MaSuRCA-Baugruppe, die zu den Organellen passten. Die anfängliche Anordnung hatte eine N50-Contig-Größe von 44 398 und eine N50-Gerüstgröße von 366 541 bp, basierend auf einer geschätzten Genomgröße von 606 Mbp (Tabelle 2). AMOScmp identifizierte 5426 überlappende Gerüste, die zu 237 größeren Gerüsten zusammengeführt wurden. Im Gerüstschritt unter Verwendung des zusammengesetzten Transkriptoms wurden 2397 Gerüste basierend auf Transkript-Alignments zu 1063 Gerüsten verknüpft. Die endgültige Anordnung enthielt 27 032 Gerüste über 1000 bp mit einer Gesamtlänge von 667 Mbp und einer N50-Größe von 464 955 bp (basierend auf einer Genomgröße von 606 Mbp). Die Gesamtzahl der assemblierten Contigs betrug 687 Mb, mit einer N50-Länge von 46 148 bp und insgesamt 221 640 Contigs. Die physische Karte der Walnuss (Luo et al., 2015 ) ist eine potenzielle ergänzende Ressource für diese Whole Genome Shotgun (WGS)-Baugruppe. Insgesamt 26 596 bakterielle künstliche Chromosomen (BAC)-Endsequenzen, die mit J. regia BioProbe SAMN00188677 wurden von NCBI erhalten. Davon wurden 22 050 mit Gerüsten im J. regia Physikalische Karte. Insgesamt sind 20 821 dieser physikalisch abgebildeten BAC-Endsequenzen eindeutig auf 4005 Gerüste im Entwurfsaufbau ausgerichtet. Darüber hinaus sind 145 BAC-Enden auf mehr als ein Gerüst ausgerichtet. Die Gesamtlänge der Zielgerüste, die eine eindeutige Zuordnung von BAC-Enden zu Gerüsten darstellt, betrug 546 Mbp (Datei S1), ein Großteil (79%) der Sequenz in unserer WGS-Assembly.

Geschätzte Genomgröße (Mb) 606
Chromosomennummer (2n) 32
Gesamtgröße der montierten Contigs (Mb) 687
Anzahl der Contigs 221 640
Größtes Contig (bp) 603 060
N50-Länge (contig) (bp) 46 148
Anzahl Gerüste 186 636
Gesamtgröße der montierten Gerüste (Mb) 712
Anzahl Gerüste >1000 bp 27 032
Gesamtgröße der montierten Gerüste (>1000 bp) (MB) 667
N50 Länge (Gerüste) 464 955
Längste Gerüste (Mb) 3
Anzahl der Lücken 35 004
Mittlere Lückenlänge (bp) 712
Gesamtgröße der Lücken (Mb) 25
GC-Gehalt (%) 37

Baugruppenvalidierung

Unsere Validierungsstrategie mit PacBio-Reads, die auf die Assembly ausgerichtet sind, zeigte, dass etwa 88 % der Assembly von PacBio-Reads abgedeckt wurden, bei einer durchschnittlichen Identität von etwa 80,2 %. Wir haben auch das Verknüpfungspotenzial der PacBio-Reads bewertet, indem wir Untermengen von 1000 Reads mit drei verschiedenen Alignern (nucmer, bwa und blasr) an der aktuellen Baugruppe ausgerichtet und gezählt haben, wie viele PacBio-Reads auf mehr als ein Gerüst ausgerichtet sind. Die Ergebnisse variierten signifikant zwischen den Alignern (Tabelle S2). Insgesamt hatten zwischen 0,18 und 1,35% der PacBio-Reads Linking-Potenzial.

Transkriptom-Sequenzierung und Assemblierung

Über eine Milliarde (1062 838 572) Paired-End-Reads wurden in 19 Bibliotheken sequenziert. Nach Qualitätskontrolle und Trimmen wurde die Anzahl der Reads auf 978 128 921 reduziert. Trinity baute 132 041 772 bp zu 111.944 Transkripten mit einer mittleren Länge von 1180 bp und einer N50 von 1833 zusammen. Von diesen Transkripten waren 78.645 einzigartige „Gene“. '. Der Nachweis echter offener Leserahmen (ORFs) und Validierungstechniken ergaben 35 836 ORFs (Tabelle 3), von denen 16 594 Volllängen waren (46%). Die N50 für Sequenzen voller Länge beträgt 1449. Das Genom wurde unter Verwendung von 29 785 Teil- und Volllängen-ORFs (die einzigartige ORFs darstellen) als Gerüst aufgebaut und weiter analysiert.

Kombiniert
Lesevorgänge insgesamt 1 062 838 572
Gesamtlesewerte nach QC 978 128 921
Gesamtnr. von Transkripten 111 944
Gesamtnr. von Trinity-Genen 78 645
N50 (alle) 1833
Alle Contigs, mittlere Länge 750
Alle contigs, meine 1180
Alle Contigs, zusammengebaute Basen 132 041 772
Gesamtnr. von Sequenzen in voller Länge 16 594
Gesamtnr. von ORF-Sequenzen 35 836
Gesamtnr. von ausgewählten Frame-Sequenzen 29 785
Gesamtnr. von nicht kontaminierten Sequenzen 28 932
Gesamtnr. von annotierten Sequenzen 25 373
Gesamtnr. von Sequenzen ohne Anmerkung 4140
Gesamtnr. von nicht aussagekräftigen Treffern (unbekannte Funktion) 9379

Genom-Annotation

Wir haben das assemblierte Genom mit der halbautomatischen Genom-Annotationspipeline MAKER-P annotiert, indem wir exprimierte Sequenz-Tags (EST) und Proteinsequenzen von Artverwandten (Tabelle S3) und die assemblierten J. regia Transkriptom, das 32 498 Genmodelle ergab. Insgesamt 5172 Gerüste ≥5000 nt lang wurden mit mindestens einem Genmodell annotiert (Bereich 1–325 Annotationen, Durchschnitt 6,28).Zur Validierung der MAKER-Modelle wurden mehrere Genmerkmale untersucht: Vollständigkeit (kanonische Start- und Stoppcodons), Transkriptomunterstützung, Proteinnachweis (Ähnlichkeit zu ricinus communis, Vitis vinifera oder Cucumis sativus Proteine) und erkennbare Proteindomänen (PfamA und/oder die Panther-Datenbank) (Tabelle 4). Wir verwarfen zwei mono-exonische Gene mit Domänen, die mit Retroelementen assoziiert sind. Basierend auf diesen Merkmalen haben wir die 32 496 Genmodelle in drei Kategorien eingeteilt: (i) hochwertige Gene voller Länge (16 852 Sequenzen), die multiexonisch oder monoexonisch sind, vollständig, durch Expressionsdaten oder Proteinnachweise gestützt und mit at . annotiert sind mindestens eine Proteindomäne (ii) qualitativ hochwertige Teilgene (8782 Sequenzen), die multiexonisch, partiell sind, durch Expressionsdaten oder Proteinnachweise gestützt und mit mindestens einer Proteindomäne annotiert sind und (iii) minderwertige Gene (6862 Sequenzen), die sind multiexonisch oder monoexonisch, vollständig oder teilweise, nicht durch Expressionsdaten oder Proteinnachweise gestützt oder nicht mit einer Proteindomäne annotiert.

Multiexonisch Monoexonisch Gene insgesamt
Anzahl der Gene 26 249 6247 32 496
Vollständig (enthalten kanonische Start-/Stopp-Codons) 15 555 5964 21 519
Unterstützt durch Walnuss-RNA-Sequenzierungsdaten 19 884 3982 23 866
Pfam- und/oder Panther-Domain/s enthalten 21 516 4332 25 848
Unterstützt durch Proteinnachweise 25 772 6240 32 012

Die genomischen Merkmale waren denen anderer sequenzierter Pflanzengenome ähnlich (Tabelle 5). Annotierte proteinkodierende Regionen machten aufgrund der längeren Länge der Introns nur etwa 5% des Genoms und etwa 28% des gesamten Genraums aus (Tabelle S4). Die meisten Intron/Exon-Verbindungen waren kanonische GT-AG-Spleißverbindungen (Tabelle S5). Interessanterweise waren die zweithäufigsten Verbindungen GC, AT, AC, die den Anteilen alternativer nicht-kanonischer Spleißverbindungen GC-AG und AT-AC ähneln, die in anderen Pflanzenarten beschrieben wurden (beachten Sie, dass %AG-3′ – %GT-5′ = 0,0573 % entspricht %GC-5′ = 0,0516 % und %AT-5′ = 0,0072 % entspricht %AC-3′ = 0,0079 %) (Sparks und Brendel, 2005).

Juglans regia Pyrus Communis Pyrus bretschneideri Fragaria vesca Malus × inländisch Vitis vinifera Citrus sinensis
Vorhergesagte Gene 32 496 43 419 42 812 34 809 54 921 30 434 29 445
Durchschnittliche Genlänge (bp) (einschließlich Introns) 4358 3320 2776 2792 2802 3399 3041.21
Durchschnittliche CDS-Länge (bp) 1222 1209 1172 1160 1155 1255
Anzahl der Exons 172 273 221 804 202 169 174 375 273 226 149 351 258 142
Durchschnittliche Exonlänge (bp) 229.5 237 248 232 273 130 312
Anzahl der Single-Exon-Gene 6249 10 909 12 310 5915 10 378
Anzahl Introns 139 775 178 385 159 357 139 567 218 353 118 917 213 755
Introns pro Gen (Multi-Exon) 5.3 5.49 5.22 4.83 4.9 5.8
Durchschnittliche Intronlänge (bp) 730 398 386 407 491 213 359

Die Vollständigkeit der MAKER-Genmodelle wurde mit CEGMA bewertet (Tabelle S6). Die Abdeckung der 248 ultrakonservierten eukaryotischen Kerngene (CEG) betrug 82% (vollständige Abdeckung) und 99% (teilweise Abdeckung). Eine ähnliche Analyse des für die Annotation verwendeten Transkriptoms (28 932) und aller identifizierten ORFs (35 836) zeigte eine etwas geringere Abdeckung, was darauf hindeutet, dass MAKER die von der Transkriptomanordnung bereitgestellte Abdeckung geringfügig erhöhte. Wir analysierten den Beitrag der verschiedenen Datensätze (Pflanzenproteine ​​und de novo Transkriptom) zu den endgültigen MAKER-Modellen (Abbildung 2). Unter den hochwertigen MAKER-Modellen (16 852) wurden alle durch Proteinnachweise von anderen Pflanzenarten und etwa 80 % durch die Transkriptom-Assemblierung unterstützt (Abbildung 2). Bei vollständig abgedeckten MAKER-Modellen ist die Unterstützung durch Proteinnachweise reduziert, nicht jedoch die Transkriptomunterstützung, für die mehr Modelle vollständig abgedeckt sind. Wenn sowohl für das Transkript als auch für das MAKER-Modell eine Abdeckung von 100 % erforderlich war, werden 35 % der Modelle durch ein vollständiges Transkript abgedeckt.

Analyse von Beweisen aus MAKER-Modellen.

Prozentsatz der hochwertigen MAKER-Modelle in voller Länge (16 852), die durch Protein- (externe Evidenz, grün) oder RNA-Sequenzierung (rot) bei jeder Abdeckung abgedeckt sind, 100 % (cv100) und 100 % Abdeckung sowohl des Modells als auch des Transkripts ( cv100 beide).

Von den MAKER-Modellen wurden 6959 (41,29 % Abbildung 2) vollständig durch assemblierte Transkripte abgedeckt und 12.209 Transkripte wurden vollständig durch MAKER-Modelle abgedeckt, was darauf hindeutet, dass die Genmodelle länger sind als die Transkripte und dass MAKER die von . bereitgestellten Informationen „erweitern“ kann die Ausdrucksdaten. Dies stimmt mit der beobachteten durchschnittlichen kodierenden Sequenzlänge (MAKER-Modelle) von 1222 nt und der durchschnittlichen Transkriptlänge (RNA-Seq) von 965 nt überein. Von den 32 496 Genmodellen haben wir 30 843 mit einem Pflanzenprotein annotiert, indem wir Datenbanken verwenden, die auf enTAP-Ergebnissen basieren. Vitis vinifera, R. Communis und Arabidopsis thaliana trugen am meisten zur funktionalen Annotation bei (Abbildung S2). Es gab 4716 Modelle mit nicht aussagekräftigen Treffern (annotiert als hypothetische, vorhergesagte oder anderweitig nicht charakterisierte Proteine) und 1650 hatten keinen Treffer, was möglicherweise J. regia-spezifische Proteine. Von 346 Genen identifiziert als J. regia-spezifisch unter Verwendung der Markov-Cluster-Algorithmus (MCL)-Analyse (unten beschrieben), wurden 230 von diesen Genen ohne Treffer repräsentiert, was ihren Beitrag weiter untermauert J. regia. Im vollständigen Satz von Genen wurden 24 234 mit mindestens einem von 3542 verschiedenen Interpro-Zugängen und 3558 mit einem von 713 verschiedenen Enzymcodes aus der Enzyme Nomenclature Database (Bairoch, 2000) annotiert.

Die funktionelle Klassifizierung der annotierten Gene ergab 11 421 Modelle, die mit 3771 verschiedenen Gen-Ontologie (GO)-Begriffen annotiert wurden. Die am häufigsten vorkommenden molekularen Funktionen waren Bindung (19,4 %) und Nukleotidbindung (17,7 %). Metabolismus (25,4%), zelluläre (22,1%) und Biosynthese (16%) waren die größten biologischen Prozesse und Membrankomponenten (18,6%) waren unter den zellulären Komponenten am häufigsten (Abbildung S3). Die am häufigsten vorkommenden InterProScan-Domänen waren IPR000719 (Proteinkinase-Domäne), IPR002885 (Pentatricopeptid-Repeat) und IPR001128 (Cytochrom P450), die sich in 708, 589 und 369 . befanden J. regia Gene bzw. Modelle mit einem leucinreichen Repeat (LRR) waren ebenfalls reichlich vorhanden. 527 Gene wurden mit IPR001611- oder IPR013210-Zugriffen annotiert. Die Phosphorylierungswege waren aufgrund der Enzymcodezuordnung am stärksten vertreten, was für Pflanzen nicht ungewöhnlich ist. Von 4716 Genmodellen, die als nicht informativ und 1650 ohne Treffer annotiert wurden, hatten 2587 bzw. 167 eine erkennbare Pfam- oder Panther-Proteindomäne, was trotz fehlender globaler Ähnlichkeit mit charakterisierten Proteinen zu ihrer Charakterisierung beitrug.

Die orthologe Genfamilienanalyse, durchgeführt über TRIBE-MCL, umfasste die J. regia MAKER-Modelle und eine Sammlung von Proteinen aus neun sequenzierten Landpflanzen (Abbildung 3). Die neun Arten bestanden aus einer Mischung aus Monokotyledonen und Dikotyledonen und einem Moosen. Es gab 10 046 Familien der Größe 5 und größer, was 9910 Familien ergab, nachdem nach Familien gefiltert worden war, die Retroelemente enthielten. Davon umfassten 9153 Proteine ​​von mehr als zwei Spezies. Nur 20 Familien (165 Proteine) waren einzigartig für J. regia (Tabellen 6 und 7). Von diesen wurden 12 mit mindestens einer beschreibenden Proteindomäne annotiert. In acht wurde keine Proteindomäne identifiziert J. regia-spezifische Familien (66 Proteine). Eine reichlich J. regia-spezifische Gruppe umfasste charakteristische Resistenzgene mit LRR- und/oder NB-ARC-Domänen (PF12799, PF13855, PF08263 und PF00931, vier Familien, 24 Proteine). Eine weitere Untersuchung der BLAST-Annotationsergebnisse (mit mindestens 70 % Abdeckung auf Proteinebene) für diese Proteine ​​zeigte, dass 12 der 24 Krankheitsresistenzgene waren.

Venn-Diagramm orthologer Proteingruppen für jede in der Markov-Cluster-Analyse (MCL) identifizierte Spezies mit dem Juglans regia MAKER-Modelle und die Proteinsammlung von neun sequenzierten Pflanzenarten.

Die neun sequenzierten Pflanzenarten waren wie folgt: Arabidopsis thaliana (BEI), J. regia (JR), Oryza sativa (OS), Physcomitrella patens (PP), Populus trichocarpa (PT), ricinus communis (RC), Theobroma cacao (TC), Vitis vinifera (VV), Zea mays (ZM) und Glycin max (GM). Das Zentrum stellt die Anzahl der Familien dar, die von allen Arten gleichzeitig geteilt werden. Es wurden nur Familien mit fünf oder mehr Proteinmitgliedern berücksichtigt. Die Analyse von Familien mit zwei oder mehr Mitgliedern zeigte 5205 Familien, die von allen Arten gleichzeitig geteilt wurden.

Proteinfamilie Walnuss-Modelle Pfam-ID [Pfam-Anzahl] Pfam-Beschreibung
2906 19 PF12796 [8] Ank_2
7392 10 PF03140 [10] DUF247
7940 10 PF12776 [1] Myb_DNA-bind_3
7946 10 Kein Pfam
7948 10 PF07777 [1] MFMR
7966 10 Kein Pfam
8408 9 Kein Pfam
8504 8 PF00171 [1] Aldedh
8677 8 Kein Pfam
8735 8 Kein Pfam
8737 8 Kein Pfam
8754 7 PF00646 [6] F-Box
8861 7 PF12799 [4] LRR_4
8975 7 PF00931 [2] NB-ARC
PF13855 [1] LRR_8
8980 7 Kein Pfam
9091 6 PF14577 [1] SEO_C
9318 6 Kein Pfam
9633 5 PF13855 [1] LRR_8
9785 5 PF02892 [1] zf-BETT
9863 5 PF08263 [3] LRRNT_2
PF12799nn [1] LRR_4
Elementname Nachname Frequenz Gesamtlänge (bp) Prozentsatz des Genoms
Reju_rnd-2_family-57 LINIE/L1 14 754 13 626 865 1.98
Reju_rnd-2_family-119 LTR/Zigeuner 15 566 10 789 195 1.57
Reju_rnd-2_family-14 LTR 7952 8 167 833 1.19
Reju_rnd-3_family-29 LINIE/L1 7037 7 495 511 1.09
Reju_rnd-2_family-118 LTR/Zigeuner 13 456 7 324 814 1.06
Reju_rnd-3_family-5 LTR/Zigeuner 4371 7 247 731 1.05
Reju_rnd-3_family-49 LTR 11 849 7 007 548 1.02
Reju_rnd-3_family-80 LINIE/L1 4799 6 822 652 0.99
Reju_rnd-2_family-58 LTR 8977 5 941 064 0.86
Reju_rnd-3_family-89 LTR/Zigeuner 4203 5 250 213 0.76
Reju_rnd-4_family-64 LTR/Copia 2912 5 086 047 0.74
Reju_rnd-6_family-1 DNA 15 957 4 219 485 0.61
Reju_rnd-4_family-7 LINIE/L1 15 016 4 169 235 0.61
Reju_rnd-5_family-10 DNA 14 524 3 857 295 0.56
Reju_rnd-3_family-301 LINIE/L1 3953 3 637 049 0.53
Reju_rnd-3_family-7 DNA 15 243 3 303 322 0.48
Reju_rnd-3_family-126 DNA/CMC-EnSpm 5152 3 256 473 0.47
Reju_rnd-3_family-210 DNA 6166 2 720 074 0.40
Reju_rnd-3_family-271 LTR/Zigeuner 2209 2 685 568 0.39
Reju_rnd-3_family-231 DNA 16 304 2 644 048 0.38

Annotation von Genen im J. regia Genomkodierende Enzyme, die an der Biosynthese von nicht-strukturellen Phenolen beteiligt sind

Im Einklang mit der reichen Auswahl an phenolischen Verbindungen in J. regia, enthielten acht Familien mit 133 Proteinen die UDP-Glucuronosyltransferase-(UDPGT PF00201)-Domäne, die mit der UDP-Glucosyltransferase-Aktivität assoziiert ist. Andere Domänen, die üblicherweise mit diesem Satz von Familien assoziiert sind, waren die N-terminale Domäne der Glycosyltransferase-Familie (Glyco_transf_28 PF03033) und die strukturell konservierte katalytische Domäne von Proteinkinasen (Pkin PF00069). Seltener waren eine konservierte Ferrodoxindomäne (Fer2 PF00111), eine Helix-Loop-Helix-Domäne aus einer großen Familie von Calcium-bindenden Proteinen (EF-hand_5 PF13202) und die katalytische Domäne der Ulp1-Proteasefamilie (Peptidase_C48 PF02902). Wir haben ein Mitglied dieser Kohorte mit dem UDPGT (PF0021) als WALNUT_00000341-RA auf dem Gerüst jcf7180001222233 annotiert. Dieses Protein wurde mit einem Stoffwechselprozess in Verbindung gebracht (GO:0008152) und von InterProScan als UDP-Glucuronosyl/UDP-Glucosyltransferase (IPR002213) vorhergesagt. Interessanterweise werden Säugetierproteine, die diese Domäne aufweisen, als UDP-Glucuronosyltransferasen (EC:2.4.1.17) klassifiziert. Sie übertragen eine Glucuronsäure auf lipophile Substrate und entgiften Medikamente und Karzinogene (Burchell et al., 1991). In Pflanzen werden Mitglieder dieser Familie jedoch als Flavonol-3-Ö-Gluosyltransferasen (EC:2.4.1.91) und übertragen eine Glucoseeinheit von UDP-Glucose auf ein Flavanol, eine Reaktion, die bei der Anthocyanin-Biosynthese (Hu et al., 2011). Zwei weitere Proteine ​​wurden einer Familie zugeordnet und durch MCL mit 63 Proteinen aus anderen Genomen geclustert. Diese Proteine ​​wurden von MAKER als WALNUT_00030240-RA und WALNUT_00029754-RA annotiert. In jedem Protein wurden drei mit PPO-Enzymen assoziierte Pfam-Domänen identifiziert: Tyrosinase (PF00264), PPO1_KFDV (PF12143) und PPO1_DWL (PF12142) Domänen. Diese Domänen sind mit Oxidation/Reduktion und Catecholoxidase-Aktivität in PPO-Genen verbunden und werden in kanonischen PPO-Enzymen gefunden. Dieses Ergebnis steht im Gegensatz zu einem Bericht, der nur ein einzelnes Polyphenoloxidase-Enzym-Gen identifiziert (JrPPO1) mittels Southern-Analyse (Escobar et al., 2008). Eine gründliche Charakterisierung von JrPPO1, die das Vorhandensein eines oder mehrerer PPO-Gene in . bestätigt J. regia, ist unten angegeben. Obwohl wir zuversichtlich sind, dass unsere Ergebnisse das Vorhandensein eines zusätzlichen PPO-Gens stützen, erkennen wir an, dass unsere Entdeckung allein durch die Sequenzierung der J. regia Genom und Identifizierung konservierter Domänen mit in silico Methoden.

Annotation von miRNA-Sequenzen im J. regia Genom

Wir identifizierten 5229 potenzielle miRNA-Vorläufer mit MIRENA durch Vergleich mit bekannten pflanzlichen miRNA-Sequenzen in MirBase. Keine stimmte exakt mit bekannten miRNAs überein (alle enthielten ein oder zwei Fehlpaarungen). Die Pflanzenarten mit dem größten Beitrag zu den Identifizierungen sind in Tabelle S7 aufgeführt. Abbildung 4(a) zeigt die Größenverteilung aller identifizierten reifen miRNAs, die aus Vorläufern vorhergesagt wurden. Unsere Ergebnisse sind auf die Auswahl kurzer Sequenzen ausgerichtet (im Vergleich zu der typischen Länge von 21 nt von miRNAs in anderen Spezies) und das Fehlen von Expressionsdaten behindert die Validierung. Daher haben wir strenge Kriterien für die Filterung angewendet. Zuerst wählten wir nur Vorläufer aus, die reife Sequenzen mit zuvor beschriebenen funktionellen Größen (20, 21, 22 oder 24 nt, 2881 Vorläufer) enthielten. Zweitens wählten wir Vorläufer aus, die eine reife miRNA mit Sequenzähnlichkeit zu den am stärksten konservierten miRNAs unter Pflanzen enthielten (330 Vorläufer, Tabelle S8). Drittens wurden RNA-Sekundärstrukturen manuell überprüft, um Vorläufer auszuwählen, die die strukturellen Anforderungen der microRNA erfüllten (Abbildung 4b), was 205 bzw. 66 Loci hoher und niedriger Qualität ergab (Tabelle S8) 20 wurden verworfen. Auch 72 Vorläufer wurden aufgrund der Identifizierung beider Stränge des miRNA-Duplex auf demselben Vorläufer auf 37 verschiedene Loci kollabiert (Abbildung 4c). Fünf lange Vorläufer mit stark negativen Indizes der minimalen freien Faltungsenergie (MFEI) wurden als minderwertig eingestuft, da sie der Struktur von zurückgefalteten Retrotransposons ähnelten (Abbildung 4d), die mit echten miRNA-Vorläufern verwechselt werden können. Kleine RNA-Expressionsdaten in zukünftigen Analysen können sie von kleinen interferierenden RNA-Vorläufern unterscheiden und den vollständigen Satz von in dieser Studie identifizierten miRNA-Loci validieren. MiR156 kommt in fast jeder Pflanzenart in hoher Kopienzahl vor, war aber besonders häufig in J. regia. Einundzwanzig MAKER-Modelle wurden als Squamosa-Promotor-Bindungsproteine ​​(SPL) annotiert, auf die diese miRNA typischerweise abzielt (Kozomara und Griffiths-Jones, 2014). Wenn diese Daten experimentell validiert werden, könnte dies die Bedeutung der SPL-Gene und miR156 in Entwicklungsprozessen in . hervorheben J. regia. Andere konsistente Ergebnisse umfassen eine Fülle von miR168 (zwei identifizierte miRNA-Loci), eine Schlüsselkomponente der Silencing-Maschinerie, die auf Argonaute (Vaucheret, 2008)-Proteine ​​abzielt (sieben Modelle identifiziert). MiR395 ist zwischen den Arten sehr vielfältig und reicht von nur sechs Kopien in Arabidopsis bis zu 17 in Prunus persica. Diese miRNA hilft bei der Regulierung der Sulfatassimilation bei Arabidopsis (Matthewman et al., 2012 ) und die 17 identifizierten hochwertigen Vorstufen in J. regia weisen auf eine wichtige Rolle der Schwefelstoffwechselregulation durch Gen-Silencing hin. Es wurden vier Genmodelle identifiziert, die als ATP-Sulfurylasen annotiert wurden (Ziel von miR395 in anderen Spezies), die gleiche Anzahl von Genen wie im Arabidopsis-Genom (Lamesch et al., 2012 ).

Identifizierung von miRNA im Walnuss-Genom.

(a) Längenverteilung reifer miRNA-Sequenzen, die von rechnerisch vorhergesagten Vorläufern abgeleitet wurden, für den vollständigen Satz identifizierter miRNAs (rot) und manuell kuratierter konservierter Pflanzen-miRNAs in anderen Spezies (blau).

(b), (c) Die RNA-Sekundärstruktur von zwei Vorläufern, die den Qualitätsfilter passiert haben. Sowohl miRNA als auch der komplementäre Strang wurden für den Vorläufer (c) rechnerisch identifiziert.

Tandemwiederholungen

Wir identifizierten 6,77 Mbp Tandem-Wiederholungen, die 0,95% des Genoms ausmachen. Die durchschnittliche Tandemwiederholung betrug 25 bp. Minisatelliten (9–100 bp) (Vergnaud und Denoeud, 2000) stellten den größten physischen Anteil des Genoms dar (0,51%), gefolgt von Satelliten (>100 bp, 0,28%) (Csink und Henikoff, 1998) und Mikrosatelliten (1–8 bp, 0,15%) (Morgante und Olivieri, 1993) (Tabelle S9). Unter den Mikrosatelliten waren Dinukleotid-Wiederholungen mit 25% aller Tandem-Wiederholungen und 0,8 Mbp des Genoms am weitesten verbreitet. Die sechs häufigsten Konsensussequenzen hatten eine Periodengröße von zwei und das AT-Dinukleotid umfasste 0,23 Mbp (0,03%) des Genoms (Tabelle S10, Abbildung S4). Juglans regia hatte eine deutlich höhere Mikrosatellitendichte als A. thaliana, C. sativus, V. vinifera oder P. triocharpa (Wegrzyn et al., 2014 ) (Abbildung 5). Dinukleotid- und Pentanukleotid-Wiederholungen waren deutlich dichter in J. regia als in anderen Pflanzengenomen, während andere Mikrosatelliten in vergleichbarer oder geringerer Dichte vorhanden waren. Der durchschnittliche Mikrosatellit hatte eine Kopienzahl von 14,75, während Minisatelliten und Satelliten durchschnittliche Kopienzahlen von 2,84 bzw. 2,30 aufwiesen.

Ein Vergleich der Mikrosatellitendichte zwischen den Arten.

Überlappende Wiederholungen wurden aufgelöst, indem das Element mit einem höheren Tandem-Wiederholungs-Finder-Score ausgewählt wurde. Tandem-Wiederholungen mit eingestreuten Wiederholungen, die sich auf weniger als 15% ihrer Länge überlappten, wurden ausgewählt. Diese Daten wurden mit einem ausgewählten Satz sequenzierter Angiospermen verglichen.

Eingestreute Wiederholungen

Eingestreute Wiederholungen sind typischerweise mobile Elemente, die sich entweder unter Verwendung von DNA oder einem RNA-Zwischenprodukt vermehren. Unsere Analyse ergab, dass 51,19 % (50,38 % durchsetzt plus 0,95 % Tandem) der J. regia Genom ist repetitiv. Diese Schätzung ist höher als eine vorherige Schätzung von 28,9 % unter Verwendung von BAC-Sequenzen (Wu et al. 2012) ist es auch größer als das von P. trichocarpa (42%) (Tuskaner) et al., 2006 ) aber ähnlich wie Eukalyptus grandis (50,1% Myburg et al., 2014 ) und V. vinifera (55,02%). Es wurden 930 517 eingestreute Wiederholungen im Genom identifiziert (754 453 Volllängen- und 176 064 Teilwiederholungen) mit einer Gesamtlänge von 346 567 115 bp. Die Prozentsätze von de novo und Ähnlichkeitsanmerkungen betrugen 92,49 % bzw. 7,51 %. Die Anzahl der einzigartigen de novo Die von RepeatModeler erhaltenen Wiederholungen betrugen 811, während 2009 einzigartige Wiederholungselemente mithilfe einer Repbase-Ähnlichkeitssuche identifiziert wurden (Abbildung S5). Unter den eingestreuten Wiederholungen machten Wiederholungen voller Länge 53 151 460 bp (7,7%) und partielle Wiederholungen 293 415 655 bp (42,6%) aus (Abbildung 6). Es gab 27.473 eingestreute Wiederholungen (40 einzigartige Elemente), die nicht klassifiziert waren (627 733 volle Länge und 3 548 903 partielle), was 0,6% des Genoms ausmachte. Die eingestreuten Repeats machten 50,38 % des Genoms aus, davon 35,38 % Retrotransposons und 14,35% DNA-Transposons und uncharakterisierte Repeats. Unter den Long Terminal Repeat (LTR) Retrotransposons waren Gypsies und Copias mit 8,40% (721 einzigartige Elemente) und 6,57% (701 einzigartige Elemente) des Genoms am häufigsten. Das Verhältnis der Genomabdeckung von Gypsy- zu Copia-Elementen betrug 1,27 (Tabelle S11). Die Anzahl der uncharakterisierten LTRs betrug jedoch 7,09% der Gesamtzahl nach einer Ähnlichkeitssuche und manueller Kuration. Die Datierung der LTRs ergab, dass Copia-Elemente eine mediane LTR-Divergenz von 4,6 % im Vergleich zu 5,5 % für Zigeunerelemente aufwiesen, was darauf hindeutet, dass Copias jünger sein könnten (Datei S2). Allerdings können die Anzahl der Elemente und der Prozentsatz des Genoms, der von uncharakterisierten LTRs abgedeckt wird, die Datierungsergebnisse beeinflussen.

Eingestreute Wiederholungsinhalte in Juglans regia.

Aufschlüsselung der vollen (mit einem Cutoff von 80–80–80 (Wicker et al., 2007), als vollständig gekennzeichnet) und alle (vollständig plus Teillängenelemente, als alle gekennzeichnet) eingestreute Wiederholungen im Genom. Wiederholungselemente wurden weiter in Klasse I (Retrotransposons) und Klasse II (DNA-Transposons) eingeteilt. Die Abbildung zeigt auch den rRNA-Gehalt und nicht klassifizierte Wiederholungselemente in J. regia.

Nicht-LTR-Elemente haben keine LTR-Regionen und enden mit einer einfachen Sequenzwiederholung wie Poly(A). Anstelle von RNA-vermittelter, elementkodierter Reverser Transkriptase und Integrase findet an der Insertionsstelle eine Ziel-geprimte RNA-Reverse-Transkription statt (Kejnovsky et al., 2012). Der Prozentsatz von Nicht-LTR-Retrotransposons im Genom betrug 10,47 %. L1/LINE ist mit 7,6% des Genoms die größte Nicht-LTR-Retrotransposon-Unterfamilie. Unter DNA-Transposons (14,35% des Genoms, 263 einzigartige Elemente), En/Spm (Enhancer Suppressor-Mutator) und hAT (Rubin et al., 2001) sind die wichtigsten DNA-Elemente mit 2,23% bzw. 2,08% des Genoms.

SNP-Erkennung

Wir fanden 965 861 hochwertige SNPs, die in 7123 Gerüsten verteilt sind. Um die SNP-Heterozygotie abzuschätzen, konditionierten wir alle Sites auf eine erforderliche Mindesttiefe von 80 und eine minimale Kartierungsqualität von 20, was 398 173 095 Sites auf 16 077 Gerüsten ergab, auf denen potenziell hochwertige SNPs aufgerufen werden könnten. Dies führte zu einer Gesamtschätzung der SNP-Heterozygotie von 0,0024. Die Einbeziehung von SNPs geringerer Qualität über dieselbe Region erhöhte die Schätzung leicht auf 0,0025. Erwartungsgemäß bestand eine starke Korrelation zwischen der Länge des Gerüsts und der Anzahl der SNPs. Gerüste ohne SNPs waren tendenziell klein und machten 41 % nach Anzahl aus, aber nur 9,9 % nach Länge von Gerüsten, die länger als 5000 bp waren (siehe Abbildung S6 für Genom-Heterozygotie, Anhang S1). Nur 38 längere Gerüste zwischen 100 und 673 kbp hatten keine SNPs. Diese Ergebnisse bestätigten, dass die meisten Gerüste ohne SNPs kurz sind und legen nahe, dass gemeinsame Vorfahren größtenteils in der fernen Vergangenheit liegen. Die meisten Gene befanden sich auf einem Gerüst mit einem SNP: 14 469 Gene enthielten zusammen 177 702 hochwertige SNPs innerhalb ihrer Genregion. Eine Untergruppe von 10 130 Genen hatte SNPs innerhalb ihrer annotierten kodierenden Sequenz.

Gesamtgenom-Duplikationsereignis

Es gibt Hinweise auf die Vervielfältigung des gesamten Genoms auf der Grundlage des Fossilienbestands Juglans Abstammungslinie, die vor etwa 60 Millionen Jahren auftrat (Luo et al., 2015). Um umfassend die Beweise für eine Gesamtgenom-Duplikation innerhalb der J. regia Genoms wurden Selbstvergleiche durchgeführt, um konservierte Syntenieregionen zwischen homöologen Regionen des Genoms zu identifizieren. Wir identifizierten 8459 Paare paraloger Gene (Syntelogs, 12 084 Gene), mit Ausnahme der Tandemduplikation innerhalb des Gerüsts. Davon kamen 3688 (30,5%) Gene mehr als zweimal vor. Die Verteilung der geschätzten synonymen Änderungen pro synonymer Site (KS) wurde für jedes der 4111 Paare (8093 Gene) von Syntelogs mit KS < 1 (Abbildung 7). Innerhalb dieser Gruppe kamen nur 423 (5,2%) Gene mehr als zweimal vor. Zwei offensichtliche Peaks sind vorhanden. Der kleinere Peak in der Nähe des Ursprungs repräsentiert wahrscheinlich nicht verschmolzene allelische Haplotypen beim Zusammenbau eines einzelnen ausgezüchteten Genoms. Der Hauptpeak, der die Mehrheit der Syntelogs darstellt, hat einen Modus bei KS = 0,33. Dies stimmt überraschenderweise mit einer Schätzung der durchschnittlichen Divergenz von 14 Paaren paraloger Gene (KS = 0,274 ± 0,09) (Luo et al., 2015). Gene Ontology-Begriffe, die in den 8093-Genen überrepräsentiert waren mit KS < 1 umfasste Proteine ​​mit Funktionen in der Transkriptionsregulation und Signaltransduktionskomponenten (Abbildung S7), ähnlich denen, die in anderen Pflanzengenomen identifiziert wurden (Blanc und Wolfe, 2004 Seoighe und Gehring, 2004 Bekaert et al., 2011). Unsere Ergebnisse liefern starke Unterstützung für die Duplikation des gesamten Genoms und den Grad der Divergenz zwischen Syntelogs. Genomdaten von anderen Mitgliedern der Juglandaceae werden benötigt, um ein genaueres Datum und eine genauere phylogenetische Platzierung für die gesamte Genomduplikation zu bestimmen.

Identifizierung von GGT, einem Enzym, das den engagierten Schritt in der Biosynthese von HTs katalysiert

Gallussäure, die Vorstufe für die Synthese von Gallo- und Elagitanninen, wird aus 3-Dehydro-Shikimisäure synthetisiert und dann in β-Glucogallin (1-Ö-galloyl-β-d-glucose), dem Schlüsselintermediat für die Synthese von HTs (Niemetz und Gross, 2005 Muir et al., 2011). Kürzlich wurde gezeigt, dass eine Glucosyltransferase die Bildung von β-Glucogallin katalysiert (Mittasch et al., 2014). Die Enzymfamilie der Glykosyltransferase (GT) überträgt Saccharideinheiten von aktivierten Donormolekülen auf Akzeptormoleküle (Lairson® et al., 2008). Glycosyltransferasen werden von der Carbohydrate-Active enZYmes Database (CAZy) (Lombard .) in 97 Familien eingeteilt et al., 2014 ), von denen 1-Glycosyltransferasen oder UDP-abhängige Glycosyltransferasen (UGTs) die größten im Pflanzenreich sind (Ross et al., 2001 Yonekura-Sakakibara und Hanada, 2011). Diese UGTs sind in 16 Gruppen (A–P) unterteilt (Ross et al., 2001 Caputi et al., 2012). Dikotyledonen haben eine breite Palette von mutmaßlichen UGT-Genen in ihren Genomen (C. sativus hat 85 Malus Domestica, 241 usw. Caputi et al., 2012). Eine kürzlich durchgeführte genomweite Analyse von UGTs in Mais identifizierte 147 Gene (Li et al., 2014). Wir haben UGT84A13 (QrGGT) verwendet, eine Gruppe L UGT von Quercus robur (Stieleiche) (Mittasch et al., 2014 ), um die J. regia Transkriptom und identifizieren UGT-Gene im Genom mit einem iterativen Algorithmus (siehe Experimentelle Verfahren). Die UGTs enthalten ein konserviertes Segment von 42 Aminosäuren, dargestellt durch das PSPG-Motiv (putative sekundäre Pflanzen-Glycosyltransferase) (Fig. 8a). Unter Verwendung des PSPG-Motivs identifizierten wir etwa 130 verschiedene UGT-Gene, die im J. regia Genom (Abbildung 8b). Transkripte von UGTs werden in den meisten Geweben unterschiedlich exprimiert, wobei eine hohe Zahl in Wurzeln exprimiert wird (Tabelle S12). Der phylogenetische Baum (Abbildung 8c) zeigt ungefähr die gleiche Anzahl von Gruppen wie zuvor berichtet (Caputi et al., 2012). Unser besonderes Interesse galt UGTs mit GGT-Aktivität, die die Bildung von 1-Ö-Galloyl-β-d-glucose. Zwei Gene in J. regia, c48329_g2_i1 (JrGGT1) und c48329_g1_i1 (JrGGT2), waren die engsten Übereinstimmungen mit QrGGT und gehörten zur L-Gruppe der UGTs (Caputi et al., 2012 Mittasch et al., 2014). UGTs der Gruppe L haben enzymatische Aktivitäten auf eine Vielzahl von Metaboliten, einschließlich Phenylpropanoiden (Lim et al., 2003 ), Benzoate (Lim et al., 2002) und Indol-3-essigsäure (Jackson et al., 2001). Die phylogenetische Gruppierung konnte jedoch die breiten biochemischen Aktivitäten einer bifunktionellen Resveratrol/Hydroxyzimtsäure-Glucosyl-Transferase aus der Concord-Traube nicht vorhersagen (Hall und De Luca, 2007). Ein ähnlicher Vorbehalt wird von der CAZy-Datenbank hervorgehoben, die darauf hinweist, dass „Polyspezifität (Enzyme mit unterschiedlichen Donoren und/oder Akzeptoren in derselben Familie) unter Glycosyltransferase-Familien verbreitet ist, was genaue funktionelle Vorhersagen oft unzuverlässig oder ungenau macht“ (http://www .cazy.org/GlycosylTransferases.html). Daher erfordern die Promiskuität und die breite Substratspezifität (Chakraborty und Rao, 2012) dieser Enzyme eine angemessene biochemische Charakterisierung bei der Klassifizierung ihrer katalytischen Eigenschaften.

Sequenzanalyse von Glucosyltransferasen (GT) in Juglans regia.

(a) Prositenprofil der 42 konservierten Reste in GT-Sequenzen.

(b) Partielles multiples Sequenz-Alignment der konservierten Region von GT-Proteinsequenzen.

(c) Molekulare phylogenetische Analyse nach der Maximum-Likelihood-Methode. Die Analyse umfasste 130 Aminosäuresequenzen. Der endgültige Datensatz enthielt 757 Positionen. Evolutionäre Analysen wurden in MEGA6 durchgeführt. UDP-Glycosyltransferasen der Gruppe L sind rot markiert.

Um die molekularen Grundlagen der Variation der Substratspezifität von JrGGT1 und JrGGT2 zu untersuchen, haben wir die Gene mit SWISS-MODEL (Arnold et al., 2006 ) mit PDBid:2PQ6 von Medicago Truncatula (welche die Identität von UGT84A13 am nächsten hat) als Vorlage. Zuvor haben wir eine Methode vorgeschlagen, um Mutationen in einem Protein vorzuschlagen, um ihm eine spezifische katalytische Funktion zu verleihen, basierend auf struktureller und elektrostatischer Homologie von Resten im aktiven Zentrum mit denen eines bekannten Proteins mit der gewünschten Funktion (Chakraborty, 2012). Für einen einheitlichen Vergleich wählten wir die Cα-Atome der Reste als repräsentatives Atom für jeden Rest. Die aktiven Zentren dieser Proteine ​​haben unterschiedliche Donor- und Akzeptor-Bindungsstellen (Li et al., 2007). Wir wendeten Transformationen an (Chakraborty, 2012), um drei Reste (H378, F400 und D402) auszurichten, die an der Donor-Bindungsstelle (Li et al., 2007). Diese Reste sind in beiden JrGGT-Proteinen genau konserviert. H378 und W381 entsprechen den His- und Trp-Resten des aktiven Zentrums, die von Ghose . beschrieben wurden et al. ( 2015 ), die für die Glykosylierung des Phenylpropanoids Secoisolariciresinol entscheidend sind.

Diese mehrfache Überlagerung der Proteine ​​lieferte einen einzigen Bezugsrahmen für den Vergleich der GTs, was ihre strukturelle Gesamthomologie klar demonstrierte (Abbildung 9). Daher ist es logisch, dass die Unterschiede zwischen diesen Proteinen, die M. truncatula Isoflavonoid GT gegenüber Q. rubar und J. regia GGT-Proteine ​​liegen in ihren aktiven Zentren. Nach der Überlagerung nahmen wir Reste im Umkreis von 5 aus der Triade (H378, F400 und D402). Für jeden Rest in PDBid:2PQ6 fanden wir den nächsten Rest in JrGGT1 und JrGGT2, der die Proteine ​​überlagerte, und verglichen dann die Reste in den aktiven Zentren der drei Proteine. Einige Positionen sind mit stereochemisch unterschiedlichen Resten besetzt, was einen plausiblen Grund für die unterschiedliche Substratspezifität beim Vergleich von GT und GGTs liefert (Gouran et al., 2014). Beispielsweise wird das große, negativ geladene D201 in PDBid:2PQ6 durch einen kleinen, polaren Serinrest im . ersetzt J. regia und Q. rubar GGTs. Wir haben vier Paare von PCR-Primern basierend auf der genomischen Sequenz entworfen, um das Vorhandensein dieser Gene zu bestätigen: Für jedes Gen wurde ein Primer-Satz entworfen, um nur die kodierende Region zu amplifizieren und der andere, um das Gen und 2 kb stromaufwärts und 1 kb . zu amplifizieren stromabwärts der kodierenden Region (siehe Anhang S2, Abbildungen S8–S15, Tabellen S15–S19). Die Primer (JrGGT1-F-cd und JrGGT1-R-cd JrGGT2-F-cd und JrGGT2-R-cd) amplifizierten einzelne Banden, die die GGT-kodierende Region von genomischer DNA, die aus verschiedenen isolierten J. regia Sorten (siehe Anhang S2). JrGGT1 befand sich auf einem 7209-bp-Gerüst mit der Bezeichnung jcf7180001222249 und JrGGT2 war auf einem 7350-bp-Gerüst mit der Bezeichnung jcf7180001222233 vorhanden (siehe Anhang S2).

Multiples Sequenz-Alignment der Gallat-1-β-Glucosyltransferase (GGT)-Sequenzen.

(a) Alignment der JrGGT1- und JrGGT2-Aminosäuresequenzen von Juglans regia mit QrGGT von Quercus robur (Mittasch et al., 2014 ) und eine Medicago-Flavonoid-Glucosyltransferase (GT) mit bekannter dreidimensionaler (3D) Struktur. Blau markierte Rückstände entsprechen Rückständen in (b). Ein dunkleres Blau zeigt die drei Reste des aktiven Zentrums an, die ausgewählt wurden, um die 3D-Ausrichtungen in der DECAAF-Modellierung miteinander zu verankern. Die konservierte Region, die zum Aufbau des phylogenetischen Baums (Abbildung 10) verwendet wurde, liegt innerhalb des gelb umrandeten Bereichs.

(b) DECAAF-generierte Überlagerung, erhalten durch Überlagerung von Cα-Atomen (F302, H378 und D402) von der Donorbindungsstelle eines GT (PDBid:2PQ6). [PDBid:2PQ6 in Rot, QrGGT (Eiche) in Grün, JrGGT1 in Blau und JrGGT2 in Orange]. *Dieser Rest ist in einer Proteindatenbank (PDB) stereochemisch unterschiedlich.

Identifizierung und Charakterisierung der JrPPO1 Gen in J. regia

Um PPO-Gene im zu identifizieren J. regia Genom haben wir die Nukleotidsequenz von JrPPO1 (GenBank ACN86310.1), zuvor mit Southern-Analyse gefunden (Escobar et al., 2008). Diese Sequenz diente als BLASTN-Abfrage der J. regia Genom-Assemblies. Ein einzelnes 18 263-bp-Gerüst (jcf7180001214880), das JrPPO1 wurde gefunden. Die Dreifaltigkeit de novo Assembly contig c55545_g1_i1, die übereinstimmte JrPPO1, und heißt hier WALNUT_00030240-RA, perfekt auf das genomische Gerüst ausgerichtet. Dieses Gen enthält die drei charakteristischen Domänen für JrPPO1, PF00264:Tyrosinase, PF12143:PPO1_KFDV und PF12142:PPO1_DWL, gemäß einer NCBI CDD-Suche (Marchler-Bauer et al., 2015 ), die die mit MAKER-P erhaltene Genom-Annotation validiert.

BLASTN der JrPPO1 Kodierungssequenz zur Dreifaltigkeit de novo Montage der J. regia Transkriptom identifizierte drei zusätzliche vorhergesagte Transkripte: c44803_g1_i1, c44803_g2_i1 und c44803_g3_i1. Diese stimmten mit der Abfrage mit etwa 80 % der Sequenzidentität überein und waren alle auf einen einzigen genomischen ORF ausgerichtet, den wir bezeichneten JrPPO2. YeATS (Chakraborty et al., 2015 ) hat ein Überlappungssegment zwischen c44803_g2_i1 und c44803_g3_i1 festgestellt, was darauf hinweist, dass sie Teil desselben ORF sind, wie unabhängig durch Visualisierung der bildenden Reads gezeigt wurde JrPPO1 und JrPPO2 auf unabhängigen Gerüsten mit Integrated Genome Viewer (IGV siehe Anhang S2). JrPPO2 ist auf einem einzelnen 22 390 bp-Gerüst vorhanden (jcf7180001216434). Es kodiert für ein PPO-Gen, das sich von unterscheidet JrPPO1 aber mit etwa 71% Aminosäuresequenzidentität (siehe Anhang S2). MAKER-P annotierte die gesamte 1833-bp-kodierende Region von JrPPO2 auf diesem Gerüst als Einzel-Exon-vorhergesagtes Gen, WALNUT_00029754-RA, das drei InterProScan-Domänen enthält (IPR022739, IPR022740 und IPR002227).

Um das Vorhandensein von Genen zu bestätigen, die für JrPPO1 und JrPPO2 kodieren, haben wir genspezifische PCR-Primer entwickelt, wie für GGT beschrieben (siehe Anhang S2). Diese Primer (JrPPO1-F-cd und JrPPO1-R-cd JrPPO2-F-cd und JrPPO2-R-cd) amplifizierten einzelne Banden, die die JrPPO-kodierenden Regionen aus genomischer DNA, die aus verschiedenen isolierten J. regia Sorten (siehe Anhang S2). Polymerase-Kettenreaktion, die auf die regulatorischen Sequenzen von abzielt JrPPO1 ergab Amplikons für alle J. regia Sorten jedoch, PCR-Targeting der JrPPO2 regulatorische Regionen konnten zwei von fünf getesteten Sorten nicht amplifizieren, was auf eine Variation zwischen den Sorten in der regulatorischen Sequenz von . hinweist JrPPO2. Sanger-Sequenzierung der JrPPO Amplicons unterstützten die Anwesenheit von beiden JrPPO1 und JrPPO2 mit hochkonservierten, aber nicht identischen Sequenzen, wie von der WGS vorhergesagt. Im genomischen Gerüst mit wurden keine Wiederholungen gefunden JrPPO1 und 43 hochwertige SNPs kommen in der kodierenden Region von nicht vor JrPPO1.

JrPPO1 und JrPPO2 sind phylogenetisch verschieden (Abbildung 10), aber beide sind eng mit den Vorfahren der Pflanzen-PPO-Gene verwandt. Über eine Vielfalt von PPO-Genen wurde berichtet in Physcomitrella patens, Glycin max, Populus trichocarpa und andere Genome, mit Variationen in der Sequenzlänge und einer breiten Verteilung von Introns sowohl in monokotylen als auch eudikotylen Abstammungslinien, zum Beispiel in P. trichocarpa (PtPPO13) und Cherimoya (Annona cherimola AcPPO) (Tran et al., 2012). Diese beobachtete Diversität kann aus unabhängigen Ausbrüchen der Genduplikation als Reaktion auf Umweltanpassung und einer Vielfalt enzymatischer Funktionen resultieren (Tran et al., 2012 ).

Molekulare phylogenetische Analyse nach der Maximum-Likelihood-Methode.

Die Evolutionsgeschichte wurde unter Verwendung der Maximum-Likelihood-Methode basierend auf dem Poisson-Korrekturmodell (Zuckerkandl und Pauling, 1965) abgeleitet. Der aus 1000 Replikaten abgeleitete Bootstrap-Konsensusbaum soll die Evolutionsgeschichte der analysierten Taxa darstellen (Felsenstein, 1985). Zweige, die Partitionen entsprechen, die in weniger als 50 % der Bootstrap-Replikate reproduziert wurden, werden reduziert. Anfangsbäume für die heuristische Suche wurden automatisch durch Anwendung des Maximum-Parsimony-Verfahrens erhalten. Die Analyse umfasste 118 Aminosäuresequenzen. Der endgültige Datensatz enthielt 749 Positionen. Evolutionäre Analysen wurden in MEGA6 (Tamura et al., 2013 ).

Aus der Auswertung der Genexpression in verschiedenen Geweben werden die beiden entsprechenden PPO-Transkripte unterschiedlich exprimiert, wobei JrPPO1 in den meisten grünen Geweben exprimiert wird und JrPPO2 spezifischer in Kallusgewebe exprimiert wird, wo die Expression von JrPPO1 geringer ist (Tabelle 8). Ein multiples Sequenz-Alignment (Fig. 11) legt nahe, dass beide Proteine ​​auf dem Thylakoid lokalisiert sind, sie enthalten für solche Proteine ​​typische Zwillingstransitpeptide. Scaffold jcf7180001216434 enthielt 123 hochwertige SNPs, wobei die Mehrheit in der nicht-kodierenden Region des Gens vorkam. Ein SNP innerhalb der JrPPO2-Kodierungsregion führte zu einer nicht-synonymen Veränderung: Ein Glutamin wurde zu einem Lysin (Q-33K), das sich im Thylakoid-Signalpeptid befindet, das gespalten wird. Um die Struktur-Funktions-Beziehung von Resten des aktiven Zentrums zu untersuchen, haben wir die Proteinsequenzen von JrPPO1 und JrPPO2 unter Verwendung der gut charakterisierten PPOs aus V. vinifera und Ipomeoea batatas (PDB-IDs 2P3X bzw. 1BT2) im SWISS-MODEL (Biasini et al., 2014). Das aktive Zentrum dieser Enzyme besteht aus zwei Cu-bindenden Subdomänen (Abbildungen 11 und 12). Von besonderem Interesse ist das Alignment von Aminosäureresten in der CuA- und CuB-bindenden Region zwischen den vier Proteinen. Die Histidinreste an den Positionen 87, 108 und 117, die CuA binden, sind hochkonserviert, ebenso wie die Histidinreste an den Positionen 239, 243 und 272 der CuB-Subdomäne. Die Substratspezifität kann durch Variationen der Reste an den Positionen 109 und 244 bestimmt werden. Wir untersuchten die Reste des aktiven Zentrums, indem wir die Struktur von Phenylthioharnstoff, einem bekannten PPO-Inhibitor, an JrPPO1 mit DOCLASP andockten (Chakraborty, 2014). Um Veränderungen im aktiven Zentrum aufgrund der Bindung von Phenylthioharnstoff nachzuahmen, verwendeten wir die Struktur des PPO aus I. batatas mit gebundenem Phenylthioharnstoff (PDB ID: 1BUG Klabunde et al., 1998 ), um JrPPO1 mit SWISS-MODEL zu modellieren. Ein Schwefelatom in Phenylthioharnstoff wird von den Kupferionen als Ligand gebildet (Abbildung 12b, Tabelle S13), was zu Konformationsänderungen führt (Tabelle S14). Klabunde et al. ( 1998 ) schlugen vor , dass der aromatische Ring von F259 den Zugang zum katalytischen Metallzentrum kontrolliert , der Phenylring von F259 und der Imidazolring von H243 nach Konformationsänderungen hydrophobe Wechselwirkungen mit dem aromatischen Ring des Inhibitors eingehen und schließlich der Schwefel von Phenylthioharnstoff die Hydroxo-Brücke im Apoenzym vorhanden. Daher nehmen wir an, dass PPOs verschiedener Spezies trotz offensichtlicher Unterschiede in der Sequenz und bekannter enzymatischer Aktivität ein ähnliches Hemmprofil aufweisen

Transkripte CE CI CK EM FL HC HL PS HU WENN LE LM LY NS PL PT RT SE VB
c55545_g1_i1 63 44 1844 0 1657 36 530 140 44 287 1748 52 1519 2 0 19 19 1 1355
c44803_g1_i1 839 873 80 0 343 46 14 2 19 8 12 2 24 64 0 0 112 96 77
c44803_g2_i1 1719 647 131 0 312 57 19 1 9 7 15 1 23 64 3 0 538 124 93
c44803_g3_i1 804 242 56 0 154 22 7 0 6 2 6 1 10 25 0 0 223 53 37
  • CE, Kallus außen CI, Kallus innen CK, Kätzchen EM, Embryo FL, Pistillatblüte HC, Rumpfrinde HL, Rumpf unreif HP, Rumpfschale HU, Schale dehiscing IF, Frucht unreif LE, Blätter LM, Blattreif LY, Blatt jung PK , Packungsgewebe reife PL, Häutchen PT, Packungsgewebe unreife RT, Wurzel SE, somatischer Embryo VB, vegetative Knospe.

Volllängen-Multiple-Sequenz-Alignment der Polyphenoloxidase (PPO)-Sequenzen von Juglans regia, Vitis vinifera und Ipomeoea batatas.

Die unreife PPO-Aminosäuresequenz in voller Länge wird vor jeder posttranslationalen Modifikation der Signalpeptide gezeigt. Das Chloroplasten-Signalpeptid (CSP) wird durch einen dunkelgrünen Balken und das Thylakoid-Signalpeptid (TSP) durch einen hellgrünen Balken dargestellt. Alpha-Helices werden durch die dicken Blöcke angezeigt, Beta-Sheets werden durch die dicken Pfeile angezeigt und unstrukturierte Kurven werden durch die dünnen Pfeile angezeigt. Die Aminosäurezählung beginnt bei der ersten Aminosäure (Ala) der 2P3X-Kristallstruktur, die Zahlen, die den Disulfidbindungen und der Thioesterbrücke entsprechen, werden von der 2P3X-Struktur abgeleitet. Die Alpha-Helices und Beta-Sheets entsprechen den von Virador für VvPPO (2P3X) beschriebenen Features et al. (2010). Die bekannten Spaltstellen für das Vv2P3X (Virador et al., 2010) und JrPPO1 (Zekiri et al., 2014b ) CSP, TSP und C-Terminus sind durch ein schwarzes „|“-Symbol gekennzeichnet, vorhergesagte Schnittstellen in JrPPO2 sind durch ein rotes „|“-Symbol gekennzeichnet.

Modellierung der JrPPO1-, JrPPO2- und 2P3X-Proteinsequenzen.

(a) Kartierung von Resten des aktiven Zentrums in der Nähe der CuA- und CuB-Bindungsregionen von JrPPO1 und JrPPO2 im Vergleich zu Weinreben-Polyphenoloxidase (PPO) (2P3X). Aktive Site-Regionen werden auch mit Süßkartoffel (1BT1) verglichen.

(b) Andocken von Phenylthioharnstoff an JrPPO1 unter Verwendung von DOCLASP: JrPPO1 wurde unter Verwendung des PPO aus Süßkartoffel (PDB ID:1BUG) von SWISS-MODEL modelliert. *Dieser Rest ist in einer Proteindatenbank stereochemisch unterschiedlich.


Biochemische und molekulare Mechanismen der Stresstoleranz bei antarktischen Arthropoden

Im Vergleich zu Insekten der gemäßigten Klimazone wurde den molekularen Mechanismen der Stresstoleranz bei antarktischen Arthropoden wenig Aufmerksamkeit geschenkt. Nichtsdestotrotz charakterisierten frühe Studien in den 1980er Jahren biochemische Marker von Umweltstress, und neuere Studien haben von den Fortschritten in der Molekularbiologie profitiert. Hier werden wir die physiologischen Mechanismen der Stresstoleranz bei antarktischen terrestrischen Arthropoden überprüfen und einige Wege für zukünftige Forschung aufzeigen.

Wie bei ihren gemäßigten Gegenstücken ist die saisonale und stressbedingte Akkumulation von niedermolekularen Osmoprotektiva ein Kennzeichen der antarktischen Arthropoden. Jede bisher profilierte Art akkumuliert eine Art osmoprotektiver Verbindung, obwohl Art und Menge von Art zu Art variieren. Zum Beispiel die Milbe A. antarktis verwendet hauptsächlich Glycerin als Osmoprotektivum und akkumuliert Werte von mehr als 0,5 mol l −1 (Block und Convey, 1995). Ebenso die collembolan C. antarktis verwendet Glycerin als Hauptkryoprotektor und akkumuliert auch Glucose und Trehalose als Reaktion auf Austrocknung (Elnitsky et al., 2008a). Im Gegensatz dazu ist die Mücke B. Antarktis akkumuliert sehr geringe Mengen an Glycerin und verlässt sich stattdessen hauptsächlich auf Glucose, Erythritol und Trehalose als Osmoprotektive (Lee und Baust, 1981 Baust und Lee, 1983). Ein Thema, das sich aus Studien sowohl polarer als auch tropischer austrocknungstoleranter Organismen ergibt, ist die Bedeutung von Trehalose als Osmoprotektivum während der Dehydratation. Es wurde gezeigt, dass eine Reihe von Organismen, einschließlich bestimmter Bakterien, Pilze, Pflanzen und Metazoen, Trehalose als Reaktion auf Austrocknung akkumulieren (Elbein et al., 2003). Bei Arthropoden fungiert Trehalose typischerweise als Blutzucker und ist das wichtigste Osmoprotektivum bei Arthropoden, die zur Anhydrobiose fähig sind (Clegg, 2001). Aktuelle Studien in C. antarktis (Elnitsky et al., 2008a) und B. Antarktis (Benoit et al., 2007b Elnitsky et al., 2008b) haben seine Bedeutung auch bei extremer Dehydration bei antarktischen Arthropoden impliziert.

In den letzten Jahren haben physiologische Studien an antarktischen Arthropoden von Fortschritten in der Molekularbiologie und der „Omics“-Technologie profitiert, obwohl molekulare Experimente nur an zwei Arten, den Collembolanen, durchgeführt wurden C. antarktis und die Mücke B. Antarktis. Unabhängig davon beginnen diese Studien, Hinweise auf die Mechanismen der Stresstoleranz bei einigen der extremsten Arthropoden der Welt zu geben. Eine Zusammenfassung der Stress-responsiven Gene, die in antarktischen Arthropoden identifiziert wurden, ist in Tabelle 1 enthalten.

Molekulare Experimente in C. antarktis sind auf zwei Microarray-Studien zur Kältetoleranz beschränkt. Im ersten wurden Tiere mit „niedrigen“ Unterkühlungspunkten (<-15°C) mit Tieren mit „hohen“ Unterkühlungspunkten (>-15°C) verglichen, um zu bestimmen, welche Gene für die Senkung der Unterkühlungspunkte verantwortlich sind (Purać et al ., 2008). Dieser Mikroarray enthielt eine Untermenge von 672 exprimierten Sequenz-Tags (ESTs) und war daher nicht umfassend. Dennoch weisen Expressionsmuster auf eine Hochregulation einer Reihe von kutikulären Proteinen und anderen strukturellen Bestandteilen in der „niedrigen“ Gruppe hin, was die Bedeutung des Kutikula- und Häutungszyklus bei der Regulierung der Unterkühlungskapazität in antarktischen Collembolen bestätigt (Worland und Convey, 2008). Andere Gene, die in der „niedrigen“ Gruppe im Vergleich zur „hohen“ Gruppe hochreguliert sind, umfassen mehrere mitochondriale Gene, die an der ATP-Synthese beteiligt sind, was darauf hindeutet, dass die Steigerung der Energieproduktion eine Komponente des Überlebens bei niedrigen Temperaturen sein kann. Spezifische hochregulierte Gene, die durch qPCR bestätigt wurden, umfassen ein kutikuläres Protein und CHK1, ein Checkpoint-Homolog, das an der Zellzyklusregulation beteiligt ist. Ein ähnliches Experiment wurde später mit einem größeren Mikroarray (mit 5400 ESTs) durchgeführt, und erneut wurden eine Reihe von kutikulären Genen und am Häutungszyklus beteiligten Gene in kälteakklimatisierten Collembolen hochreguliert (Burns et al., 2010). In dieser Studie wurde bestätigt, dass drei Gene (endocuticuläres strukturelles Glykoprotein SgAbd-4, kutikuläres Protein 49Ah und Chitin-bindendes Peritrophin A) durch qPCR hochreguliert sind, während nachgewiesen wurde, dass eine mRNA, die das extrazelluläre Matrixprotein Tenebrin codiert, herunterreguliert ist.

Im Vergleich zu anderen antarktischen Arthropoden ist die Antarktische Mücke B. Antarktis wurde den meisten molekularen Studien unterzogen. Wie bei Insekten der gemäßigten Klimazone sind die Hitzeschockproteine ​​wichtige Mediatoren der Stresstoleranz bei B. Antarktis. Während jedoch die meisten Insekten Gene, die Hitzeschockproteine ​​kodieren, in sehr geringen Mengen exprimieren, bis die Proteine ​​benötigt werden, B. Antarktis exprimieren konstitutiv Gene, die Hitzeschockproteine ​​kodieren, die ganze Zeit in hohen Mengen (Rinehart et al., 2006). Während Erwachsene von B. Antarktis haben eine typische Hitzeschockproteinantwort, weder Hitze noch Kälte erhöhte Expression von drei verschiedenen Hitzeschockproteinen (kleines hsp, hsp70 und hsp90) in Larven. Dieses ständige Vorhandensein von Hitzeschockproteinen bietet wahrscheinlich das ganze Jahr über Schutz vor Umweltstress, der in der maritimen Antarktis häufig und unvorhersehbar sein kann. Während eine hohe Expression von Hitzeschockproteinen typischerweise Wachstum und Entwicklung behindert (Krebs und Feder, 1997), können Larven von B. Antarktis sind in der Lage, dies zu umgehen und sogar während der Nahrungsaufnahme und des Wachstums Hitzeschockproteine ​​in hohen Mengen zu produzieren.

Konstitutive Abwehr in B. Antarktis sind nicht auf Hitzeschockproteine ​​beschränkt. Ebenso exprimieren Larven Gene, die das antioxidative Enzym Superoxiddismutase kodieren, in hohen Konzentrationen, selbst wenn kein offener oxidativer Stress vorliegt (Lopez-Martinez et al., 2008). Die mRNA-Spiegel der Superoxiddismutase sowie der mRNAs, die für Katalase und drei Hitzeschockproteine ​​kodieren, steigen nach Exposition gegenüber Sonnenlicht leicht an. Tatsächlich verleiht die Expression dieser Gene eine extrem hohe Resistenz gegenüber oxidativen Schäden in B. Antarktis, da die antioxidative Kapazität von B. Antarktis Larven ist fünfmal größer als die eines gemäßigten frosttoleranten Insekts, E. solidaginis (Lopez-Martinez et al., 2008). Erwachsene von B. Antarktis haben eine noch höhere antioxidative Kapazität, wahrscheinlich aufgrund ihrer nahezu konstanten Sonneneinstrahlung, wenn sie auf der Suche nach Partnern über die Oberfläche gehen. Die Resistenz gegenüber oxidativen Schäden ist für antarktische Arthropoden von entscheidender Bedeutung, da das antarktische Sonnenlicht eine sehr hohe UV-Strahlung enthält (Liao und Frederick, 2005), die sich durch Ozonschäden verstärkt (Weatherhead und Andersen, 2006). Darüber hinaus ist bekannt, dass wiederholte Frost-Tau-Exposition, die in der Antarktis häufig vorkommt, bei Insekten oxidative Schäden verursacht (Lalouette et al., 2011).

In letzter Zeit wurden Aquaporine als wichtige Regulatoren der Wasserbewegung unter Stressbedingungen wie Dehydration (Liu et al., 2011) und Gefrieren (Philip et al., 2008 Philip und Lee, 2010) in Betracht gezogen. Aquaporine sind porenbildende Proteine, die Wasser und manchmal andere gelöste Stoffe durch die Zellmembran transportieren (Borgnia et al., 1999). Da antarktische Arthropoden durch zahlreiche Formen von osmotischem Stress, einschließlich Gefrieren, Dehydration und Eintauchen in Meerwasser, herausgefordert werden, spielen Aquaporine wahrscheinlich eine wichtige Rolle bei der Vermittlung von Stresstoleranz. Goto et al. (Goto et al., 2011) klonierte und charakterisierte das erste Aquaporin aus einem antarktischen Arthropoden, ein Aquaporin-1-ähnliches Gen aus B. Antarktis. Wenn ausgedrückt in Xenopus Eizellen ist dieses Protein in der Lage, Wasser, aber nicht Harnstoff oder Glycerin, durch die Zellmembran zu übertragen. Dieses spezifische Aquaporin-Gen wird in mehreren verschiedenen Geweben exprimiert, was darauf hindeutet, dass es eine allgemeine Rolle bei der Wasserbewegung durch die Zellen spielen könnte. Die mRNA-Expression änderte sich jedoch als Reaktion auf Dehydration nicht, sodass unklar ist, welche Rolle dieses Gen bei der Vermittlung von Stresstoleranz spielt, wenn überhaupt. Eine zweite Studie von B. Antarktis Aquaporine fanden eine Immunreaktivität gegenüber vier verschiedenen Aquaporin-Antikörpern verschiedener Spezies, von denen einige stressinduzierbar waren (Yi et al., 2011). Die Sequenzidentität dieser Aquaporin-Gene wurde jedoch nicht festgestellt. In derselben Studie reduzierte die pharmakologische Blockierung von Aquaporinen mit Quecksilberchlorid die Ex-vivo Gefriertoleranz des Fettkörpers, des Mitteldarms und des Malpighischen Tubulusgewebes, was darauf hindeutet, dass Aquaporine für die Wasserumverteilung während des Gefrierens entscheidend sind. Darüber hinaus reduzierte Quecksilberchlorid den Wasserverlust des Mitteldarmgewebes, was darauf hindeutet, dass Aquaporine auch eine entscheidende Rolle bei der Vermittlung von Dehydrationsstress spielen.

Liste der Stress-hochregulierten Gene, die in antarktischen Arthropoden identifiziert wurden

Gene, die an der Mobilisierung von Energiereserven und der Synthese von Osmoprotektiva beteiligt sind, scheinen ebenfalls wesentliche Bestandteile der Stressreaktion zu sein B. Antarktis. Mit qPCR haben Teets et al. (Teets et al., 2013) profilierten die Expression von 11 Genen, die am Glykogenabbau, der Gluconeogenese, dem Polyol- und Trehalosestoffwechsel sowie der Prolinsynthese beteiligt sind. Hohe und niedrige Temperaturen induzieren eine schnelle Hochregulierung von Genen, die an der Glukosemobilisierung beteiligt sind, einschließlich Transkripten, die Glykogenphosphorylase und Phosphoenolpyruvatcarboxykinase (PEPCK), das geschwindigkeitsbestimmende Enzym der Gluconeogenese, kodieren. Diese Ergebnisse stimmen mit früheren Beobachtungen der kälteinduzierten Glukosemobilisierung bei Larven von B. Antarktis (Teets et al., 2011). Im Gegensatz dazu führen akute hohe und niedrige Temperaturen zu einer allgemeinen Herunterregulierung von Genen, die an der Trehalose- und Prolinsynthese beteiligt sind. Als Reaktion auf Dehydratation hängen die Genexpressionsmuster stark von der Art der erfahrenen Dehydration ab. Schnelle Dehydratation bei 75% RH hat eine ähnliche Transkriptionssignatur wie die als Reaktion auf Hitze und Kälte beobachtete, nämlich eine Hochregulierung von Genen, die Glukose-mobilisierende Enzyme (d. Im Gegensatz dazu induzieren eine langsame Dehydratation bei 98% RH und eine kryoprotektive Dehydratation auch die Expression von pepck, regulieren diese Behandlungen Gene, die an der Trehalose- und Prolinsynthese beteiligt sind, hoch, was mit der Akkumulation von Trehalose (Benoit et al., 2007b Elnitsky et al., 2008b) und Prolin (Teets et al., 2012b) während längerer Dehydration übereinstimmt.

Nicht zielgerichtete „Omics“-Ansätze haben auch unserem Verständnis von Stresstoleranz in B. Antarktis. Unter Verwendung einer unterdrückenden subtraktiven Hybridisierung haben Lopez-Martinez et al. (Lopez-Martinez et al., 2009) erhielten eine Reihe von auf Dehydration reagierenden Klonen, und Northern Blots bestätigten, dass 23 davon tatsächlich entweder während der Dehydration oder Rehydratation unterschiedlich exprimiert wurden. Hochregulierte Gene umfassen diejenigen, die für drei Hitzeschockproteine ​​(hsp26, hsp70 und hsp90) kodieren, und Gene, die zwei antioxidative Enzyme (Superoxiddismutase und Katalase) kodieren, was darauf hindeutet, dass Proteindenaturierung und oxidative Schädigung Symptome von Dehydrationsstress sind. Andere Gene, die während der Dehydratation hochreguliert werden, umfassen Gene, die für Zytoskelettproteine ​​und die Membranrestrukturierung kodieren, im Einklang mit früheren Beobachtungen, dass Dehydration eine Reorganisation des Zytoskeletts (Chen et al., 2005) und ein Membranlipid-Remodeling (Bayley et al., 2001) verursacht. Darüber hinaus werden mehrere Gene als Reaktion auf Dehydratation herunterreguliert, darunter zwei Elektronentransportketten-Gene, was auf eine Abschaltung des Stoffwechsels während der Dehydration hindeutet.

Bisher wurde eine einzige genomweite Expressionsstudie an antarktischen Arthropoden durchgeführt. Unter Verwendung von Illumina-basierter RNA-seq haben Teets et al. (Teets et al., 2012b) profilierten den Ausdruck von

13.500 Transkripte als Reaktion sowohl auf Austrocknung bei konstanter Temperatur als auch auf kryoprotektive Dehydratation. Beide Behandlungen führen zu weitreichenden Veränderungen in der Genexpression, da Austrocknung und kryoprotektive Dehydration zu

18 % bzw. aller Gene werden unterschiedlich exprimiert. Diese Ergebnisse bestätigten die entscheidende Rolle von Hitzeschockproteinen bei Umweltstress in B. Antarktis, da 15 verschiedene Hitzeschockproteintranskripte durch eine oder beide Dehydratisierungsbehandlungen hochreguliert wurden. Gleichzeitig verursachte die Austrocknung eine Hochregulierung von Genen, die am Recycling/Abbau von Proteinen und zellulären Makromolekülen beteiligt sind, einschließlich einer signifikanten Anreicherung von proteasomalen und Autophagie-Genen. Zusammengenommen legen diese Ergebnisse nahe, dass eine koordinierte Hochregulierung von Hitzeschockproteinen, Ubiquitin-vermitteltem Proteasom und Autophagie dazu dient, beschädigte Zellkomponenten während der Dehydration zu recyceln und zu entfernen, wodurch Energie gespart und das Überleben der Zellen gefördert wird ( 3 ). Wir gehen davon aus, dass Autophagie für das Überleben des antarktischen Winters besonders wichtig ist, da dieser Weg die Apoptose und andere Formen des Zelltods während längerer Perioden zellulären Stresses hemmt (Teets und Denlinger, 2013). Austrocknung und kryoprotektive Dehydratation führen auch zu einer allgemeinen Herunterregulation zentraler Stoffwechselgene, einschließlich der Gene, die an der Glykolyse, dem Tricarbonsäurezyklus und dem Fettstoffwechsel beteiligt sind, was darauf hindeutet, dass Dehydration eine molekulare Verschiebung zum Hypometabolismus verursacht, der Energie spart und den toxischen Aufbau von Stoffwechselendprodukten verhindert Produkte (Teets et al., 2012b). Tatsächlich korrelieren Veränderungen im Metabolom gut mit Veränderungen der Genexpression, was darauf hinweist, dass koordinierte Veränderungen der Genexpression und des Metabolismus Reaktionen auf extreme Umweltbedingungen steuern.


Schau das Video: Nicht-kompetitive Hemmung einer Enzymreaktion - Abitur Grundlagen Biologie (August 2022).