Information

RMSD während des Konformationsübergangs in Proteinen

RMSD während des Konformationsübergangs in Proteinen


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Als ich die Unterschiede zwischen durch Röntgenkristallographie und NMR-Spektroskopie erhaltenen Proteinstrukturen untersuchte, fand ich die Veröffentlichung [1], in der die Strukturen mehrerer Proteine ​​verglichen wurden, die sowohl mit Röntgen- als auch mit NMR aufgelöst wurden. Die durchschnittliche quadratische Abweichung (RMSD) zwischen NMR- und Röntgenstrukturen beträgt 1,4 (max. 3,6 ), und die durchschnittliche RMSD zwischen verschiedenen NMR-Strukturen für dasselbe Protein beträgt 0,4 (max. 1,3 ). Ich habe einige Proteine ​​überprüft, die in diesem Papier untersucht wurden, und sie sind meistens innerhalb von 100-200 Resten lang.

Es gibt jedoch viele Veröffentlichungen (z. B. [2], [3], die sich mit ähnlich großen Proteinen befassen), die ihre Aussagen über Konformationsübergänge auf Strukturen mit RMSD-Unterschied 1-2Å stützen.

Ich frage mich, was als zuverlässiger RMSD zwischen zwei Strukturen angesehen wird, um solide Schlussfolgerungen über Konformationsübergänge (z.

Natürlich ist der beste Weg (zumindest meiner Meinung nach), den tatsächlichen Konformationsübergang von thermischen Fluktuationen zu unterscheiden, seine Lebensdauer zu messen, aber dies ist oft keine Option.


  1. Andrec M, Snyder DA, Zhou Z, Young J, Montelione GT, Levy RM. 2007. Ein großer Datensatzvergleich von Proteinstrukturen, die durch Kristallographie und NMR bestimmt wurden: Statistischer Test für Strukturunterschiede und den Einfluss der Kristallpackung. Proteine ​​69: 449-65.

  2. Grant BJ, Gorfe AA, McCammon JA. 2009. Ras-Konformationswechsel: Simulation nukleotidabhängiger Konformationsübergänge mit beschleunigter Moleküldynamik. PLoS Computational Biology 5(3): e1000325.

  3. Kumaraswami M, Newberry KJ, Brennan RG. 2010. Konformationelle Plastizität der Coiled-Coil-Domäne von BmrR ist für die Bindung des bmr-Operators erforderlich: die Struktur von nicht-ligandiertem BmrR. Zeitschrift für Molekularbiologie 398: 264-75.


Der beste Weg, um den "tatsächlichen Konformationsübergang von thermischen Fluktuationen" in einem Protein zu unterscheiden, ist (bestimmen und) vergleichen atomar aufgelöste Strukturen des ligandenfreien und ligandengebundenen Proteins.

http://www.rcsb.org/pdb/home/home.do


Berechnung der quadratischen Mittelwertabweichung atomarer Strukturen¶

Wir berechnen die RMSD von Domänen in der Adenylatkinase beim Übergang von einer offenen zu einer geschlossenen Struktur und betrachten die Berechnung gewichteter RMSDs.

Letzte Aktualisierung: 26. Juni 2020 mit MDAnalysis 1.0.0

Mindestversion von MDAnalysis: 1.0.0

Benötigte Pakete:

MDAnalysis implementiert die RMSD-Berechnung unter Verwendung des schnellen QCP-Algorithmus ([The05]). Bitte zitieren Sie ([The05]), wenn Sie das Modul MDAnalysis.analysis.align in veröffentlichten Arbeiten verwenden.


Zusammenfassung des Autors

Proteinbewegungen werden häufig quantifiziert, indem strukturelle Unterschiede zwischen Konformeren gemessen werden. Die Erweiterung dieser Unterschiede wird als Konformationsdiversität bezeichnet. Diese Bewegungen sind für das Verständnis der Proteinbiologie unerlässlich. Wir haben festgestellt, dass die Verteilung der Konformationsdiversität in einem großen Datensatz von Proteinen durch drei Sätze erklärt werden könnte, die strukturbasierte Merkmale teilen, die aus der Konformerenpopulation für jedes Protein hervorgehen. Der erste Satz, den wir starr nannten, umfasst Proteine, die fast keine Rückgratbewegungen zeigen, aber wichtige Veränderungen in den Tunneln aufweisen. In der Reihenfolge zunehmender Konformationsdiversität werden die anderen Sätze als teilweise ungeordnet und formbar bezeichnet und zeigen ungeordnete Regionen und wichtige Hohlräume, aber mit unterschiedlichem Verhalten zueinander. Gemeinsame Merkmale in jedem Satz könnten Konformationsmechanismen darstellen, die mit biologischen Funktionen zusammenhängen.

Zitat: Monzon AM, Zea DJ, Fornasari MS, Saldaño TE, Fernandez-Alberti S, Tosatto SCE, et al. (2017)Die Analyse der konformativen Diversität zeigt drei funktionelle Mechanismen in Proteinen. PLoS Comput Biol 13(2): e1005398. https://doi.org/10.1371/journal.pcbi.1005398

Editor: Christine A. Orengo, University College London, VEREINIGTES KÖNIGREICH

Empfangen: 10. September 2016 Akzeptiert: 2. Februar 2017 Veröffentlicht: 13. Februar 2017

Urheberrechte ©: © 2017 Monzon et al. Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License vertrieben wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium gestattet, sofern der ursprüngliche Autor und die Quelle angegeben werden.

Datenverfügbarkeit: Alle relevanten Daten befinden sich in der Veröffentlichung und in den Dateien mit den Hintergrundinformationen.

Finanzierung: Die Finanzierung dieser Forschung wurde von COST Action (BM1405) Non-Globular Proteins-net (SCET) und der Universidad Nacional de Quilmes (PUNQ 1004/11) (GP) bereitgestellt. Die Geldgeber spielten keine Rolle beim Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Erstellung des Manuskripts.

Konkurrierende Interessen: Die Autoren haben erklärt, dass keine konkurrierenden Interessen bestehen.


Zusammenfassung des Autors

Molekulare Maschinen wandeln bei der Erfüllung ihrer spezifischen Aufgaben chemische Energie in mechanische Arbeit um. Oft werden diese Proteine ​​durch ATP-Bindung und Hydrolyse angetrieben, wodurch ein Wechsel zwischen verschiedenen Konformationen ermöglicht wird. Das ATP-abhängige Chaperon GroEL ist eine molekulare Maschine, die seine fassartige Struktur öffnet und schließt, um einen Faltkäfig für ungefaltete Proteine ​​bereitzustellen. Das Bestreben, GroEL und andere molekulare Maschinen vollständig zu verstehen und zu kontrollieren, wird durch die Ergänzung experimenteller Arbeiten durch computergestützte Ansätze unterstützt. Hier bieten wir eine Beschreibung der molekularen Grundlage für die Konformationsänderungen in der GroEL-Untereinheit, indem wir umfangreiche Moleküldynamiksimulationen durchführen. Die Simulationen proben die Konformationspopulation für die verschiedenen nukleotidfreien und gebundenen Zustände in der isolierten Untereinheit. Die Ergebnisse zeigen, dass die Konformationen der isolierten Untereinheit denen der in den GroEL-Komplex integrierten Untereinheit ähneln. Darüber hinaus ermöglichen die Molekulardynamiksimulationen die Verfolgung detaillierter Veränderungen einzelner interatomarer Wechselwirkungen, die durch die ATP-Bindung hervorgerufen werden.

Zitat: Skjaerven L, Grant B, Muga A, Teigen K, McCammon JA, Reuter N, et al. (2011)Konformationelle Probenahme und Nukleotid-abhängige Übergänge der GroEL-Untereinheit, die durch unverzerrte Molekulardynamiksimulationen untersucht wurden. PLoS Comput Biol 7(3): e1002004. https://doi.org/10.1371/journal.pcbi.1002004

Editor: Jianpeng Ma, Baylor College of Medicine, Vereinigte Staaten von Amerika

Empfangen: 6. Oktober 2010 Akzeptiert: 9. Dezember 2010 Veröffentlicht: 10. März 2011

Urheberrechte ©: © 2011 Skjaerven et al. Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License vertrieben wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium gestattet, sofern der ursprüngliche Autor und die Quelle angegeben werden.

Finanzierung: Der Norwegische Forschungsrat wird für CPU-Ressourcen gewürdigt, die durch das NOTUR-Supercomputing-Programm (http://www.notur.no/) und das Bergen Center for Computational Science für die Bereitstellung leistungsstarker Computereinrichtungen (http://www.bccs.uni.no .) gewährt werden /). Die Arbeit bei CSIC/UPV/EHU wurde von MICINN finanziert (Grant BUF2007-64452). Die Geldgeber spielten keine Rolle beim Studiendesign, der Datenerhebung und -analyse, der Entscheidung zur Veröffentlichung oder der Erstellung des Manuskripts.

Konkurrierende Interessen: Die Autoren haben erklärt, dass keine konkurrierenden Interessen bestehen.


Strukturanalyse

Die dreidimensionale Struktur von Proteinen wird durch viele Wechselwirkungen wie kovalente Bindungen, Wasserstoffbrücken und den hydrophoben Effekt bestimmt. Obwohl die lokale Struktur während der meisten Konformationsübergänge intakt bleibt, wurde festgestellt, dass Konformationsänderungen von Proteinen oft mit der Öffnung einer oder mehrerer Wasserstoffbrücken verbunden sind. Da der Nachweis dieser instabilen Wasserstoffbrückenbindungen für die Vorhersage der Proteinflexibilität unerlässlich ist, haben wir eine Methode entwickelt, um solche instabilen Wasserstoffbrückenbindungen anhand ihrer lokalen Umgebung zu identifizieren. 4 Die Methode beruht auf der Abschätzung der Wahrscheinlichkeit, dass die Wasserstoffbrücke von Wassermolekülen angegriffen wird. Unabhängig von der Geometrie der Eingangsstruktur öffnet sich eine Wasserstoffbrücke, die von Wassermolekülen angegriffen werden kann, eher als eine Wasserstoffbrücke, die durch hydrophobe Reste abgeschirmt wird. 9-12 Im Constraint-Definitionsprozess in tCONCOORD berechnen wir einen Solvatationsscore für jede Wasserstoffbrücke. Wenn dieser Wert einen vordefinierten Schwellenwert überschreitet, wird die Wasserstoffbrücke als instabil gekennzeichnet und nicht als geometrische Einschränkung berücksichtigt. Somit bleiben diese Wasserstoffbrücken im anschließend erzeugten Ensemble nicht unbedingt erhalten.

Die tCONCOORD-GUI ermöglicht es, die Ergebnisse des Constraint-Definitionsprozesses zu laden und die definierten Constraints zu visualisieren (siehe Abb. 2). Die Struktur wird in einem PyMOL-Fenster angezeigt, das von der tCONCOORD-GUI gesteuert wird. Eine Proteinkette wird dabei als vereinfachtes C . dargestelltα Modell zur Verdeutlichung. Verschiedene Arten von Interaktionen werden als farbige Pfeile dargestellt. Darüber hinaus wird jede Wechselwirkung in einer Tabelle aufgelistet und detaillierte Informationen, z. B. Geometrien oder Energien von Wasserstoffbrücken, werden in einem Textfeld angezeigt. Auch Wasserstoffbrückenbindungen, die wegen hoher Solvatationswahrscheinlichkeiten nicht berücksichtigt wurden, werden angezeigt. Der Schwellenwert kann interaktiv geändert werden, um dem Benutzer zu ermöglichen, alle Wasserstoffbrückenbindungen gründlich zu untersuchen und Simulationen mit verschiedenen Schwellenwerten einzurichten.

Je nach Fragestellung kann es sinnvoll sein, Wechselwirkungen auszuschalten, z. B. um den Einfluss einer bestimmten Wasserstoffbrücke auf die konformative Flexibilität zu untersuchen. Die tCONCOORD-GUI ermöglicht daher eine interaktive Beeinflussung des Constraint-Definitionsprozesses durch selektives Aktivieren und Deaktivieren von Interaktionen.


Methoden

Potentielle Funktionen.

Wir haben parallele Berechnungen basierend auf drei verschiedenen grobkörnigen Potentialfunktionen durchgeführt.

Als Kontrolle dient eine einfache harmonische Potentialfunktion, die alle Wechselwirkungen zwischen Resten innerhalb eines Grenzradius (13 Å) als Federn modelliert, um eine Untermenge der langsamen Normalmoden (29) zu berechnen. Sie ist gegeben durch Eine einheitliche Federkonstante k der Wert 1 kcal/molÅ 2 wird für alle Reste angenommen, die näher als der Cutoff-Abstand sind. Rij stellt den Verschiebungsvektor dar, und Rij 0 steht für die Gleichgewichtsabstände zwischen den Positionen von Cα-Atomen ich und J. n ist die Anzahl der Reste.

Ein alternativer Ansatz wird verfolgt, um den benachbarten Cα-Atomen zusätzliche Beschränkungen einzuführen, um Pseudobindungen zwischen jedem Rest zu modellieren. Das modifizierte Potenzial wird in diesem bindungsbeschränkten Modell zu kBindung die Federkonstante der Wechselwirkung zwischen benachbarten Cα-Atomen ist und knicht gebunden ist die Federkonstante der Wechselwirkung zwischen nicht gebundenen benachbarten Cα-Atomen. Für wird ein Wert von 70 kcal/molÅ 2 angenommen kBindung basierend auf der statistischen Analyse und Boltzmann-Inversion der kristallographischen Daten.

Im vollständig ausgearbeiteten VAMM-Kraftfeld wird jeder der Begriffe in einem Begleitpapier (19) definiert. In Kürze, Vgebunden ist der gleiche Bindungsbeschränkungsterm wie für VBindungsbeschränkt in Gl. 2, einschließlich separater Definitionen für trans- und cis-Peptidbindungen und für Disulfidbrücken VWinkel ist für Beschränkungen virtueller Bindungswinkel τ, die vom Typ der Sekundärstruktur abhängen VV-förmig ist für Beschränkungen auf virtuellen Diederwinkeln θ, die auch von der Sekundärstruktur abhängen Vnicht gebunden ist für Beschränkungen nichtgebundener Wechselwirkungen zwischen Atompaaren, die mehr als fünf Reste voneinander entfernt sind, die spezifisch für Aminosäureidentitäten sind und Vlokal ist für Beschränkungen, die lokale Geometrien beibehalten.

Iterative Normalmodus-gesteuerte Übergänge.

Wir haben den Übergangsweg zwischen zwei alternativen Konformationen berechnet, EIN (z. B. Open-State-ADK) und B (z. B. ADK mit geschlossenem Zustand), indem jede Struktur in Iterationen von Bewegungen, die auf jeden Schritt gerichtet sind, entlang des normalen Modus des größten Eingriffs mit ihrer Zielstruktur aufeinander zu bewegt wird. Nur Proteinreste werden modelliert, gebundene Liganden sind implizit. Für jede Struktur, ausgehend von den Ausgangspunkten bei EIN0 und B0 durch Zwischenstufen EINich und Bich bei jedem Schritt ich, wird die hessische Matrix aus der speziellen Potentialfunktion konstruiert, die in dieser Analyse verwendet wird (Gl. 1, 2, oder 3) und diagonalisiert, um normale Moden (30, 31) zu berechnen.

Im Allgemeinen werden 20 langsame Moden als ausreichend angesehen, um die langsamen Fluktuationen von Makromolekülen zu überbrücken, die die funktionellen Bewegungen abtasten (17). Daher haben wir die 20 Normalmodi mit der niedrigsten Frequenz für jede der Konformationen gescreent EINich und Bich um den Normalmodus von jedem Schwingungszustand mit dem größten Marques-Sanejou- und Überlappungsfaktor (32) mit dem alternativen Zielzustand zu finden. Dieser Faktor, von Ma und Karplus (33) auch Beteiligungskoeffizient genannt, misst, wie viel eine gegebene Normalmode zur molekularen Verschiebung zwischen zwei Konformeren beiträgt. Der Beteiligungskoeffizient, ichich k, ist die Projektion des Normalmodusvektors auf die lineare Verschiebung: wobei bei Schritt ich, Lkj ist die Komponente aus dem Eigenvektor k auf Atom wirkend J, undRJ ist der Verschiebungsvektor zwischen den aus alternativen Ausgangsstrukturen erzeugten Zwischenzuständen. Sowohl für den Modus von EINich mit höchstem Beteiligungskoeffizienten in Richtung Bich und für den Modus von Bich mit höchstem Beteiligungskoeffizienten in Richtung EINich, muss jede Richtung der Mode getestet werden, was wir tun, indem wir die paarweisen rmsd-Werte zwischen vier möglichen Konformeren berechnen, die aus Zuständen erzeugt werden EINich und Bich nach dem Anwenden von Verschiebungen, die von den jeweiligen Modi in jeder der alternativen Richtungen diktiert werden.

Die Verschiebungen für jeden Zug für Reste J findet man wo C ist eine als 0,005 gewählte Konstante, λk ist der Eigenwert der Mode k, Ljk ist der Eigenvektor für Modus k am Atom wirkend J, und ± beziehen sich auf die alternativen Richtungen für diesen Modus. Tests zeigten, dass die Natur der Konformationsübergänge relativ unempfindlich gegenüber dem Wert von . ist C innerhalb eines bestimmten Intervalls (Tabelle S2), und 0,005 wurde so gewählt, dass die Berechnungen innerhalb einer machbaren CPU-Zeit und ohne unrealistische Verzerrungen durch große Schrittweiten durchgeführt werden.

Die beiden neuen Konformere aus Shift-Sets mit minimalen rmsd-Werten werden dann die Eingabestrukturen für den nächsten Iterationsschritt. Der Prozess wird fortgesetzt, bis Zwischenkonformere EINich und Bich innerhalb des Konvergenzkriteriums konvergieren, das normalerweise als Effektivwert von 1 eingestellt wird. Dieser Cutoff-Wert ist angemessen, da die Normalmoden, die aus zwei Strukturen berechnet werden, die näher als 1 rmsd sind, sich nicht signifikant unterscheiden (34) und zwei solcher Strukturen im Allgemeinen sehr ähnlich sind, außer bei flexiblen Schleifen. Ein milderes Kriterium könnte in Fällen festgelegt werden, in denen auch komplizierte Bewegungen wie bei flexiblen Schleifen oder lokalen Faltungsereignissen im Gegensatz zu dem bei ADK beobachteten Übergang beteiligt sind.

Kontrollalgorithmus.

Berechnungen von Konformationsübergängen mit dem einfachen harmonischen Potential (Gl. 1) oder das bindungsbeschränkte harmonische Potential (Gl. 2) verwenden Sie den in Abb. S3 gezeigten Algorithmus. Normale Moden und iterative Bewegungen werden wie oben beschrieben durchgeführt, wobei die 20 Moden mit der niedrigsten Frequenz abgetastet und in Richtung der normalen Moden mit größter Beteiligung in den Richtungen zu den jeweiligen Zielstrukturen bewegt werden.

VAMM-Algorithmus.

Berechnungen konformativer Übergangspfade mit der VAMM-Potentialfunktion (Gl. 3) verwenden Sie den in Abb. S4 gezeigten Algorithmus. Der VAMM-Algorithmus ist dem Steueralgorithmus ähnlich, jedoch werden zusätzliche Anforderungen gestellt. Im ersten Schritt werden die für VAMM benötigten Sekundärstrukturen aus den Kristallstrukturkoordinaten der Konformere zugeordnet EIN0 und B0 durch Verwenden des DSSP-Algorithmus (35). Diesem Schritt folgt eine verkürzte Newton-Minimierung des Cα-Systems im VAMM-Kraftfeld auf einen Gradienten von 0,1 kcal/molÅ (36). Aus jeder dieser minimierten Strukturen werden unter Verwendung von VAMM hessische Matrizen konstruiert und dann für Normalmodusauswertungen diagonalisiert. Das Verfahren wird wie oben beschrieben wiederholt, um aufeinanderfolgende Zwischenstufen zu erzeugen EINich und Bich. Im weiteren Verlauf der Berechnung werden Sekundärstrukturen der berechneten Zwischenzustände in Intervallen von 0,1 rmsd (rmsdAKTUALISIEREN) zwischen den berechneten Zwischenzuständen. Die rmsdAKTUALISIEREN Werte zwischen 0,1 und 0,5 Å lieferten zuverlässige und konsistente Ergebnisse bei der Berechnung des ADK-Übergangs. Außerdem werden Energieminimierungen der Zwischenzustände durchgeführt, wenn der Energiegradient über 1 kcal/mol&supmin; ansteigt. Dieser Ansatz hält das System nahe an lokalen Energieminima und hilft auch, künstlich hohe Belastungen zu entspannen. Das Konvergenzkriterium ist wieder 1 Å rmsd.

Verteilungen von virtuell gebundenen Konformationsparametern.

Wahrscheinlichkeitskonturdiagramme für relevante Konformationsparameter wurden aus der gleichen Top500-Datenbank (21) ausgewertet, die verwendet wurde, um Ramachandran-Diagramme durch die MolProbity-Software (37) zu erstellen. Details sind in SI-Text.

Dehnungsenergie von Zwischenzuständen.

Stämme, die sich während Konformationsübergängen ansammeln, werden mit einem Doppel-Well-Potential ähnlich dem für das Modell des plastischen Netzwerks berechnet (18). Details sind in SI-Text.


RMSD während des Konformationsübergangs in Proteinen - Biologie

Alle von MDPI veröffentlichten Artikel werden sofort weltweit unter einer Open-Access-Lizenz verfügbar gemacht. Für die Wiederverwendung des gesamten oder eines Teils des von MDPI veröffentlichten Artikels, einschließlich Abbildungen und Tabellen, ist keine besondere Genehmigung erforderlich. Bei Artikeln, die unter einer Open-Access-Creative Common CC BY-Lizenz veröffentlicht wurden, darf jeder Teil des Artikels ohne Genehmigung wiederverwendet werden, sofern der Originalartikel eindeutig zitiert wird.

Feature Papers stellen die fortschrittlichste Forschung mit erheblichem Potenzial für eine große Wirkung auf diesem Gebiet dar. Feature Papers werden auf individuelle Einladung oder Empfehlung der wissenschaftlichen Herausgeber eingereicht und vor der Veröffentlichung einem Peer Review unterzogen.

Das Feature Paper kann entweder ein origineller Forschungsartikel, eine umfangreiche neue Forschungsstudie sein, die oft mehrere Techniken oder Ansätze umfasst, oder ein umfassendes Übersichtspapier mit prägnanten und präzisen Updates zu den neuesten Fortschritten auf diesem Gebiet, das die aufregendsten Fortschritte in der Wissenschaft systematisch überprüft Literatur. Diese Art von Papier gibt einen Ausblick auf zukünftige Forschungsrichtungen oder mögliche Anwendungen.

Editor’s Choice-Artikel basieren auf Empfehlungen der wissenschaftlichen Herausgeber von MDPI-Zeitschriften aus der ganzen Welt. Die Herausgeber wählen eine kleine Anzahl von kürzlich in der Zeitschrift veröffentlichten Artikeln aus, die ihrer Meinung nach für Autoren besonders interessant oder in diesem Bereich wichtig sind. Ziel ist es, eine Momentaufnahme einiger der spannendsten Arbeiten zu geben, die in den verschiedenen Forschungsbereichen der Zeitschrift veröffentlicht wurden.


ZUGÄNGLICHKEIT DER DATEN

Als ergänzendes Material (Daten S1) stehen die Informationen (AIRs), die das Andocken vorantreiben, zusammen mit den i-RMSD-, l-RMSD- und fnat-Zahlen für die Protein-Protein-, Protein-DNA-Systeme im Post-Sampling zur Verfügung. Alle für die verschiedenen Komplexe generierten Modelle mit ihren Statistiken stehen im SBGrid Data Repository 36 (https://data.sbgrid.org/labs/32/, https://doi.org/10.15785/SBGRID/707 .) zum Download bereit ).

Bitte beachten Sie: Der Herausgeber ist nicht verantwortlich für den Inhalt oder die Funktionalität der von den Autoren bereitgestellten unterstützenden Informationen. Alle Anfragen (außer fehlenden Inhalten) sollten an den entsprechenden Autor des Artikels gerichtet werden.


Generierung von Konformationsübergangspfaden mit niedrigen Potential-Energie-Barrieren für Proteine

Die Kenntnis von Konformationsübergangspfaden in Proteinen kann für das Verständnis von Proteinmechanismen nützlich sein. Vor kurzem haben wir das As-Rigid-As-Possible (ARAP) Interpolationsverfahren eingeführt, um Interpolationspfade zwischen zwei Proteinkonformationen zu erzeugen. Es wurde gezeigt, dass die Methode die Starrheit der anfänglichen Konformation entlang des Pfads gut bewahrt. Da das Verfahren jedoch vollständig geometriebasiert ist, können die erzeugten Pfade inkonsistent sein, da die Atomwechselwirkungen ignoriert werden. Daher möchten wir in diesem Artikel eine neue Methode vorstellen, um Konformationsübergangspfade mit niedrigen Potential-Energie-Barrieren für Proteine ​​zu generieren. Das Verfahren besteht aus drei Verarbeitungsstufen. Zunächst wird die ARAP-Interpolation verwendet, um einen Anfangspfad zu erzeugen. Dann werden die Pfadkonformationen durch einen Kollisionsentferner verbessert. Schließlich wird Nudged Elastic Band, eine Methode zur Pfadoptimierung, verwendet, um einen Pfad mit niedriger Energie zu erzeugen. In den durch das Verfahren erhaltenen Pfaden werden größere Energieverringerungen gefunden als in denen, die allein durch das ARAP-Interpolationsverfahren erhalten werden. Die Ergebnisse zeigen auch, dass die ARAP-Interpolation ein guter Kandidat zum Erzeugen eines anfänglichen Pfads ist, da sie zu Pfaden mit niedrigerer potentieller Energie führt als zwei andere übliche Verfahren für die Pfadinterpolation.

Dies ist eine Vorschau von Abonnementinhalten, auf die Sie über Ihre Institution zugreifen können.


Methoden

Datensatzerstellung

Die Informationen über die Lösungsmittelkonzentration und die experimentellen Verfahren, die bei der Proteinkristallisation angewendet werden, sind nicht immer aus den PDB-Dateien verfügbar (d. h. unvollständige oder fehlende Informationen). Um dieses Problem zu lösen, haben wir eine Konsensliste von organischen Lösungsmitteln und nichtwässrigen Kristallisationsmedien erstellt, die üblicherweise im Kristallisationsprozess verwendet werden, um dies zu tun, wir haben auf kristallographische Handbücher und Forschungsartikel verwiesen. Dann haben wir diese Liste verwendet, um Kristallstrukturen (ohne Mutationen und Auflösung < 4 Å) aus der Datenbank der Conformational Diversity in the Native State of Proteins (CoDNaS) zu suchen (eine Datenbank zur Konformationsdiversität, die auf einer Sammlung redundanter Strukturen für dieselben basiert Protein, verknüpft mit physikalisch-chemischen und biologischen Informationen) [26]. Das Vorhandensein dieser organischen Moleküle im Kristall, angegeben im HETATOM-Feld der PDB-Dateien, wurde verwendet, um die wässrigen von den nichtwässrigen Umgebungsstrukturen zu unterscheiden und den „großen“ Datensatz zu erstellen. Der große Datensatz enthält dann 1737 Proteine ​​mit 3474 Konformeren. Wir betrachteten auch einen anderen Datensatz, der aus der Web-Scrapping-Methode und der Handkuration für die Sammlung von Strukturen im Zusammenhang mit Einweich- und Cokristallisationsmethoden in organischen Lösungsmitteln resultierte und 33 Proteine ​​und 2755 Strukturen enthielt. In diesem Fall wurden die Strukturen mit der Web-Scraping-Methode gesammelt, bei der bibliografische Datenbanken durchsucht wurden, um Forschungsartikel zu Einweich- und Co-Kristallisationsmethoden in organischen Lösungsmitteln und/oder nichtwässrigen Medien zu sammeln. Mit der Text-Mining-Methode wurden alle gefundenen Artikel analysiert und einer PDB-Struktur zugeordnet. Die erhaltenen Strukturen wurden mit ihren jeweiligen CoDNaS-Einträgen verknüpft, um die Konformere für jedes Protein zu erhalten. Dieser letzte Datensatz wurde als „Kontroll“-Datensatz betrachtet und alle seine Tendenzen wurden denen in „großen“ gegenübergestellt. Konformerepaare wurden auf das Vorhandensein gebundener Liganden untersucht, um gebundene und ungebundene-ungebundene Konformere zu erhalten, um Verzerrungen bei der Analyse der Konformationsdiversität zu vermeiden. Das Vorhandensein von gebundenen Liganden wurde mithilfe der BioLiP-Datenbank bewertet [42].

Beide Datensätze wurden so präsentiert und analysiert, dass sie drei Untergruppen von Konformerenpaaren aufweisen: diejenigen, in denen beide Konformere eines der üblichen organischen Lösungsmittel und/oder nichtwässrige Medien enthielten, die in unserer Liste für Proteinstrukturabschätzungen verwendet werden (siehe Zusätzliche Datei 1: Tabelle S1 ). . In jedem Satz haben wir nur die höchste C-alpha Root Mean Square Deviation (RMSD) zwischen den entsprechenden Konformeren für ein gegebenes Protein berücksichtigt. Daher erhielten wir drei Untergruppen für den großen Datensatz (AA, AO und OO mit 9680, 1737 bzw. 2062 Konformerenpaaren) und drei Untergruppen für den Kontrolldatensatz (AA, AO und OO mit 33, 31, 25 Konformerenpaaren , bzw).

Strukturelle Charakterisierung

Um die strukturelle Unähnlichkeit zwischen Konformeren abzuschätzen, verwendeten wir den C-alpha RMSD, der mit MAMMOTH berechnet wurde [43]. Die zugängliche Oberfläche (ASA) ist die Oberfläche eines Biomoleküls, die einem Lösungsmittel zugänglich ist. ASA-Berechnungen für jedes Konformer wurden unter Verwendung von NACCESS erhalten (S. Hubbard und J. Thornton. 1993. NACCESS, Computer Program. Department of Biochemistry Molecular Biology, University College London). Die globale ASA entspricht der Summe der absoluten ASA-Werte jedes Rests, und die relative ASA wird für jede Aminosäure im Protein berechnet, indem die verschiedenen für Reste zugänglichen Oberflächen summiert als ein Prozentsatz der in einem ALA-X-ALA-Tripeptid beobachteten exprimiert werden.

Um eine Messung der Aminosäurebewegungen zu erhalten, haben wir die Menge der vergrabenen Aminosäuren (ASAs unter 25 % wurden als vergraben und ASAs über 25 % wurden als exponiert betrachtet) für die drei Populationen berechnet. Alle Daten wurden mit unseren eigenen in Python codierten Skripten verarbeitet.

Um die Übergänge zwischen den verschiedenen Sekundärstrukturen zu untersuchen, haben wir die Sekundärstruktur für jedes Konformer mithilfe von DSSP definiert [44]. Die C-alpha- und Restatome RMSD pro Position wurden unter Verwendung von ProFit (Martin, A.C.R. und Porter, C.T. http://www.bioinf.org.uk/software/profit/) berechnet. Es wurde angenommen, dass die Störung durch fehlende Elektronendichtekoordinaten in einer durch Röntgenbeugung bestimmten Struktur repräsentiert wird [45]. Um intrinsisch ungeordnete Regionen (IDRs) zu definieren, betrachteten wir nur diejenigen Segmente mit fünf oder mehr aufeinanderfolgenden fehlenden Resten, die sich nicht in den Amino- oder Carboxyl-terminalen Enden der Proteinsequenz befanden (die ersten und letzten 20 Reste der Kette wurden ausgeschlossen). Fold-Klasse und Superfamilie wurden unter Verwendung der CATH-Datenbank untersucht [46]. Da die Kontrolle und der große Datensatz den gleichen Trend in Bezug auf die Backbone-RMSD zeigten, wurden diese Strukturanalysen nur im großen Datensatz durchgeführt.

Alle erhaltenen Daten wurden mit selbst erstellten Skripten, die in Python codiert sind, abgerufen und verarbeitet.

Trägheitsradien und H-Brücken

Gyrationsradien für alle PDB-Strukturen wurden mit den MMTSB-Tools (http://blue11.bch.msu.edu/mmtsb/Main_Page) geschätzt. Für die Berechnung der Zahl der Wasserstoffbrücken haben wir HBPLUS verwendet [47]. Vergleiche zwischen Konformeren wurden mit unseren eigenen Python-Skripten angestellt.

Berechnung von Tunneln und Hohlräumen

Die Anzahl der Hohlräume und Tunnel sowie deren Eigenschaften wurden für alle Konformere mit Fpocket [48] und MOLE [49] abgeschätzt. Alle erhaltenen Daten wurden mit unseren eigenen in Python codierten Skripten abgerufen und verarbeitet.

Statistische Tests

Es wurde angenommen, dass die Datensatzverteilungen kontinuierlich und nicht parametrisch sind, was durch den Normaltest von D’Agostino und Pearson bestätigt wurde. Vergleiche innerhalb der Gruppen wurden gegebenenfalls durch den Kolmogorov-Smirnov-Test angestellt. Für Mehrgruppenvergleiche wurde eine Einweg-ANOVA verwendet. EIN P-Wert < 0,05 wurde genommen, um die statistische Signifikanz anzuzeigen.


Schau das Video: Simulation Interactions Diagram - PL-RMSD Part 28 (Kann 2022).