Information

Erstellen einer PDB-Datei aus einer Aminosäuresequenz nicht gefalteter Struktur

Erstellen einer PDB-Datei aus einer Aminosäuresequenz nicht gefalteter Struktur


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ich bin daran interessiert, mit Faltungssimulationen und Algorithmen für beliebige Sequenzen zu experimentieren. Ich frage mich, ob es eine einfache Möglichkeit gibt, eine Aminosäuresequenz zur weiteren Simulation in eine PDB-Datei umzuwandeln. Um es klar zu sagen, ich möchte nur die primäre Proteinstruktur.

Wenn möglich, möchte ich auch die Bindungen charakterisieren können, um das Molekül als starren Körper mit Drehgelenken behandeln zu können. Kennt jemand etwas, das dies kann?


Um es klar zu sagen, es hört sich so an, als ob Sie die "Spirale" oder die entfaltete Struktur eines Proteins basierend auf der Sequenz möchten?

Es gibt viele Programme zur Homologiemodellierung, bei der eine Sequenz unbekannter Struktur auf eine mit einer bekannten Struktur modelliert wird. Andererseits gibt es viele Bibliotheken, um bestehende Strukturen zu analysieren. Was du willst, liegt irgendwie zwischen diesen beiden.

Ich werde hier einige Links hinzufügen, wenn ich sie finde:

  • Es gibt eine Lua-Bibliothek, die nützlich sein könnte: https://github.com/rob-miller/rFold
  • Modeller hat dafür Funktionen: https://salilab.org/modeller speziell diese Seite
  • Bibliothek für Strukturbioinformatik: http://sbl.inria.fr/doc/index.html

  • Die Rosetta-Bibliothek (wie in fold.it verwendet): https://www.rosettacommons.org/

Ich bin sicher, es gibt noch mehr, aber es hängt wirklich davon ab, welche Programmiersprache Sie verwenden möchten oder ob Sie selbst Dinge implementieren, anstatt eine eigenständige Software zu verwenden.


Deep2Full: Bewertungsstrategien zur Auswahl der minimalen Mutationsexperimente für optimale rechnerische Vorhersagen der Ergebnisse von Deep Mutational Scans

Die Durchführung eines vollständigen tiefen Mutationsscans mit allen einzelnen Punktmutationen ist möglicherweise nicht praktikabel und möglicherweise nicht einmal erforderlich, insbesondere wenn prädiktive Computermodelle entwickelt werden können. Computermodelle sind jedoch gegenüber zellulären Antworten unter den unzähligen Testbedingungen naiv. In einem realistischen Paradigma von Assay-kontextsensitiven prädiktiven Hybridmodellen, die minimale experimentelle Daten aus tiefen Mutationsscans mit Struktur-, Sequenzinformationen und Computermodellen kombinieren, definieren und evaluieren wir verschiedene Strategien zur Auswahl dieses minimalen Sets. Wir evaluierten die triviale Strategie einer systematischen Reduzierung der Anzahl von Mutationsstudien von 85 % auf 15 %, zusammen mit mehreren anderen über die Wahl der Mutationsarten wie zufällig oder ortsgerichtet mit der gleichen Datenvollständigkeit von 15 %. Interessanterweise waren die Vorhersagefähigkeiten durch das Training an einem zufälligen Satz von Mutationen und die systematische Substitution aller Aminosäuren durch Alanin, Asparagin und Histidin (ANH) vergleichbar. Eine andere von uns untersuchte Strategie, die Trainingsdaten durch Messungen derselben Mutanten unter mehreren Assaybedingungen zu ergänzen, verbesserte die Vorhersagequalität nicht. Für die sechs von uns analysierten Proteine ​​ist der binweise Vorhersagefehler optimal, wenn 50-100 Mutationen pro Bin beim Trainieren des Computermodells verwendet werden, was darauf hindeutet, dass eine gute Vorhersagequalität mit einer Bibliothek von 500-1000 Mutationen erreicht werden kann.

Zitat: Sruthi CK, Prakash M (2020) Deep2Full: Bewertungsstrategien zur Auswahl der minimalen Mutationsexperimente für optimale rechnerische Vorhersagen der Ergebnisse von Deep Mutational Scans. PLoS ONE 15(1): e0227621. https://doi.org/10.1371/journal.pone.0227621

Editor: Alexandre G. de Brevern, UMR-S1134, INSERM, Université Paris Diderot, INTS, FRANKREICH

Empfangen: 27. März 2019 Akzeptiert: 23. Dezember 2019 Veröffentlicht: 10. Januar 2020

Urheberrechte ©: © 2020 Sruthi, Prakash. Dies ist ein Open-Access-Artikel, der unter den Bedingungen der Creative Commons Attribution License vertrieben wird und die uneingeschränkte Verwendung, Verbreitung und Reproduktion in jedem Medium gestattet, sofern der ursprüngliche Autor und die Quelle angegeben werden.

Datenverfügbarkeit: Alle relevanten Daten sind in der Veröffentlichung und den Begleitinformationen enthalten.

Finanzierung: Die Autoren erhielten für diese Arbeit keine spezifische Förderung.

Konkurrierende Interessen: Die Autoren haben erklärt, dass keine konkurrierenden Interessen bestehen.


Kerngedanke: Proteine ​​haben in lebenden Organismen verschiedenste Funktionen.

Eine der zentralen Ideen in der Biologie ist, dass die Struktur die Funktion diktiert. Oben sehen Sie Insulin in seinen Sekundär-, Tertiär- und Quartärstrukturen. Polypeptide variieren stark in der Kombination und Anzahl der Aminosäuren, aus denen sie bestehen. Selbst wenn wir ein einzelnes Polypeptid betrachten, würden seine Eigenschaften und damit seine Funktion stark variieren, abhängig von seinem Strukturniveau. Insulin kann in all diesen Formen vorkommen, aber die aktive Form, die den Blutzuckerspiegel kontrolliert, ist eine Tertiärstruktur.

Verständnis, Anwendungen und Fähigkeiten

Aminosäuren werden durch Kondensation miteinander verbunden, um Polypeptide zu bilden.

Es gibt 20 verschiedene Aminosäuren in Polypeptiden, die an Ribosomen synthetisiert werden.

Die Schüler sollten wissen, dass die meisten Organismen die gleichen 20 Aminosäuren im gleichen genetischen Code verwenden, obwohl es einige Ausnahmen gibt. Zur Veranschaulichung könnten spezifische Beispiele verwendet werden.

Aminosäuren können in jeder beliebigen Sequenz miteinander verknüpft werden, was eine große Auswahl an möglichen Polypeptiden ergibt.

Die Aminosäuresequenz von Polypeptiden wird durch Gene kodiert.

Ein Protein kann aus einem einzelnen Polypeptid oder mehr als einem miteinander verknüpften Polypeptid bestehen.

Die Aminosäuresequenz bestimmt die dreidimensionale Konformation eines Proteins.

Lebende Organismen synthetisieren viele verschiedene Proteine ​​mit unterschiedlichsten Funktionen.

Jedes Individuum hat ein einzigartiges Proteom.

, Rhodopsin, Kollagen und Spinnenseide als Beispiele für die Bandbreite der Proteinfunktionen.

Die detaillierte Struktur der sechs ausgewählten Proteine, um die Funktionen von Proteinen zu veranschaulichen, wird nicht benötigt.

Denaturierung von Proteinen durch Hitze oder durch Abweichung des pH-Wertes vom Optimum.

Eiweiß- oder Albuminlösungen können in Denaturierungsexperimenten verwendet werden.

Zeichnen von Moleküldiagrammen, um die Bildung einer Peptidbindung zu zeigen.Folie3

2.1.U5 Anabolismus ist die Synthese komplexer Moleküle aus einfacheren Molekülen einschließlich der Bildung von Makromolekülen aus Monomeren durch Kondensationsreaktionen

zwei Aminosäuren zu einem Dipeptid, das a . bildet

Beispiel für Anabolismus durch Kondensation

Die gebildeten Bindungen sind Arten von kovalenten Bindungen.

Durch die Verbindung von Monomeren entsteht ein Polymer

Dies ist auch der Schlüssel zum Verständnis:

Aminosäuren werden durch Kondensation miteinander verbunden, um Polypeptide zu bilden

2.4.S1 Zeichnen von Moleküldiagrammen, um die Bildung einer Peptidbindung zu zeigen

2.4.U2 Es gibt 20 verschiedene Aminosäuren in Polypeptiden, die an Ribosomen synthetisiert werden.

Ribosomen sind die Moleküle in Zellen, die die Bildung von Peptidbindungen erleichtern und somit Polypeptide synthetisiert werden

Es gibt 20 verschiedene Aminosäuren in Polypeptiden, die auf Ribosomen synthetisiert werden

Es gibt 22 Aminosäuren, aber nur 20 Aminosäuren werden vom universellen genetischen Code kodiert.Folie6

2.4.U2 Es gibt 20 verschiedene Aminosäuren in Polypeptiden, die an Ribosomen synthetisiert werden

ist ein Beispiel für eine Aminosäure, die nicht durch den genetischen Code erzeugt wird, sondern nach der Polypeptidbildung eine Modifikation von

die Stabilität der Kollagentripelhelix.

Kollagen ist ein Strukturprotein, das verwendet wird, um Sehnen, Bändern, Haut und Blutgefäßwänden Zugfestigkeit zu verleihen.ProlylhydroxylaseSlide7

Es gibt 20 verschiedene Aminosäuren in Polypeptiden, die auf Ribosomen synthetisiert werden

ICH MUSS DIE NAMEN ALLER 20 LERNEN .

, Sie brauchen nur ein Bewusstsein für die beschriebenen Konzepte.“Folie8

Aminosäuren können in beliebiger Reihenfolge miteinander verknüpft werden, was eine große Auswahl an möglichen Polypeptiden ergibt.Folie9

Aminosäuren können in jeder beliebigen Sequenz miteinander verknüpft werden, was eine große Auswahl an möglichen Polypeptiden ergibt.

Wenn ein Polypeptid nur enthält

7 Aminosäuren können 207 = 1.280.000.000 mögliche Polypeptide erzeugt werden.

Da Polypeptide bis zu 30.000 Aminosäuren (z. B. Titin) enthalten können, sind die verschiedenen möglichen Kombinationen von Polypeptiden praktisch unendlich.Folie10

2.4.U4 Die Aminosäuresequenz von Polypeptiden wird durch Gene kodiert.

/wiki/File:Peptide_syn.pngRibosomen sind der Ort der Polypeptidsynthese, aber Ribosomen brauchen eine Vorlage – die Boten-RNA, die wiederum von Transfer-RNA-Molekülen translatiert wird, die wiederum spezifische Aminosäuren tragen.

F – Woher kommt die Boten-RNA? Folie11

2.4.U4 Die Aminosäuresequenz von Polypeptiden wird durch Gene kodiert

2.4.U6 Die Aminosäuresequenz bestimmt die dreidimensionale Konformation eines Proteins

2.4.U6 Die Aminosäuresequenz bestimmt die dreidimensionale Konformation eines Proteins.

Es gibt vier Ebenen der Proteinstruktur. Welchem ​​Level ein Protein entspricht, wird durch seine Aminosäuresequenz bestimmt.

Die Reihenfolge / Sequenz der Aminosäuren, aus denen das Protein bestehtGebildet durch kovalente Peptidbindungen zwischen benachbarten Aminosäuren Kontrolliert alle nachfolgenden Strukturebenen

Die Aminosäureketten falten sich oder drehen sich um

Zusammengehalten durch Wasserstoffbrücken zwischen (nicht benachbarten) Amin- (N-H) und Carboxylgruppen (C-O)

Das Polypeptid faltet und wickelt sich zu einer komplexen 3D-Form.Verursacht durch Wechselwirkungen zwischen R-Gruppen

(H-Brücken, Disulfidbrücken, Ionenbindungen und hydrophile / hydrophobe Wechselwirkungen)Tertiärstruktur kann für die Funktion wichtig sein (z.B. Spezifität des aktiven Zentrums in Enzymen)Globuläre Proteine

Obwohl Sie nicht in der Lage sein müssen, die verschiedenen Strukturebenen zu skizzieren, hilft Ihnen die Kenntnis, den Unterschied zwischen globulären und faserigen Proteinen zu verstehen.


ERGEBNISSE

Monoklonale Antikörper binden LTC4, GMBH4, und LTE4 mit hoher Affinität

Vier monoklonale Hybridome (10G4, 2G9, 9B12 und 14H3) wurden durch Screening von mit LTE . immunisierten Mäusen erzeugt4 konjugiert an Proteinträger über homobifunktionelle Disuccinimidyl-Vernetzung (26). LTE4 wurde auf der Grundlage ausgewählt, dass es das stabile Endprodukt des extrazellulären CysLT-Metabolismus ist (27). Interessanterweise zeigte das von diesen Hybridomen sezernierte IgG deutlich unterschiedliche Bindungseigenschaften zu unkonjugiertem LTC4, GMBH4, und LTE4, basierend auf einem Wettbewerbs-ELISA mit LTE4-BSA-beschichtete Platten ( Abb. 1 ). Der Vergleich der vier Antikörper für die Zielbindung ergab, dass 10G4 LTC . bindet4 mit der höchsten Affinität, während 2G9 und 9B12 eine Präferenz für die Bindung von LTE . zu zeigen schienen4. Monoklonale Antikörper aus diesen drei Klonen zeigten eine ähnliche Bindung an natives LTD4 dieses Wettbewerbsformat verwenden. Der 14H3-Klon zeigte eine relativ schwache Bindung an alle drei Lipide, so dass er von der weiteren Charakterisierung ausgeschlossen wurde.

Die offensichtliche hochaffine CysLT-Bindung, die mit dem obigen Kompetitions-ELISA beobachtet wurde, wurde in Lösung durch KinExA bestätigt. In diesem Assay wurde die Menge an freiem Antikörper, die in einer Antikörper:Lipid-Komplexlösung im Gleichgewicht vorhanden war, nach dem Einfangen auf lipidbeschichteten Kügelchen gemessen. Bindungskonstanten der Gleichgewichtsdissoziation (KD) für die gereinigten monoklonalen Maus-Antikörper 10G4, 2G9 und 9B12 sowie Hu10G4, hergestellt durch Transplantieren der sechs CDR-Schleifen von 10G4 auf ein menschliches IgG-Gerüst und anschließende Mutation von sieben zusätzlichen Resten zurück zur Maussequenz, sind in beschrieben Tabelle 1 . Die 10G4- und Hu10G4-Antikörper zeigten eine Bindungsaffinität im pikomolaren Bereich für jeden der drei getesteten CysLTs. 10G4 mit höchster Affinität zu LTC . gebunden4, mit einem gemessenen KD Wert von weniger als 10 pikomolar. Wie zuvor durch ELISA beobachtet, zeigten die 2G9- und 9B12-Antikörper unterschiedliche Zielbindungsprofile. Das 2G9 band bevorzugt an LTE4 mit einem gemessenen KD Wert von etwa 50 pikomolar. Die KD Werte für 9B12 Bindung an LTC4, GMBH4, und LTE4 waren alle höher als die von 2G9, sodass 9B12 von weiteren Zielspezifitätsstudien ausgeschlossen wurde.

TABELLE 1.

Bindungsdissoziationskonstanten (KD) für CysLTs gemessen von KinExA

Anti-CysLT-Antikörper
Hu10G4 (pM)10G4 (pM)2G9 (pM)9B12 (pM)
LTC41,5 (UD𠄴.28)5,39 (3,93𠄷.18)1.520 (1.250𠄱.790)2.600 (1.800𠄳.480)
GMBH4101,36 (67,27�.97)37,95 (15,57�.71)575,27 (116.8𠄱.460)3.000 (1.150𠄵.020)
LTE4300,24 (222,98�.97)310,67 (241,79�.04)51,51 (3,68�.44) 628,9 (481,99�.77)

Fünfundneunzig-Prozent-Konfidenzintervalle sind in Klammern angegeben. UD, kann nicht bestimmt werden.

2G9 und 10G4 sind pan-spezifische Antikörper gegen CysLTs

Mit einem kompetitiven ELISA mit einem biotinylierten Tracermolekül untersuchten wir als nächstes die Fähigkeit einer breiten Palette verwandter Lipide und CysLT1R-Rezeptor-Antagonisten-Verbindungen, um die immobilisierten Antikörper zu binden (Ergänzungstabelle S1). Der IC50 Werte für jeden unmarkierten Wettbewerber normalisiert als Prozentsatz relativ zu unmarkiertem LTE4 und LTC4 für 2G9 bzw. 10G4 sind aufgeführt in Tabelle 2 . Zusätzlich zu LTD4 und LTE4, 2G9 und 10G4 gebunden an CysLTs, LTF4, und n-Acetyl-LTE4, mit hoher Affinität ( Abb. 2 ). Für 5-LO-Produkte, die keine Sulfidopeptid-Einheit enthielten, wurde jedoch keine nachweisbare Bindung beobachtet [LTB4, 5(S)-HETE] oder andere getestete Eicosanoide [12(S)-HETE, 20-HETE, Prostaglandin (PG)E2]. Schließlich zeigten weder 2G9 noch 10G4 eine Bindung an isoliertes l-Cystein, l-Cystein-l-Glycin-Dipeptid, l-Glutathion oder an eines der im Handel erhältlichen CysLT1R-Antagonisten, die wir getestet haben (Tabelle 2).

TABELLE 2.

Prozentuale Kreuzreaktivität verschiedener strukturell verwandter Eicosanoid-, Sulfidopeptid- oder CysLT-Rezeptor-Agonisten-Verbindungen

VerbindungHu10G410G42G9
LTC4100.0100.03.8
GMBH44.14.05.4
LTE40.60.3100.0
LTF476.637.3424.8
n-Acetyl-LTE427.611.4440.9
Eoxin C4π.1π.10.2
Eoxin E4π.1π.10.8
11-trans-LTC4π.10.90.3
LTE4 Methylesterπ.1π.16.7
LTC4 Methylester1.71.50.2
Montelukastπ.1π.1π.1
Pranlukastπ.1π.1π.1
BayCysLT2π.1π.1π.1
HAMI3379π.1π.1π.1
BAY-u9773π.1π.10.4
Zafirlukastπ.1π.1π.1
MK 571π.1π.1π.1
LTB4π.1π.1π.1
5(S)-HETEπ.1π.1π.1
12(S)-HETEπ.1π.1π.1
20-HETEπ.1π.1π.1
PGE2π.1π.1π.1
l-Cystein-HCl-H2Öπ.1π.1π.1
l -Cystein- l -Glycinπ.1π.1π.1
l -Glutathion, reduziertπ.1π.1π.1
l -Glutathion, oxidiertπ.1π.1π.1

Bindungsaffinitäten von Anti-CysLT-Antikörpern gemessen durch ELISA. A: Bindungskurven für die Interaktion des Maus-Antikörpers 10G4 mit LTC4 (rot), LTD4 (blau), LTE4 (grün), LTF4 (Schwarz), n-Acetyl-LTE4 (orange) und LTB4 (hellblau). B: Ähnliche Kurve für eine humanisierte Version des murinen 10G4-Antikörpers (Hu10G4). C: Bindungsdaten für Maus-Antikörper 2G9.

Die Ausweitung der Studie auf alle diese Verbindungen zeichnet ein klares Bild der Zielbindungsspezifität und zeigt, dass, obwohl 2G9 und 10G4 unter Verwendung der gleichen Immunisierungs- und Screening-Verfahren erzeugt wurden, diese monoklonalen Antikörper unterschiedliche relative Bindungspräferenzen für LTC . zeigten4 und seine Metaboliten. Antikörper 2G9 mit höchster Affinität an LTF . gebunden4 und n-Acetyl-LTE4, gefolgt von LTE4 > LTD4 = LTC4, während 10G4 diese Verbindungen in der folgenden Reihenfolge bindet: LTC4 > LTF4 > n-Acetyl-LTE4 > LTD4 > LTE4. Das Spezifitätsprofil legt nahe, dass sowohl 2G9 als auch 10G4 die Fettsäure-Kohlenwasserstoffkette und die Sulfidopeptidgruppe an den jeweiligen CysLTs erkennen und dass beide Substituenten der CysLTs in einer geeigneten Konformation für eine Bindung mit hoher Affinität vorliegen müssen. Es ist jedoch auch klar, dass sich der Modus der CysLT-Bindung zwischen 2G9 und 10G4 unterscheidet.

Zusätzlich zur Rangordnung der Bindungsaffinität für die wichtigsten CysLTs zeigten 2G9 und 10G4 auch Unterschiede für andere Sulfidopepid-haltige LTs. Antikörper 2G9 zeigte eine schwache, aber messbare Bindung an Eoxin E4 und C4, wohingegen 10G4 keine nachweisbare Bindung an diese Verbindungen zeigte. Ebenso erlitt 2G9 einen �-fachen Bindungsverlust, als das C11 cis Doppelbindung in LTC4 isomerisiert zu dem trans Konformation, bei der 10G4 aufgrund dieser Veränderung einen 𾄀-fachen Bindungsverlust aufwies. Die Methylveresterung der C1-Carboxylatgruppe führte zu einer signifikanten Abnahme der Fähigkeit von LTE4 oder LTC4 mit vorgebildeten CysLT-Komplexen entweder mit 2G9 oder 10G4 kreuzreagieren, was darauf hindeutet, dass diese Carboxylatgruppe signifikant zur Antigenbindung durch beide Antikörper beiträgt. Diese begrenzte Struktur-Aktivitäts-Beziehungs-Studie legt nahe, dass 10G4, obwohl beide Antikörper spezifisch auf CysLTs abzielen, eine Präferenz für LTC . zeigt4 und zeigt eine größere Selektivität für sein bevorzugtes Zielantigen als 2G9.

Hu10G4 Fab:LTC4 komplexe Kristallstruktur

Die Humanisierung von 10G4 führte zu einem monoklonalen Antikörper, Hu10G4, mit ähnlichen Affinitäts- und Spezifitätseigenschaften im Vergleich zu dem parentalen murinen 10G4-Antikörper (Tabelle 2, Fig. 1). Um den Mechanismus der selektiven CysLT-Bindung durch 10G4 aufzuklären, haben wir die dreidimensionale Struktur des Hu10G4-Fab-Fragments im Komplex mit LTC . kristallisiert und bestimmt4 ( Abb. 3A ). Die Röntgen-Kokristallstruktur wurde durch molekularen Austausch gelöst und auf eine Auflösung von 1,75 Å verfeinert, was zu einem Modell mit ausgezeichneter Geometrie und Stereochemie führte ( Tisch 3 ).

Röntgenkristallstruktur des Hu10G4 Fab:LTC4 Komplex. A: Eine Ribbon-Diagramm-Darstellung des Hu10G4-Fab-Fragments mit dem LTC4 antigengebundenes, von gegenüberliegenden Seiten des Komplexes betrachtet. Die schwere Kette von Hu10G4 ist blau gefärbt und die leichte Kette ist hellblau. Variable und konstante Domänen sind beschriftet. LTC4 wird als Ball-and-Stick-Modell mit Corey-Pauling-Koltun (cpk) Färbung dargestellt. B: Eine Nahaufnahme-Stereoansicht der Antigen-Bindungsstelle mit 2FÖ-FC Differenzelektronendichte (in blauem Netz) um den gebundenen LTC4 Antigen berechnet zu 1,1σ. C: Semitransparente Oberflächendarstellung des Komplexes mit den Atomen des gebundenen LTC4 Ligand als raumfüllende cpk-Kugeln dargestellt.

Der Hu10G4:LTC4 komplexes kristallographisches Modell zeigt, dass LTC4 bindet an die Antigen-Bindungsstelle hauptsächlich durch Vergraben seines Kohlenwasserstoffschwanzes. Die Kombination von trans Doppelbindungen an den Kohlenstoffatomen 7 und 9, unmittelbar gefolgt von cis Doppelbindungen an den Kohlenstoffatomen 11 und 14 dienen dazu, die Übernahme einer hakenartigen Struktur durch den Lipidkohlenwasserstoffschwanz zu unterstützen, die tief in die Antigenbindungsstelle zwischen den variablen Domänen der schweren und leichten Kette eingefügt wird.Der Glutamatrest des LTC4 die Glutathion-Einheit erstreckt sich von der Antigen-Bindungsstelle weg. Analyse der relativen Temperatur (B) Faktoren und eine schlechte Qualität der Elektronendichtekarte an diesem Rest legen nahe, dass das Glutamat α-Kohlenstoff eine Konformationsflexibilität relativ zum Rest des gebundenen Lipidantigenmoleküls aufweist ( 3B ). Dies ist nicht verwunderlich, da diese Region dem Ende des LTE entspricht4 Immunogen, das während der Immunisierung an seinem Hapten-Trägerprotein verankert wurde. Sowohl die Arachidonat- als auch die Glutathionylglycin-Carbonsäuregruppen nehmen an Wasserstoffbindungsnetzwerken teil, die die Seitenketten von Aminosäureresten aus CDR-Schleifen sowohl der schweren als auch der leichten Ketten des Antikörpers umfassen. In seiner gebundenen Konformation ist der LTC4 Lipid weist eine molekulare Oberfläche von 542,1 Å 2 auf (Sondenradius 1,00 Å). Bindung von LTC4 zu Hu10G4 schließt 275,5 Å 2 (50,83 %) seiner molekularen Oberfläche aus ( 3C ) (28). Das Ausmaß, in dem die Antikörperbindung LTC . vergräbt4 ist typisch, basierend auf einer veröffentlichten Analyse der okkludierten Oberflächen von diversen Antikörper-gebundenen Nicht-Peptid-Antigenen relativ zu ihren jeweiligen ungebundenen molekularen Oberflächenbereichen (29).

Strukturelle Determinanten von LTC4 Bindungsaffinität und Spezifität von Hu10G4

Eine detaillierte Analyse der nichtkovalenten Wechselwirkungen zwischen Atomen des Fab-Fragments des Hu10G4-Antikörpers und seines LTC4 Lipidantigen offenbart die chemischen Details seiner Bindungsaffinität und Selektivität. Insgesamt kommen Seitenketten von sechzehn Aminosäuren aus jeder der sechs CDR-Schleifen der schweren und leichten Kette in engen Kontakt mit dem gebundenen LTC4 Antigen [die schweren und leichten Ketten des Hu10G4-Antikörpers sind gemäß dem System von Kabat et al. (30) die Buchstaben “L” und “H” unmittelbar vor den Aminosäurenummern zeigen an, dass sie von den leichten bzw. schweren Ketten abgeleitet sind]. Neun davon (TyrH33, SerH34, IleH37, TrpH47, TyrH52, AlaH96, ProH98, ArgH99 und TrpH101) stammen von der schweren Kette und sieben (LeuL36, ArgL46, TyrL49, LeuL89, TyrL91, ArgL96 und PheL98) stammen von der leichten Kette. Zwei zusätzliche Aminosäuren der schweren Kette (AsnH35A und AsnH50) kontaktieren das Antigen indirekt über wasservermittelte Wasserstoffbrücken ( Abb. 4A ).

LTC4 Bindung durch den Hu10G4-Antikörper. A: Eine schematische Darstellung der Wechselwirkungen, die durch Aminosäureseitenketten und Wassermoleküle in der Hu10G4-Antigen-Bindungsstelle vermittelt werden. Der LTC4 Antigen wird als molekulare Struktur mit Nummerierung an den Kohlenstoffatomen dargestellt, die die in der Koordinatendatei zugewiesenen Atomnamen widerspiegelt. Aminosäuren sind unter Verwendung eines Einzelbuchstabencodes aufgelistet und farblich entsprechend der Abbildung 3 dargestellt. Pfeile bedeuten Wasserstoffbrückenbindungen, während hydrophobe Wechselwirkungen als Bögen symbolisiert werden. B: Nahaufnahme des Wasserstoffbrückenmusters um das Arachidonylcarboxylat von LTC4. C: Wasserstoffbrückenbindungen und enge Packungswechselwirkungen von Antikörperresten mit dem Glycinende des LTC4 Glutathion-Einheit. D: Die dichte Packung unpolarer Aminosäureseitenketten um den LTC4 Kohlenwasserstoffschwanz an der Antigenbindungsstelle.

Ein komplexes Wasserstoffbrückennetzwerk stabilisiert die Carboxylatgruppe des LTC4 Arachidonat-Einheit ( 4B ). Dies unterstützt unsere Beobachtungen, dass die Methylierung an dieser Carboxylatgruppe die Affinität von LTC . verringert4 Bindung an Hu10G4. ArgL96 und TyrH52 sind beide innerhalb des Wasserstoffbrückenabstands desselben Carboxylat-Sauerstoffatoms positioniert. Ein geordnetes Wassermolekül, das an die Seitenketten von AsnH35A und AsnH50 gebunden ist, ist ebenfalls so positioniert, dass es mit diesem Sauerstoffatom ein Wasserstoffatom teilt. Das zweite Arachidonylcarboxylat-Sauerstoffatom befindet sich im Wasserstoffbrückenabstand der SerH34-Seitenkette. Interessanterweise positioniert der Amidstickstoff von SerH34 ein zweites Wassermolekül, um Wasserstoffbrücken sowohl mit der Arachidonylcarboxylatgruppe als auch mit dem Sauerstoff der Amidgruppe aus der Glutamylisopeptidbindung des LTC . zu bilden4 l-Glutathion-Einheit. Somit verbindet dieses zweite Wassermolekül CDR-H3 sowohl mit der Arachidonat-Carboxylatgruppe als auch mit dem Glutamat von LTC4. Da die Entfernung dieses Glutamats LTC . umwandelt4 zu LTD4, ist es wahrscheinlich, dass dieses wasservermittelte Wasserstoffbrückennetzwerk signifikant zur Bindungspräferenz für LTC . beiträgt4 durch den Hu10G4-Antikörper gezeigt. Diese Vorstellung wird durch unsere Beobachtung gestützt, dass n-Acetyl-LTE4, das eine Acetylgruppe enthält, die die wasservermittelte Wasserstoffbrücke aufnehmen kann, gewinnt einen erheblichen Teil der Bindungsaffinität zurück, die bei der Umwandlung von LTC . verloren gegangen ist4 zu LTD4.

Abgesehen vom indirekten wasservermittelten Kontakt mit dem Amid-Carbonyl-Sauerstoff ist der Rest des LTC4 der Glutathionylglutamatrest kontaktiert Hu10G4 nicht. Die Glutathion-Cystein- und Glycin-Aminosäuren befinden sich in engem Kontakt mit TyrL49 bzw. TyrH33, und die ProH98-Seitenkette an der Spitze der CDR-H3-Schleife bildet einen “spine”, über den der LTC4 Antigen drapiert wie ein Mantel auf einem Gestell. Die Seitenkette von ArgL46 ist innerhalb einer Wasserstoffbrückenbindungsdistanz zum Amid-Carbonyl-Sauerstoff der Peptidbindung positioniert, die Cystein und Glycin verbindet, und die endständige Glycin-Carboxylatgruppe kontaktiert die Seitenkette von ArgH99 ( 4C ). Diese letztgenannte Wechselwirkung erklärt wahrscheinlich die weitere Abnahme der Bindungsaffinität, die nach Entfernung von Glycin bei der Umwandlung von LTD . beobachtet wird4 zu LTE4, sowie die leichte Abnahme der beobachteten Bindungsaffinität zu LTF4 (ein CysLT, bei dem nur der Glycinrest von LTC . entfernt wird4).

Die Mehrheit der LTC4 Die molekulare Oberfläche, die bei der Bindung an Hu10G4 vergraben wird, ist der Kohlenwasserstoffschwanz der Lipid-Arachidonat-Einheit. Der Schwanz nimmt eine hakenartige Konformation an, die eng in einen hydrophoben Hohlraum passt, der an der Antikörperbindungsstelle durch Seitenketten aus den Leichtkettenresten LeuL36, TyrL49, LeuL89, TyrL89 und PheL98 und den Schwerkettenresten IleH37, TrpH47, AlaH96 gebildet wird. und TrpH101 ( 4D ). Ein vergrabenes Wassermolekül, das durch Wasserstoffbrücken des Indolstickstoffs von TrpH101 und Carbonylsauerstoffatomen des Rückgrats von ProH98 und ArgH99 an Ort und Stelle gehalten wird, befindet sich ebenfalls in der hydrophoben Bindungstasche. Die Veranlagung des LTC4 Kohlenwasserstoffschwanz, um seine beobachtete Konformation anzunehmen, scheint eine entscheidende Rolle dabei zu spielen, Hu10G4 seine Antigenbindungsaffinität und -spezifität zu verleihen. Die beobachtete Unfähigkeit von Hu10G4, an mehrfach ungesättigte Lipide mit veränderten Doppelbindungsmustern wie PGE . zu binden2 und LTB4 (das Produkt der 5-LO-katalysierten Reaktion von Arachidonsäure) unterstützt diese Hypothese. Es erklärt auch, warum die Isomerisierung von cis zu trans der C11-Doppelbindung in LTC4 verringert die Bindungsaffinität stark. Schließlich ist TyrL91 zusätzlich zu seiner Rolle bei der Unterstützung der hydrophoben Antigen-Bindungstasche auch an einer wasservermittelten Wasserstoffbrücke mit der Hydroxylgruppe von der C5-Position am LTC . beteiligt4 Arachidonat.

Anti-CysLT-Antikörper hemmen die Vasopermeabilität bei akuter Entzündung

LTC4 Es hat sich gezeigt, dass es Evan’s Blue-Farbstoff-Extravasation in eine Vielzahl von Geweben induziert. Dies umfasst die Atemwege und den Uterogenitaltrakt sowie in die Peritonealhöhle nach intravenöser bzw. intraperitonealer Verabreichung (31, 32). Kurz nach intraperitonealer Injektion bei Mäusen wurde LTC4 induziert eine vaskuläre Permeabilität in einer dosisabhängigen Weise und trägt wahrscheinlich dazu bei, die Flüssigkeitsansammlungsphasen der akuten Entzündungsreaktion zu vermitteln (31). Unter Verwendung des Mausmodells haben wir die Wirksamkeit von 2G9 und 10G4 bewertet, um die Aktivität von LTC . zu hemmen4 um eine Plasmaexsudation in die Peritonealhöhle zu induzieren, indem die Farbstoffextravasation überwacht wird ( Abb. 5 ).

Gefäßpermeabilität bei LTC4-behandelte Mäuse. A: Die Absorption von Evan’s Blue-Farbstoff im Peritoneum von Mäusen wird nach intraperitonealer Behandlung mit LTC . aufgetragen4 vorinkubiert mit Kontrollantikörper (Spur 2) und äquimolaren oder überschüssigen Mengen von Antikörper 2G9 (Spur 3 bzw. 4). B: Subkutane (SC) Injektion der Kontrolle (Spur 2) oder des murinen 10G4-Antikörpers (Spur 3) prophylaktisch gefolgt von der Verabreichung von LTC4 führte zu einer signifikanten Verringerung der Farbstoffextravasation. Spur 4 zeigt die Ergebnisse der intraperitonealen Injektion von vorinkubiertem 10G4:LTC4 Komplexe vor der Analyse wie in dem in (A) gezeigten Experiment.

Zunächst LTC4 wurde mit einem äquimolaren oder molaren Überschuss des Antikörpers 2G9 vorgemischt und dann in das Peritoneum von Mäusen injiziert, denen zuvor 0,2% Evan’s Blue-Farbstoff intravenös verabreicht worden war. Die Farbstoffextravasation wurde 30 Minuten nach der Injektion gemessen. Eine statistisch signifikante Abnahme der Farbstoffextravasation wurde bei den Gruppen von Mäusen beobachtet, die 2G9 erhielten (P = 0,0011 für äquimolar und P < 0,0001 für überschüssiges 2G9) verglichen mit der Isotyp-angepassten Kontrollantikörpergruppe ( Fig. 5A). 10G4 schien auch beim Blockieren von LTC . wirksam zu sein4-induzierte Plasmaexsudation und Einschränkung der Farbstoffexsudation auf Werte ähnlich denen der naïve-Gruppe ( 5B ).

Nachdem gezeigt wurde, dass die Vorinkubation von 2G9 und 10G4 mit LTC4 neutralisiert die biologische Wirkung von LTC4untersuchten wir als nächstes, um zu bestimmen, ob 10G4 Aktivität zeigte, wenn es prophylaktisch verabreicht wurde. Zu diesem Zweck wurde zwei Gruppen von Mäusen 24 h vor LTC . 30 mg/ml 10G4 oder Kontrollantikörper subkutan verabreicht4 Behandlung und Farbstoffextravasation wurden wie oben überwacht. Ein wichtiges (P < 0,0001) eine Abnahme des gemessenen Peritonealfarbstoffs wurde bei den Mäusen beobachtet, die eine 10G4-Vorbehandlung erhielten, verglichen mit der Kontrollgruppe mit Antikörperbehandlung ( 5B ). Diese Daten legen nahe, dass unsere Anti-CysLT-Antikörper das Potenzial als Therapeutika haben, die die Wirkung von LTC . effektiv blockieren4 bei der Modulation der Gefäßpermeabilität während der akuten Entzündungsphase.

10G4 schützt vor DSS-induzierter akuter Kolitis bei Mäusen

Um die In-vivo-Wirksamkeit von Anti-CysLT-Antikörpern zur Behandlung akuter Entzündungen weiter zu bewerten, testeten wir als nächstes, ob die Behandlung von Mäusen mit 10G4 oder 2G9 einen Schutz vor einer akuten Entzündung bieten könnte, die durch die Verabreichung von DSS verursacht wird, die bei Mäusen Kolitis induziert (33, 34). C57BL/6-Mäuse, die sechs Tage lang mit einer 2%igen DSS-Wasserlösung gefüttert wurden, gefolgt von normalem Trinkwasser an den Tagen 7�, zeigten eine signifikante Abnahme des Körpergewichts, ein erhöhtes Dickdarmgewicht, eine Zunahme des Dickdarmgewichts gegenüber der Dickdarmlänge gegenüber dem Körpergewichtsverhältnis, und erhöhtes Dickdarmgewicht gegenüber dem Körpergewicht relativ zu Mäusen, denen DSS vorenthalten wurde. Die Vorbehandlung der Mäuse mit dem Antikörper 10G4 diente dazu, die Symptome einer akuten Kolitis im Vergleich zu DSS-behandelten Mäusen, die entweder keinen Antikörper oder einen Isotyp-Kontrollantikörper (LT1014) erhielten, der nicht auf CysLTs abzielte, signifikant zu verringern. 10G4 schützte die mit DSS behandelten Mäuse im gleichen Maße vor Gewichtsverlust wie die Verabreichung des Immunsuppressivums CsA ( Abb. 6A ). Die gleichen Korrelationen wurden beobachtet, wenn Mäuse analysiert und durch ihren Krankheitsaktivitätsindex bewertet wurden, der Körpergewicht, Stuhlkonsistenz und Schwere der rektalen Blutung berücksichtigt ( 6B ).

Der Antikörper 10G4 schützt C57BL/6-Mäuse in einem DSS-induzierten Modell einer akuten Entzündung. A: Das Körpergewicht von Mäusen, die mit PBS-Puffer (Vehicle), einem Nicht-CysLT-Isotyp-Kontrollantikörper (LT1014), CsA oder 10G4 behandelt wurden, wurde während und nach der Behandlung mit DSS und im Verhältnis zu DSS-unbehandelten (Kontroll-)Mäusen überwacht. B: Krankheitsaktivitätsindexwerte für die Mäuse. C: Dickdarmgewebeschnitte, gefärbt mit Hämatoxylin und Eosin, um die Immunzellinfiltration von unbehandelten (Kontroll-)Mäusen und mit DSS behandelten Mäusen nach Verabreichung von Vehikel, 10G4 oder unspezifischem Antikörper LT1014 zu beurteilen. D: Gewebeschädigungsbewertungen, die Proben von Dickdarmgewebe zugeordnet wurden, die aus unbehandelten (Kontrolle) und mit DSS gefütterten Mäusen entnommen wurden, die mit Vehikel, CsA, Antikörper LT1014, 10G4 oder 2G9 behandelt wurden.

Die histopathologische Analyse von extrahiertem Dickdarmgewebe zeigte eine verringerte Infiltration von Entzündungszellen in DSS-behandelten Mäusen, denen 10G4 verabreicht wurde, im Vergleich zu mit Vehikel- oder Isotyp-Kontrollantikörper behandelten Mäusen ( 6C ). Schließlich wurde eine verringerte Gewebeschädigung in Dickdarmgewebe gemessen, das aus den Kohorten von DSS-behandelten Mäusen extrahiert wurde, denen 10G4 oder CsA verabreicht wurde ( 6D ).


Behauptungen

1. Polypeptid umfassend die allgemeine Formel X1-X2-X3-X4-X5, wobei:

(a) X1 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, (ii) der Aminosäuresequenz mindestens 50 % entlang ihrer Länge identisch mit SEQ ID NO: 2 und (iii) die Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch mit SEQ ID NO: 3 (b) X2 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus : (i) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % mit den Resten SEQ ID NO: 1 identisch ist, wobei X2 zumindest an den Resten 16, 20 und 24 Änderungen gegenüber SEQ ID NO: 1 besitzt (ii) die Aminosäure Sequenz zu mindestens 50 % entlang ihrer Länge identisch mit den Resten SEQ ID NO: 2, wobei X2 mindestens an den Resten 18, 22 und 26 Änderungen gegenüber SEQ ID NO: 2 besitzt und (iii) die Aminosäuresequenz zu mindestens 50 % identisch ist entlang seiner Länge zu den Resten SEQ ID NO:3, wobei X2 zumindest an den Resten 18, 22 und 26 Änderungen gegenüber SEQ ID NO:3 besitzt und (c) X3, X4 und X5 unabhängig sind endgültig abwesend sind oder die Aminosäuresequenz umfassen, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, (ii) die Aminosäuresequenz mindestens 50 % entlang ihrer Länge identisch mit SEQ ID NO: 2 und (iii) die Aminosäuresequenz mindestens zu 50 % entlang ihrer Länge identisch mit den Resten SEQ ID NO: 3 ist, wobei das Polypeptid nicht die Aminosäuresequenz von SEQ ID NO: 5' umfasst -7.

2. Polypeptid nach Anspruch 1, wobei X1 die Aminosäuresequenz umfasst, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei X1 zumindest an einem oder mehreren der Reste 2 Veränderungen gegenüber SEQ ID NO: 1 besitzt. 3, 5, 6, 9, 12, 13, 15, 16, 17, 17, 20, 21 und 25.

3. Polypeptid nach Anspruch 1, wobei X1 umfasst

(A) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 2 ist, wobei X1 Änderungen gegenüber SEQ ID NO: 2 mindestens an einem oder mehreren der Reste 4, 5, 7, 8, 11, besitzt. 14, 15, 17, 18, 19, 20, 22, 23, 26 und 27 oder (B) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 3 ist, wobei X1 Änderungen gegenüber SEQ ID besitzt NO:3 mindestens an einem oder mehreren der Reste 4, 5, 7, 8, 11, 14, 15, 17, 18, 19, 20, 22, 23, 26 und 27.

4. Polypeptid nach Anspruch 1, wobei X3 vorhanden ist und wobei X3 die Aminosäuresequenz ausgewählt aus der Gruppe bestehend aus . aufweist

(i) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei X2 Änderungen gegenüber SEQ ID NO: 1 mindestens an den Resten 20, 24 und 25 besitzt (ii) die Aminosäuresequenz an mindestens 50 % entlang seiner Länge identisch mit SEQ ID NO: 2, wobei X2 zumindest an den Resten 22, 26 und 27 Änderungen gegenüber SEQ ID NO: 2 besitzt und (iii) die Aminosäuresequenz entlang seiner Länge mindestens 50 % identisch ist bis SEQ ID NO: 3, wobei X2 zumindest an den Resten 22, 26 und 27 Änderungen gegenüber SEQ ID NO: 3 besitzt.

5. Polypeptid nach Anspruch 4, wobei X4 vorhanden ist und wobei X4 die Aminosäuresequenz ausgewählt aus der Gruppe bestehend aus . aufweist

(i) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1, wobei X2 Änderungen von SEQ ID NO: 1 mindestens an Rest 25 besitzt (ii) die Aminosäuresequenz zu mindestens 50 % entlang der Länge identisch ist seine Länge zu SEQ ID NO: 2, wobei X2 mindestens an Rest 27 Änderungen gegenüber SEQ ID NO: 2 besitzt und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 3 ist, wobei X2 besitzt Änderungen von SEQ ID NO: 3 zumindest bei Rest 27.

6. Polypeptid nach Anspruch 5, wobei X5 vorhanden ist und wobei X5 die Aminosäuresequenz ausgewählt aus der Gruppe bestehend aus:

(i) die Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch mit SEQ ID NO: 1, wobei X2 Änderungen gegenüber SEQ ID NO: 1 mindestens an Rest 23 aufweist (ii) die Aminosäuresequenz zu mindestens 50 % entlang der Länge identisch ist seine Länge zu SEQ ID NO: 2, wobei X2 mindestens an Rest 25 Änderungen gegenüber SEQ ID NO: 2 besitzt und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 3 ist, wobei X2 besitzt Änderungen von SEQ ID NO: 3 zumindest bei Rest 25.

7. Polypeptid nach Anspruch 1, wobei

(a) X1 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei Rest 16 K oder eine konservative Substitution davon ist (ii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 2, wobei Rest 18 K oder eine konservative Substitution davon ist und (iii) die Aminosäuresequenz entlang ihrer Länge zu SEQ . zu mindestens 50 % identisch ist ID NO:3, wobei Rest 18 K oder eine konservative Substitution davon ist (b) X2 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit Resten . ist SEQ ID NO: 1, wobei Rest 16 A oder eine konservative Substitution davon ist, Rest 17 E oder eine konservative Substitution davon ist, Rest 20 A oder eine konservative Substitution davon ist und Rest 24 E oder eine konservative Substitution davon ist (ii) die Aminosäuresequenz mindestens 50% iden entlang seiner Länge zu den Resten SEQ ID NO: 2, wobei Rest 18 A oder eine konservative Substitution davon ist, Rest 19 E oder eine konservative Substitution davon ist, Rest 22 A oder eine konservative Substitution davon ist und Rest 26 E oder a . ist konservative Substitution davon und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3, wobei Rest 18 A oder eine konservative Substitution davon ist, Rest 19 E oder eine konservative Substitution davon ist, Rest 22' ist A oder eine konservative Substitution davon, und Rest 26 ist E oder eine konservative Substitution davon (c) X3 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer mindestens zu 50 % identisch ist Länge zu den Resten SEQ ID NO: 1, wobei Rest 16 D oder eine konservative Substitution davon ist, Rest 17 E oder eine konservative Substitution davon ist, Rest 20 L oder eine konservative Substitution davon ist, Rest 21 I oder ein Contra ist ervative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon und Rest 25 ist K oder eine konservative Substitution davon (ii) die Aminosäuresequenz ist entlang ihrer Länge mindestens zu 50 % identisch mit Reste SEQ ID NO:2, wobei Rest 18 D oder eine konservative Substitution davon ist, Rest 19 E oder eine konservative Substitution davon ist, Rest 22 L oder eine konservative Substitution davon ist,Rest 23 ist I oder eine konservative Substitution davon, Rest 25 ist L oder eine konservative Substitution davon, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist K oder eine konservative Substitution davon und (iii) die Aminosäuresequenz mindestens 50% entlang seiner Länge identisch mit den Resten SEQ ID NO: 3, wobei Rest 18 D oder eine konservative Substitution davon ist, Rest 19 E oder eine konservative Substitution davon ist, Rest 22 L oder eine konservative Substitution davon ist, Rest 23 I oder ist eine konservative Substitution davon, Rest 25 ist L oder eine konservative Substitution davon, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist K oder eine konservative Substitution davon (d) X4 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 ist, wobei Rest 16 K oder eine konservative Substitution davon ist, Rest 17 R oder ein cons . ist ervative Substitution davon, Rest 20 ist L oder eine konservative Substitution davon, Rest 21 ist V oder eine konservative Substitution davon, Rest 23 ist I oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon und Rest 25 ist A oder eine konservative Substitution davon (ii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2, wobei Rest 18 K oder eine konservative Substitution davon ist, Rest 19 R oder eine konservative Substitution davon ist, Rest 21 ist L oder eine konservative Substitution davon, Rest 23 ist V oder eine konservative Substitution davon, Rest 25 ist I oder eine konservative Substitution davon, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist A oder eine konservative Substitution davon und ( iii) die Aminosäuresequenz ist entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3, wobei Rest 18 K oder eine konservative Substitution davon ist, Rest 19 R oder eine Konse ist rvative Substitution davon, Rest 21 ist L oder eine konservative Substitution davon, Rest 23 ist V oder eine konservative Substitution davon, Rest 25 ist I oder eine konservative Substitution davon, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist A oder eine konservative Substitution davon und (e) X5 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 ist, wobei Rest 17 . ist E oder eine konservative Substitution davon, Rest 20 ist K oder eine konservative Substitution davon, Rest 21 ist A oder eine konservative Substitution davon, Rest 24 ist K oder eine konservative Substitution davon und Rest 25 ist Q oder eine konservative Substitution davon (ii) wobei die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 19 E oder eine konservative Substitution davon ist, Rest 21 K oder eine konservative Substitution davon ist von, Rest 23 ist A oder eine konservative Substitution davon, Rest 26 ist K oder eine konservative Substitution davon und Rest 27 ist Q oder eine konservative Substitution davon und (iii) die Aminosäuresequenz ist entlang ihrer Länge mindestens zu 50 % identisch mit den Resten SEQ ID NO: 3, wobei Rest 19 E oder eine konservative Substitution davon ist, Rest 21 K oder eine konservative Substitution davon ist, Rest 23 A oder eine konservative Substitution davon ist, Rest 26 K oder eine konservative Substitution davon ist und Rest 27' Q oder eine konservative Substitution davon ist, wobei das Polypeptid nicht die Aminosäuresequenz von SEQ ID NO: 5-7 umfasst.

8. Polypeptid nach Anspruch 1, wobei

(a) X1 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei Rest 2 E oder eine konservative Substitution davon ist , Rest 3 ist D oder eine konservative Substitution davon, Rest 5 ist E oder eine konservative Substitution davon, Rest 6 ist L oder eine konservative Substitution davon, Rest 9 ist L oder eine konservative Substitution davon, Rest 10 ist A oder eine konservative Substitution davon , Rest 13 ist L oder eine konservative Substitution davon. Rest 15 ist I oder eine konservative Substitution davon. Rest 16 ist A oder eine konservative Substitution davon, Rest 17 ist E oder eine konservative Substitution davon, Rest 18 ist A oder eine konservative Substitution davon, Rest 20 ist R oder eine konservative Substitution davon, Rest 21 ist M oder eine konservative Substitution davon, Rest 22 ist L oder eine konservative Substitution davon und Rest 25 ist Q oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 2 ist, wobei Rest 4 E oder ein konservatives . ist Substitution davon, Rest 5 ist D oder eine konservative Substitution davon, Rest 7 ist E oder eine konservative Substitution davon, Rest 8 ist L oder eine konservative Substitution davon, Rest 11 ist L oder eine konservative Substitution davon, Rest 12 ist A oder ein konservatives Substitution davon, Rest 15 ist L oder eine konservative Substitution davon. Rest 17 ist I oder eine konservative Substitution davon. Rest 18 ist A oder eine konservative Substitution davon, Rest 19 ist E oder eine konservative Substitution davon, Rest 20 ist A oder eine konservative Substitution davon, Rest 22 ist R oder eine konservative Substitution davon, Rest 23 ist M oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon und Rest 27 ist Q oder eine konservative Substitution davon und (iii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 3 ist, wobei Rest 4 E oder a . ist konservative Substitution davon, Rest 5 ist D oder eine konservative Substitution davon, Rest 7 ist E oder eine konservative Substitution davon, Rest 8 ist L oder eine konservative Substitution davon, Rest 11 ist L oder eine konservative Substitution davon, Rest 12 ist A oder a konservative Substitution davon, Rest 15 ist L oder eine konservative Substitution davon. Rest 17 ist I oder eine konservative Substitution davon. Rest 18 ist A oder eine konservative Substitution davon, Rest 19 ist E oder eine konservative Substitution davon, Rest 20 ist A oder eine konservative Substitution davon, Rest 22 ist R oder eine konservative Substitution davon, Rest 23 ist M oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon und Rest 27 ist Q oder eine konservative Substitution davon (b) X2 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) die Aminosäuresequenz ist zu mindestens 50 % identisch entlang seiner Länge zu den Resten SEQ ID NO: 1, wobei Rest 16 L oder eine konservative Substitution davon ist, Rest 17 A oder eine konservative Substitution davon ist, Rest 20 L oder eine konservative Substitution davon ist, Rest 21 L oder eine konservative Substitution ist davon, und Rest 24 ist L oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50% identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 18 L oder ein Konservat ist ve Substitution davon, Rest 19 ist A oder eine konservative Substitution davon, Rest 22 ist L oder eine konservative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon und Rest 26 ist L oder eine konservative Substitution davon und (iii) das Amino- Säuresequenz, die entlang ihrer Länge mindestens 50% identisch mit den Resten SEQ ID NO:3 ist, wobei Rest 18 L oder eine konservative Substitution davon ist, Rest 19 A oder eine konservative Substitution davon ist, Rest 22 L oder eine konservative Substitution davon ist, Rest 23 L oder eine konservative Substitution davon ist und Rest 26 L oder eine konservative Substitution davon ist (c) X3 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang mindestens 50% identisch ist seine Länge zu den Resten SEQ ID NO: 1, wobei Rest 17 T oder eine konservative Substitution davon ist, Rest 20 L oder eine konservative Substitution davon ist, Rest 21 L oder eine konservative Substitution davon ist, Rest 24 ist L oder eine konservative Substitution davon, und Rest 25 ist M oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50% identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 19 T oder a . ist konservative Substitution davon, Rest 21 ist L oder eine konservative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist M oder eine konservative Substitution davon und (iii) das Amino- Säuresequenz, die entlang ihrer Länge mindestens 50% identisch mit den Resten SEQ ID NO:3 ist, wobei Rest 19 T oder eine konservative Substitution davon ist, Rest 21 L oder eine konservative Substitution davon ist, Rest 23 L oder eine konservative Substitution davon ist, Rest 26 ist L oder eine konservative Substitution davon und Rest 27 ist M oder eine konservative Substitution davon (d) X4 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäure se Sequenz mindestens 50 % entlang ihrer Länge identisch mit den Resten SEQ ID NO: 1, wobei Rest 25 K oder eine konservative Substitution davon ist (ii) die Aminosäuresequenz entlang ihrer Länge mindestens 50 % identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 27 K oder eine konservative Substitution davon ist und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3 ist, wobei Rest 27 oder eine konservative Substitution davon und (e) X5 fehlt, oder die Aminosäuresequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 (ii) der Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch seine Länge zu den Resten SEQ ID NO: 2 und (iii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3 ist, wobei das Polypeptid nicht die Aminosäuresequenz von SEQ ID NO: 5-7' umfasst .

9. Polypeptid nach Anspruch 1, wobei

(a) X1 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei Rest 16 K oder eine konservative Substitution davon ist , Rest 17 ist D oder eine konservative Substitution davon und Rest 20 ist K oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 2 ist, wobei Rest 18 K oder a . ist konservative Substitution davon, Rest 19 D oder eine konservative Substitution davon ist und Rest 22 K oder eine konservative Substitution davon ist und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 3 ist, wobei Rest 18' ist K oder eine konservative Substitution davon, Rest 19 ist D oder eine konservative Substitution davon und Rest 22 ist K oder eine konservative Substitution davon (b) X2 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz mindestens 50% identisch entlang seiner Länge mit den Resten SEQ ID NO: 1, wobei Rest 16 A oder eine konservative Substitution davon ist, Rest 17 K oder eine konservative Substitution davon ist, Rest 20 L oder eine konservative Substitution davon ist, Rest 21 . ist L oder eine konservative Substitution davon, und Rest 24 ist E oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 18 A oder eine konservative Substitution davon ist , Rest 19 ist K oder eine konservative Substitution davon, Rest 22 ist L oder eine konservative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon und Rest 26 ist E oder eine konservative Substitution davon und (iii) die Aminosäuresequenz at mindestens 50 % identisch entlang seiner Länge mit den Resten SEQ ID NO: 3, wobei Rest 18 A oder eine konservative Substitution davon ist, Rest 19 K oder eine konservative Substitution davon ist, Rest 22 L oder ein konservativer Subs ist deren Substitution ist, Rest 23 L oder eine konservative Substitution davon ist und Rest 26 E oder eine konservative Substitution davon ist (c) X3 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz mindestens 50% entlang seiner Länge identisch mit den Resten SEQ ID NO: 1, wobei Rest 16 A oder eine konservative Substitution davon ist 17 V oder eine konservative Substitution davon ist, Rest 20 A oder eine konservative Substitution davon ist, Rest 21 L oder ein konservatives . ist Substitution davon, Rest 23 ist L oder eine konservative Substitution davon, Rest 24 ist M oder eine konservative Substitution davon und Rest 25 ist H oder eine konservative Substitution davon (ii) die Aminosäuresequenz ist entlang ihrer Länge mindestens zu 50 % identisch mit den Resten SEQ ID NO: 2, wobei Rest 18 A oder eine konservative Substitution davon ist, 19 V oder eine konservative Substitution davon ist, Rest 22 A oder eine konservative Substitution davon ist, Rest 23 L oder ein Konservat ist ive Substitution davon ist, Rest 25 L oder eine konservative Substitution davon ist, Rest 26 M oder eine konservative Substitution davon ist und Rest 27 H oder eine konservative Substitution davon ist und (iii) die Aminosäuresequenz entlang ihrer Länge mindestens zu 50 % identisch ist zu den Resten SEQ ID NO:3, wobei Rest 18 A oder eine konservative Substitution davon ist, 19 V oder eine konservative Substitution davon ist, Rest 22 A oder eine konservative Substitution davon ist, Rest 23 L oder eine konservative Substitution davon ist, Rest 25 . ist L oder eine konservative Substitution davon, Rest 26 ist M oder eine konservative Substitution davon und Rest 27 ist H oder eine konservative Substitution davon (d) X4 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Amino- Säuresequenz, die entlang ihrer Länge mindestens zu 50 % identisch mit den Resten SEQ ID NO: 1 ist, wobei Rest 16 E oder eine konservative Substitution davon ist, Rest 17 E oder eine konservative Substitution davon ist, Rest 20 ist I oder eine konservative Substitution davon, Rest 21 ist L oder eine konservative Substitution davon, Rest 24 ist A oder eine konservative Substitution davon und Rest 25 ist M oder eine konservative Substitution davon (ii) die Aminosäuresequenz mindestens 50% entlang seiner Länge identisch mit den Resten SEQ ID NO: 2, wobei Rest 18 E oder eine konservative Substitution davon ist, Rest 19 E oder eine konservative Substitution davon ist, Rest 22 I oder eine konservative Substitution davon ist, Rest 23 L oder eine konservative Substitution ist Substitution davon, Rest 26 ist A oder eine konservative Substitution davon und Rest 27 ist M oder eine konservative Substitution davon und (iii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3 ist, wobei Rest 18' ist E oder eine konservative Substitution davon, Rest 19 ist E oder eine konservative Substitution davon, Rest 22 ist I oder eine konservative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon, Rest 2 6 A oder eine konservative Substitution davon ist und Rest 27 M oder eine konservative Substitution davon ist und (e) X5 die Aminosäuresequenz umfasst, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz zu mindestens 50 % identisch entlang seiner Länge zu den Resten SEQ ID NO: 1, wobei Rest 17 E oder eine konservative Substitution davon ist, Rest 20 K oder eine konservative Substitution davon ist, Rest 21 V oder eine konservative Substitution davon ist, Rest 23 E oder eine konservative Substitution ist davon, Rest 24 ist D oder eine konservative Substitution davon und Rest 25 ist H oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2 ist, wobei Rest 19 E . ist oder eine konservative Substitution davon, Rest 22 ist K oder eine konservative Substitution davon, Rest 23 ist V oder eine konservative Substitution davon, Rest 25 ist E oder eine konservative Substitution davon, Rest 26 ist D oder ein konservatives s Substitution davon, und Rest 27 ist H oder eine konservative Substitution davon und (iii) die Aminosäuresequenz, die entlang ihrer Länge mindestens zu 50% identisch mit den Resten SEQ ID NO: 3 ist, wobei Rest 19 E oder eine konservative Substitution davon ist, Rest 22' ist K oder eine konservative Substitution davon, Rest 23 ist V oder eine konservative Substitution davon, Rest 25 ist E oder eine konservative Substitution davon, Rest 26 ist D oder eine konservative Substitution davon und Rest 27 ist H oder eine konservative Substitution davon, wobei die Polypeptid umfasst nicht die Aminosäuresequenz von SEQ ID NO: 5-7.

10. Polypeptid nach Anspruch 1, wobei

(a) X1 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 1 ist, wobei Rest 2 T oder eine konservative Substitution davon ist , Rest 3 ist E oder eine konservative Substitution davon, Rest 5 ist K oder eine konservative Substitution davon, Rest 6 ist M oder eine konservative Substitution davon, Rest 9 ist I oder eine konservative Substitution davon, Rest 10 ist A oder eine konservative Substitution davon , Rest 12 ist R oder eine konservative Substitution davon, Rest 13 ist E oder eine konservative Substitution davon. Rest 15 ist M oder eine konservative Substitution davon. Rest 16 ist I oder eine konservative Substitution davon, Rest 17 ist I oder eine konservative Substitution davon, Rest 18 ist V oder eine konservative Substitution davon, Rest 20 ist R oder eine konservative Substitution davon, Rest 21 ist M oder eine konservative Substitution davon, Rest 22 ist L oder eine konservative Substitution davon, Rest 24 ist E oder eine konservative Substitution davon und Rest 25 ist K oder eine konservative Substitution davon (ii) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit SEQ ID NO: 2, wobei Rest 4 T oder eine konservative Substitution davon ist, Rest 5 E oder eine konservative Substitution davon ist, Rest 7 K oder eine konservative Substitution davon ist, Rest 8 M oder eine konservative Substitution davon ist, Rest 10 I oder eine konservative Substitution ist Substitution davon, Rest 12 ist A oder eine konservative Substitution davon, Rest 14 ist R oder eine konservative Substitution davon, Rest 15 ist E oder eine konservative Substitution davon. Rest 17 ist M oder eine konservative Substitution davon.Rest 18 ist I oder eine konservative Substitution davon, Rest 19 ist I oder eine konservative Substitution davon, Rest 20 ist V oder eine konservative Substitution davon, Rest 22 ist R oder eine konservative Substitution davon, Rest 23 ist M oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon, Rest 26 ist E oder eine konservative Substitution davon und Rest 27 ist K oder eine konservative Substitution davon und (iii) die Aminosäuresequenz ist entlang ihrer Länge mindestens zu 50 % identisch mit SEQ ID NO :3, wobei Rest 4 T oder eine konservative Substitution davon ist, Rest 5 E oder eine konservative Substitution davon ist, Rest 7 K oder eine konservative Substitution davon ist, Rest 8 M oder eine konservative Substitution davon ist, Rest 10 I oder a . ist konservative Substitution davon, Rest 12 ist A oder eine konservative Substitution davon, Rest 14 ist R oder eine konservative Substitution davon, Rest 15 ist E oder eine konservative Substitution davon. Rest 17 ist M oder eine konservative Substitution davon. Rest 18 ist I oder eine konservative Substitution davon, Rest 19 ist I oder eine konservative Substitution davon, Rest 20 ist V oder eine konservative Substitution davon, Rest 22 ist R oder eine konservative Substitution davon, Rest 23 ist M oder eine konservative Substitution davon, Rest 24 ist L oder eine konservative Substitution davon, Rest 26 ist E oder eine konservative Substitution davon und Rest 27 ist K oder eine konservative Substitution davon (b) X2 umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i ) die Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 ist, wobei Rest 16 L oder eine konservative Substitution davon ist, Rest 17 I oder eine konservative Substitution davon ist, Rest 20 L oder eine konservative Substitution ist davon ist Rest 21 L oder eine konservative Substitution davon und Rest 24 ist E oder eine konservative Substitution davon (ii) die Aminosäuresequenz ist entlang ihrer Länge zu mindestens 50% identisch mit resi dues SEQ ID NO: 2, wobei Rest 18 L oder eine konservative Substitution davon ist, Rest 19 I oder eine konservative Substitution davon ist, Rest 22 L oder eine konservative Substitution davon ist, Rest 23 L oder eine konservative Substitution davon ist und Rest 26 E oder eine konservative Substitution davon ist und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3 ist, wobei Rest 18 L oder eine konservative Substitution davon ist, Rest 19 I oder ein konservatives . ist Substitution davon, Rest 22 ist L oder eine konservative Substitution davon, Rest 23 ist L oder eine konservative Substitution davon und Rest 26 ist E oder eine konservative Substitution davon (c) X3 fehlt oder umfasst die Aminosäuresequenz, die ausgewählt ist aus Gruppe bestehend aus: (i) der Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 (ii) der Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch zu den Resten SEQ ID NO: 2 und ( iii) die Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch mit den Resten SEQ ID NO: 3 (d) X4 fehlt oder umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz zu mindestens 50 % entlang ihrer Länge identisch mit den Resten SEQ ID NO: 1 (ii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2 und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch zu Reste SEQ ID NO: 3 und (e) X5 fehlt oder umfasst die Aminosäuresequenz, die ausgewählt ist aus der Gruppe bestehend aus: (i) der Aminosäuresequenz, die entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 1 (ii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 2 und (iii) die Aminosäuresequenz entlang ihrer Länge zu mindestens 50 % identisch mit den Resten SEQ ID NO: 3, wobei das Polypeptid nicht die Aminosäuresequenz von SEQ ID NO: 5-7 umfassen.

11. Polypeptid, umfassend die allgemeine Formel X1-X2-X3-X4, wobei:

X1 ist entlang seiner Länge zu mindestens 50 % identisch mit den Resten 1-34 der Aminosäuresequenz von SEQ ID NO: 8, wobei sich die Aminosäuresequenz von X1 von der Aminosäuresequenz der Reste 1-34 von SEQ ID NO: unterscheidet: 8 mindestens an den Resten 6, 8, 13, 21, 25 und 28 fehlt X2 oder ist entlang seiner Länge zu mindestens 50 % identisch mit den Resten 36-68 der Aminosäuresequenz von SEQ ID NO: 8 X3 fehlt , oder ist entlang seiner Länge zu mindestens 50 % identisch mit den Resten 69-102 der Aminosäuresequenz von SEQ ID NO: 8 und X4 fehlt, oder ist entlang seiner Länge zu mindestens 50 % identisch mit den Resten 103-119 der Amino- Säuresequenz von SEQ ID NO: 8.

12. Polypeptid nach Anspruch 11, wobei sich die Aminosäuresequenz von X1 von der Aminosäuresequenz der Reste 1-34 von SEQ ID NO: 8 zumindest wie folgt unterscheidet:

W6 ist mit A, M oder konservativen Substitutionen davon substituiert N8 ist mit I, L, K, D oder konservativen Substitutionen davon substituiert Y13 ist mit I, A, M oder konservativen Substitutionen davon substituiert E21 ist mit I, L oder konservativen Substitutionen davon substituiert Y25 ist mit M, A oder konservativen Substitutionen davon substituiert und K28 ist mit I, L, V oder konservativen Substitutionen davon substituiert.

13. Polypeptid nach Anspruch 11, wobei sich die Aminosäuresequenz von X1 weiter von der Aminosäuresequenz der Reste 1-34 von SEQ ID NO: 8 zumindest an den Resten 2, 5, 18 und 27 unterscheidet.


Die biologischen Eigenschaften der Viren der vier Gattungen weisen unterschiedliche Merkmale auf und werden in den entsprechenden Abschnitten der Gattungsseiten beschrieben.

Hepaci: aus dem Griechischen hepaR, hepawerfen, &ldquoliver&rdquo und Identifizierungsschreiben von Hepatitis C Virus

Pegi: von Sportwiderständig, und die ursprünglichen Namen der gB-Viren und Hepatitis g, abgeleitet von den Initialen der Originalquelle, dem Chirurgen &ldquoGB&rdquo


Erstellen einer PDB-Datei aus einer Aminosäuresequenz mit nicht gefalteter Struktur - Biologie

1. Verfahren zur Herstellung simulierter, chemisch modifizierter Peptid- oder peptidomimetischer Struktur(en), die im Wesentlichen die energetisch wahrscheinlichste dreidimensionale Struktur von vorausgewählten weniger eingeschränkten Polypeptid(en) nachahmen, wobei das Verfahren umfasst:

(1) Bestimmen der φ- und -Winkel für jeden Rest, der in dem vorausgewählten Polypeptid enthalten ist

(2) Vergleichen der φ- und -Winkel für jeden in Schritt (i) erhaltenen Rest mit den φ- und -Winkeln für jeden Rest bekannter Polypeptidspezies

(3) Ersetzen mindestens eines der Reste des vorausgewählten Polypeptids durch eine chemisch modifizierte Einheit, um ein chemisch modifiziertes Peptid oder eine peptidomimetische Struktur zu erzeugen, wobei die chemisch modifizierte Einheit - und -Winkel aufweist, die den φ- und ψ-Winkeln von im Wesentlichen ähnlich sind der Rückstand, der ersetzt wird und

(4) chemisches Synthetisieren und Testen der Bioaktivität des chemisch modifizierten Peptids oder der peptidomimetischen Struktur.

2. Verfahren nach Anspruch 1, wobei die Schritte (1), (2) und (3) sequentiell wiederholt werden, beginnend mit einem ersten Rest des vorausgewählten, weniger eingeschränkten Polypeptids, um chemisch modifizierte Analog(e) mit . herzustellen eine Tertiärstruktur, die im Wesentlichen die energetisch wahrscheinlichste Tertiärstruktur des/der vorausgewählten, weniger eingeschränkten Polypeptids/Polypeptide nachahmt.

3. Verfahren zur Erzeugung biologisch oder pharmakologisch aktiver Moleküle, umfassend:

(a) Bestimmen der Aminosäuresequenz der hypervariablen Region eines monoklonalen Antikörpers mit biologischer oder pharmakologischer Aktivität, und

(b) Herstellen einer peptidomimetischen Verbindung basierend auf der Aminosäuresequenz von Schritt (a), wobei die peptidomimetische Verbindung im Wesentlichen die biologische oder pharmakologische Aktivität des monoklonalen Antikörpers beibehält, wobei die peptidomimetische Verbindung hergestellt wird durch:

(i) Bestimmen der energetisch höchstwahrscheinlichen φ- und ψ-Winkel für jeden Rest, der in der hypervariablen Region des monoklonalen Antikörpers enthalten ist,

(ii) Vergleichen der φ- und -Winkel für jeden in Schritt (i) erhaltenen Rest mit den φ- und -Winkeln für jeden Rest bekannter Polypeptidspezies, und

(iii) Ersetzen mindestens eines der Reste der pharmazeutisch wirksamen Verbindung durch eine chemisch modifizierte Einheit, wobei die chemisch modifizierte Einheit - und -Winkel aufweist, die im Wesentlichen den φ- und -Winkeln des zu ersetzenden Rests ähnlich sind.

Ein Teil der Spezifikation ist ein Mikrofiche-Anhang mit 12 Mikrofiche und 1164 Bildern.

Ein Teil der Offenbarung dieses Patentdokuments enthält Material, das dem Urheberrechtsschutz unterliegt. Der Urheberrechtsinhaber hat keine Einwände gegen die Faksimile-Reproduktion des Patentdokuments oder der Patentoffenbarung, wie sie in der Patentakte oder den Aufzeichnungen des Patent- und Markenamts erscheinen, behält sich jedoch ansonsten alle Urheberrechte vor.

Die vorliegende Erfindung betrifft das Arzneimitteldesign und insbesondere das Arzneimitteldesign, das rational durch die Simulation und Vorhersage von Konformationsmerkmalen ausgewählter Oligopeptide oder Polypeptide zum Zweck der Vorhersage und Herstellung bioaktiver peptidomimetischer Verbindungsstrukturen erreicht wird. Die vorliegende Erfindung betrifft ferner Verfahren und Werkzeuge zum Erstellen solcher Vorhersagen und Verbindungen und die diagnostischen und therapeutischen Verwendungen der so hergestellten Verbindungen bei Säugern.

HINTERGRUND DER ERFINDUNG

Proteine ​​sind komplexe, dreidimensionale Substanzen, die eine oder mehrere lange, gefaltete Polypeptidketten umfassen. Diese Ketten wiederum bestehen aus kleinen chemischen Einheiten, den Aminosäuren. Alle Aminosäuren enthalten Kohlenstoff, Wasserstoff, Sauerstoff und Stickstoff. Einige enthalten auch Schwefel. Ein "Peptid" ist eine Verbindung, die zwei oder mehr Aminosäuren enthält. Die Aminosäuren verbinden sich in einer Linie zu einer Peptidkette. Es gibt 20 verschiedene natürlich vorkommende Aminosäuren, die an der biologischen Produktion von Peptiden beteiligt sind, und eine beliebige Anzahl von ihnen kann in beliebiger Reihenfolge verknüpft werden, um eine Peptidkette zu bilden. Die natürlich vorkommenden Aminosäuren, die bei der biologischen Produktion von Peptiden verwendet werden, haben alle die L-Konfiguration. Synthetische Peptide können unter Verwendung herkömmlicher Syntheseverfahren unter Verwendung von L-Aminosäuren, D-Aminosäuren oder verschiedenen Kombinationen von Aminosäuren der zwei unterschiedlichen Konfigurationen hergestellt werden. Einige Peptidketten enthalten nur wenige Aminosäureeinheiten. Kurze Peptidketten, z. B. mit weniger als zehn Aminosäureeinheiten, werden manchmal als "Oligopeptide" bezeichnet, wobei das Präfix "Oligo" "wenige" bedeutet. Andere Peptidketten enthalten eine große Anzahl von Aminosäureeinheiten, z. B. bis zu 100 oder mehr, und werden als "Polypeptide" bezeichnet, wobei das Präfix "poly" "viele" bedeutet. Auf noch andere Peptidketten, die eine feste Anzahl von Aminosäureeinheiten enthalten, wird unter Verwendung eines Präfixes Bezug genommen, das die feste Anzahl von Einheiten in der Kette bezeichnet, z. B. ein Octapeptid, wobei das Präfix "Octa" acht bedeutet. (Nach Konvention kann ein "Polypeptid" als eine beliebige Peptidkette angesehen werden, die drei oder mehr Aminosäuren enthält, während ein "Oligopeptid" normalerweise als ein besonderer Typ einer "kurzen" Polypeptidkette angesehen wird dass jede Bezugnahme auf ein „Polypeptid" auch ein Oligopeptid umfasst. Ferner umfasst jede Bezugnahme auf ein „Peptid" Polypeptide, Oligopeptide und dergleichen.) Jede unterschiedliche Anordnung von Aminosäuren bildet eine unterschiedliche Polypeptidkette. Die Zahl der Ketten - und damit der verschiedenen Proteine ​​-, die gebildet werden können, ist praktisch unbegrenzt.

Ein Medikament ist eine chemische Substanz, die einem lebenden Organismus mit der Absicht verabreicht wird, ein gewünschtes Ergebnis zu erzielen, wie beispielsweise die Vorbeugung oder Heilung von Krankheiten. Das gewünschte Ergebnis wird normalerweise durch eine geeignete physikalische oder chemische Wechselwirkung zwischen dem verabreichten Arzneimittel und Verbindungen, die in lebendem Gewebe vorkommen, erreicht.

Alle Lebewesen enthalten Proteine. Die Strukturen einer Zelle sind aus Proteinen aufgebaut. Einige Proteine, sogenannte Enzyme, beschleunigen die chemischen Reaktionen des Lebens. Sie helfen bei der Verdauung von Nahrung, helfen bei der Energiegewinnung und helfen beim Aufbau anderer Proteine. Eine einzelne Zelle kann viele Hundert Enzyme enthalten. Andere Peptide und Proteine, bekannt als Hormone, regulieren chemische Aktivitäten im ganzen Körper. Wieder andere Proteine ​​sind Antikörper, die Fremdkörper erkennen und anheften.

Die Entwicklung von Arzneimitteln beinhaltete in der Vergangenheit das "Entdecken" einer bestimmten chemischen Substanz, die in irgendeiner Weise mit Rezeptoren, z. B. Proteinen in den lebenden Zellen eines Säugerkörpers, interagiert. Da Proteine ​​aus Polypeptiden bestehen, überrascht es nicht, dass einige wirksame Medikamente auch Peptide sind oder Peptiden nachempfunden sind. Damit zwei Peptide effektiv miteinander interagieren können, z. B. eines als Proteinrezeptor und das andere als Arzneimittel, ist es im Allgemeinen notwendig, dass die komplexe dreidimensionale Form ("Konformation") eines Peptids eine kompatible Konformation einnimmt, die es ermöglicht, die beiden Peptide passen und binden sich so, dass das gewünschte Ergebnis erzielt wird. In einem solchen Fall wurde die komplexe Form oder Konformation eines ersten Peptids mit einem "Schloss" und der entsprechenden erforderlichen Form oder Konformation des Rezeptors als "Schlüssel" verglichen, der das erste Peptid entsperrt (dh das gewünschte Ergebnis erzeugt). . Diese "Schloss-und-Schlüssel"-Analogie betont, dass nur ein richtig angepasster Schlüssel (zweites Peptid oder danach gemusterte Verbindung) in das Schloss (erstes Peptid) passen kann, um es zu "entriegeln" (ein gewünschtes Ergebnis zu erzeugen). Auch wenn der Schlüssel in das Schloss passt, muss er die richtige Zusammensetzung haben, damit er seine Funktion erfüllen kann. Das heißt, das zweite Peptid muss die richtigen Elemente in der richtigen räumlichen Anordnung und Position enthalten, um richtig an das erste Peptid, z. B. das Rezeptorprotein, zu binden. Die Entdeckung oder Vorhersage der richtigen Konformation oder Form des Schlüssels oder des zweiten Peptids oder der anschließend gemusterten Verbindung ist daher ein Hauptziel jedes Arzneimitteldesigns.

Um die Hindernisse, die bei der Entdeckung oder Vorhersage der Konformation eines Oligopeptids oder Polypeptids auftreten, besser zu verstehen und zu würdigen, wird auf 1 Bezug genommen. 1 zeigt die konventionelle chemische Darstellung eines neutralen Oligopeptids, bestehend aus vier Aminosäuren. Abhängig vom pH-Wert des Mediums, in dem das Peptid vorhanden ist, kann das Peptid eine Vielzahl geladener Spezies enthalten, d. h. eine oder mehrere Ammoniumspezies, Carboxyl-Anionen usw. 1 hat ein terminales Amino (NH2)-Gruppe am linken Ende der Kette, wie in der Figur orientiert, und eine endständige freie Carboxylgruppe (-COOH) am rechten Ende der Kette. Diese Enden des Polypeptids werden als Amino (NH2)-terminales Ende bzw. das Carboxyl-(--COOH)-terminale Ende. Dieselbe Terminologie gilt im Fall von Proteinen. Konventionell ist das NH2 -terminale Aminosäure in einem Oligopeptid der Polypeptidkette eines Proteins wird die erste Aminosäure oder der erste "Rest" genannt. Die nächste Aminosäure in der Kette wird die zweite Aminosäure oder der zweite Rest genannt und so weiter über die gesamte Länge der Kette.

Die in FIG. 1, dh R 1 , R 2 , R 3 und R 4 , symbolisieren verschiedene "Anhängergruppen" der Kette Die anhängenden Gruppen sind immer an das Alpha-Kohlenstoffatom (C &agr; CH) Bestandteil der Kette, wie in 1 gezeigt. Eine anhängende Gruppe kann eine einfache oder komplexe Gruppe oder Einheit umfassen, deren physikalische Abmessungen im Vergleich zu den Abmessungen der Kette erheblich variieren können.

Es gibt eine Reihe von Faktoren, die eine wichtige Rolle bei der Bestimmung der Gesamtstruktur eines Proteins oder Polypeptids spielen. Erstens ist die Peptidbindung, d. h. die Bindung, die die Aminosäuren in der Kette verbindet, eine kovalente Bindung. Diese Bindung hat eine planare Struktur und ist im Wesentlichen ein substituiertes Amid. Ein "Amid" ist eine beliebige Gruppe organischer Verbindungen, die den Rest enthalten: Die planare Peptidbindung kann wie in Fig. 1 dargestellt dargestellt werden. 2. Da die OC- und die CN-Atome in einer relativ starren Ebene liegen, findet keine freie Rotation um diese Achsen statt. Somit ist eine Ebene, schematisch in FIG. 2 durch die gestrichelte Linie 12 dargestellt und manchmal auch als "Amidebene" oder "Peptidebene" bezeichnet, wird gebildet, worin die Sauerstoff- (O), Kohlenstoff- (C), Stickstoff- (N) und Wasserstoffatome (H) von . liegen eine gegebene Aminosäure oder ein Rest. An gegenüberliegenden Ecken dieser Amidebene befinden sich die α-Kohlenstoffatome (C α). Da es in der Peptid- oder Amidebene im Wesentlichen keine Rotation um die starren OC- und C-N-Atome gibt, umfasst eine Polypeptidkette somit eine Reihe von planaren Peptidbindungen, die die Cα-Atome verbinden. Die C α -Atome dienen somit als Drehpunkte oder Zentren für eine Polypeptidkette, wie in Fig. 1 gezeigt. 2B. In FIG. In 2B repräsentieren die schattierten Bereiche 12 die Peptid- oder Amidebenen. Beachten Sie, dass jede Ebene über ein C α -Atom an die benachbarte Ebene gekoppelt ist.

Ein zweiter Faktor, der eine wichtige Rolle bei der Definition der Gesamtstruktur oder Konformation eines Polypeptids oder Proteins spielt, ist der Rotationswinkel jeder Amid- oder Peptidebene um die gemeinsame Cα-Bindung. Unter der Annahme, dass die O-, C-, N- und H-Atome in der Amidebene verbleiben (was normalerweise eine gültige Annahme ist, obwohl es für einige Konformationen leichte Abweichungen von der Planarität dieser Atome geben kann), definieren diese Rotationswinkel die die Struktur des Polypeptids, zumindest die Struktur, wie sie zwischen benachbarten Resten existiert. Diese Drehwinkel sind in Fig. 2 dargestellt. 2C. In FIG. In 2C sind zwei Amidebenen dargestellt, dargestellt durch die gestrichelten Linien 12' und 12". Diese beiden Ebenen sind durch ein gemeinsames C α -Atom 13 verbunden, das die Ecke jeder Ebene darstellt. Der Rotationswinkel der Ebene 12' relativ zu das gemeinsame C α -Atom 13 ist als definiert. Der Drehwinkel der Ebene 12" relativ zum C α -Atom 13 ist als definiert. Die beiden Winkel , definieren somit im Wesentlichen die Peptidstruktur für die Hauptkette eines bestimmten Restes der Peptidkette. Eine Menge der Winkel φich,ja wobei der Index i einen bestimmten Rest einer Polypeptidkette darstellt, definiert somit effektiv die Gesamtsekundärstruktur des Polypeptids.

Es sei darauf hingewiesen, dass die Konventionen, die bei der Definition der φ, -Winkel verwendet werden, dh der Bezugspunkte, an denen die Amidebenen einen Null-Grad-Winkel bilden, und die Definition, welcher Winkel ist und welcher Winkel ist, für ein gegebenes Polypeptid , sind in der Literatur definiert. Siehe z. B. Ramachandran et al., "Conformation of Polypeptides", Adv. Schutz Chem.-Nr. 23, 283–437 (1968), auf den Seiten 285–94, welche Seiten hierin durch Bezugnahme eingeschlossen sind.

Somit biegt, faltet oder biegt sich eine Polypeptidstruktur an jedem C &agr;-Drehpunkt.In einer bestimmten Umgebung und in Abhängigkeit von den bestimmten Seitenketten, die an das Polypeptid gebunden sein können, können einige dieser Biegungen oder Faltungen stabil sein, d. h. die -, -Winkel ändern sich nicht. In vielen Umgebungen sind die Winkel φ, jedoch nicht stabil, und die Polypeptidkette wird sich dynamisch falten und biegen (wie eine im Wasser schwimmende Schlange), wenn sie äußeren oder inneren Kräften ausgesetzt ist. Solche Kräfte können von zahlreichen Quellen stammen, wie beispielsweise Ionen oder Molekülen in dem Medium, in dem sich das Polypeptid befindet (externe Kräfte), die ein gegebenes Atom oder eine Gruppe von Atomen innerhalb des Polypeptids entweder anziehen oder abstoßen. Häufig stammen diese Kräfte jedoch aus dem Polypeptid selbst oder aus einer seiner Seitengruppen, wenn sich die Kette um sich selbst faltet und ein Rest oder eine Seitengruppe des Polypeptids in große Nähe zu einem anderen Rest oder einer anderen Seitenkettenkette des . kommt Polypeptid.

Um die Art und Weise zu veranschaulichen, in der sich eine Polypeptidkette biegen oder falten kann, zeigt FIG. 3A zeigt konzeptionell ein Polypeptid, das eine helikale Konformation angenommen hat. Die in FIG. 3A ist eine spezielle Konfiguration, die als rechtshändige α-Helix bezeichnet wird. Diese Struktur, die 3,6 Aminosäurereste pro Umdrehung aufweist, ist repräsentativ für zahlreiche bekannte stabile Peptidstrukturen. Stabilität resultiert aus Wasserstoffbrückenbindungen zwischen einer -NH--Gruppe in der Helix und der -C&sub2;O-Gruppe der vierten Aminosäure in der Kette. Unter den in FIG. In 3A beträgt der -Wert etwa –60° und der ψ-Wert etwa –40°.

Da das C α -Atom der Drehpunkt für die Kette ist, werden die mit dem C α -Atom verbundenen R-Gruppen (Seiten- oder Seitengruppen) bei der Definition der endgültigen Peptidkonformation extrem wichtig.

Im Allgemeinen kann eine Polypeptidkette konzeptionell unendlich viele Formen annehmen, so wie ein flexibles Seil unendlich viele Formen annehmen kann, einschließlich hochsymmetrischer Formen, wie einer Helix, oder asymmetrischer Formen, die alle Arten von Verrenkungen beinhalten. Viele der möglichen Formen sind jedoch instabil, da die internen und externen molekularen Anziehungs- und/oder Abstoßungskräfte es nicht zulassen, dass solche Formen bestehen bleiben. Diese Kräfte wirken, um die Polypeptidkonformation weg von instabilen Konformationen hin zu einer stabilen Konformation zu bewegen oder zu ändern. Eine stabile Konformation ist eine Konformation, bei der die internen und externen molekularen Anziehungs- und/oder Abstoßungskräfte die vorhandene Konformation nicht destabilisieren oder in eine andere Konformation drängen.

Die meisten Polypeptidstrukturen weisen mehrere Konformationen auf, die stabil sind, einige mehr als andere. Die stabilsten Konformationen sind die wahrscheinlichsten. Eine Konformation kann sich von einer stabilen Konformation in eine andere ändern, indem ausreichend Energie aufgebracht wird, um die Änderung zu bewirken. Wenn man die Möglichkeit erhält, sich frei zu bewegen, zu falten und/oder zu biegen, nimmt eine gegebene Polypeptidkette schließlich eine stabile Konformation an. Die wahrscheinlichste Konformation, die angenommen wird, ist diejenige, deren Rückgängigmachung die meiste Energie verbrauchen würde. Diese wahrscheinlichste Konformation wird hier als das "globale Minimum" bezeichnet. Andere stabile Konformationen sind weniger wahrscheinlich, können aber leicht angenommen werden und werden hier als "lokales Minimum" oder "lokales Minima" bezeichnet. Eine Konformation, die ein lokales Minimum darstellt, könnte somit durch Anwendung einer äußeren Kraft in eine andere stabile Konformation geändert werden, die entweder ein anderes, anderes lokales Minimum oder das globale Minimum ist. Die Fähigkeit zu unterscheiden, ob eine gegebene Konformation ein lokales Minimum oder das globale (oder wahrscheinlichste) Minimum darstellt, bleibt ein bedeutendes Problem bei der Durchführung von Peptidsimulationen.

In FIG. 3B ist eine komplexe dreidimensionale Konformation eines Polypeptids, typisch für viele Proteine, stabilisiert durch nichtkovalente Bindungen. In FIG. 3C sind zwei solcher komplexer Polypeptid-Konformationen, die eng beieinander gepackt sind. FEIGE. 3C veranschaulicht somit die "Schloss-und-Schlüssel"-Analogie, die mit dem Arzneimitteldesign verbunden ist. Nur wenn die Konformation eines Peptids so gestaltet wird, dass es in die Konformation des anderen Peptids passt und daran bindet, findet die gewünschte Wechselwirkung zwischen den beiden Peptiden statt. Rationelles Arzneimitteldesign umfasst somit nicht nur das Wissen oder die Vorhersage der Konformation eines gewünschten Proteinrezeptorpeptids, sondern auch die Fähigkeit, die Konformation eines Arzneimittelpeptids, das mit dem Rezeptorpeptid wechselwirken soll, zu kontrollieren und vorherzusagen.

An dieser Stelle ist es hilfreich, einige gebräuchliche Begriffe zu definieren, die verwendet werden, um die komplexe Struktur von Proteinen und Polypeptiden zu definieren. Eine Primärstruktur ist eine, bei der die Anzahl und die genaue Sequenz von Aminosäuren im Polypeptid bekannt sind. Die Peptidbindung zwischen jedem der Aminosäurereste wird impliziert, aber es werden keine anderen Kräfte oder Bindungen durch die Verwendung des Begriffs "Primärstruktur" angezeigt. Somit ist die chemische Darstellung des in FIG. 1 definiert seine Primärstruktur. Eine Sekundärstruktur bezieht sich auf das Ausmaß, in dem eine Polypeptidkette eine helikale oder andere stabile Struktur besitzt, wie in 1 gezeigt. 3A. Eine Sekundärstruktur hat somit eine Reihe von Winkeln, φich,ich für jeden Rest i der Kette. Eine Tertiärstruktur ist ein Begriff, der verwendet wird, um sich auf die Tendenz des Polypeptids zu beziehen, einer ausgedehnten Windung oder Faltung zu unterliegen, um eine komplexe, etwas starre dreidimensionale Struktur zu erzeugen, wie sie in Fig. 1 gezeigt ist. 3B. Eine quaternäre Struktur ist ein Begriff, der verwendet wird, um den Assoziationsgrad zwischen zwei oder mehr Polypeptiden zu definieren, z. 3C.

Neben den oben definierten vier Grundstrukturen haben einige Autoren weitere Begriffe für Zwischenstrukturen, z. B. Supersekundär- und Domänenstrukturen, beschrieben und geprägt. Während eine Sekundärstruktur verwendet wird, um sich auf die regelmäßigen Anordnungen des Polypeptidrückgrats zu beziehen, wird eine "Supersekundärstruktur" verwendet, um Aggregate der Sekundärstruktur zu definieren. "Domänen"-Strukturen werden verwendet, um sich auf gut getrennte Teile innerhalb von globulären Proteinen zu beziehen, d. h. innerhalb von Tertiärstrukturen. Siehe zB Linderstrom-Lang et al., "Protein Structure and Enzyme Activity", The Enzymes, (PD Boyer, Ed.), 1:443-510, Academic Press, New York (1959) und Schulz et al. , Prinzipien der Proteinstruktur, Springer-Verlag, New York (1984).

Der Fachmann wird erkennen, dass die obige Beschreibung einer Polypeptidkette und der Faktoren, die ihre Gesamtstruktur definieren, etwas vereinfacht sind. Die obige Beschreibung liefert jedoch dennoch einen ausreichenden Hintergrund zum Verständnis der vorliegenden Erfindung. Für eine ausführlichere Beschreibung der Polypeptidstruktur siehe z. B. Ramachandran et al., "Conformation of Polypeptides", Adv. Prot. Chem. 23, 283-437 (1968).

Mit dem Vorhergehenden als Hintergrund ist somit ersichtlich, dass das Arzneimitteldesign, das Polypeptide umfasst, die Identifizierung und Definition eines ersten Peptids erfordert, mit dem das entworfene Arzneimittel wechselwirken soll, und die Verwendung des ersten Zielpeptids, um die Anforderungen für ein zweites Peptid zu definieren. Mit solchen definierten Anforderungen besteht das Ziel darin, einen geeigneten Peptid- oder Nicht-Peptid-Liganden zu finden oder herzustellen, der alle oder im Wesentlichen alle der definierten Anforderungen erfüllt, der hoffentlich als verabreichtes Arzneimittel verwendet werden kann.

In der Praxis hat sich dieser Prozess des Arzneimitteldesigns jedoch als sehr schwierig erwiesen. An erster Stelle weisen viele der Proteinpeptide, mit denen das verabreichte Arzneimittel wechselwirken soll, selbst keine stabilen Konformationen auf, so dass es schwierig ist, solche Proteinpeptide zu verwenden, um die Anforderungen an ein Arzneimittelpeptid festzulegen. Während eine bestimmte Anwendung, z. B. ein bestimmtes Proteinpeptid, einige Hinweise auf eine geeignete Primär- oder Sekundärstruktur liefern kann, die ein verabreichtes Wirkstoffpeptid annehmen könnte, kann sie nur wenige Hinweise auf die beste Konformation für das Wirkstoffpeptid liefern. Selbst wenn eine gewünschte Konformation einer interessierenden Verbindung identifizierbar wäre, ist es möglicherweise nicht möglich, eine solche Verbindung einem Patienten in einer Form zu verabreichen, die eine solche Konformation beibehält. Das heißt, für eine gegebene Anwendung kann eine bevorzugte Konformation der interessierenden Verbindung nicht ausreichend stabil sein, um dem Empfängerorganismus die gewünschte Wirkung zu verleihen.

Angesichts der obigen Schwierigkeiten ist das Beste, was bisher beim rationalen Arzneimitteldesign erreicht wurde, die Suche nach einer geeigneten Verbindung, die als Arzneimittel verabreicht werden könnte und die eine stabile Sekundär- oder Tertiärstruktur bereitstellt. Nach der Identifizierung wird diese Verbindung getestet, um zu sehen, ob sie bioaktiv ist (d. h. um zu sehen, ob sie die Fähigkeit besitzt, mit einem gewünschten Rezeptorpeptid zu interagieren). Wenn dies der Fall ist, wird weiter getestet, ob die gewünschten positiven Ergebnisse erzielt werden.

Daher hat ein Großteil des bisher durchgeführten Arzneimitteldesigns intensive Bemühungen mit sich gebracht, die darauf abzielten, nach bioaktiven Peptiden zu suchen und alle so identifizierten zu testen. Es ist somit offensichtlich, dass ein Verfahren oder eine Technik benötigt wird, um die beste Konformation für ein Peptidarzneimittel vorherzusagen und, wenn es einmal gefunden ist, ein Mittel zum Aufrechterhalten dieser Konformation bereitzustellen, so dass es weiter getestet werden kann, z. B. auf Bioaktivität.

Der Prozess des Wirkstoffdesigns wird durch den metabolischen Abbau der Amidbindungen vieler Polypeptidketten weiter kompliziert. Das heißt, selbst unter der Annahme, dass ein gegebenes Peptidarzneimittel mit einer gewünschten Konformation identifiziert wird und weiter angenommen wird, dass diese gewünschte Konformation aufrechterhalten werden kann, können die tatsächlichen Peptidbindungen, die die Aminosäurereste in der Peptidkette verbinden, auseinanderbrechen, wenn das Peptidarzneimittel oral verabreicht wird . Sobald solche Bindungen aufgebrochen sind, bleiben nur noch Teile (Einheiten) der Polypeptidkette übrig, die nicht die erforderliche Konformation für das Peptidarzneimittel bereitstellen, um seine beabsichtigte Aufgabe zu erfüllen (dh der "Schlüssel" ist auseinandergebrochen und ein gebrochener Schlüssel) kann das Schloss nicht entriegeln). Daher wird ein Verfahren oder eine Technik benötigt, um zu verhindern, dass die Amidbindungen eines Peptidarzneimittels abgebaut werden, bevor die gewünschte Wirkung bei der Verabreichung des Peptidarzneimittels erzielt wird. Mit anderen Worten, es ist erwünscht, dass das Peptidarzneimittel in seiner aktiven Form überlebt, bis es die Stelle erreicht, an der es seine biologische Wirkung ausübt.

Im Stand der Technik sind mehrere Techniken bekannt, um die obigen Probleme anzugehen. Zum Beispiel ist es auf dem Gebiet des Arzneimitteldesigns bekannt, nach einer Ersatzverbindung zu suchen, die die Konformation und wünschenswerte Merkmale eines bestimmten Peptids, z. Flexibilität (Verlust der Konformation) und Bindungsbruch. Eine solche Verbindung, die ein Peptid nachahmt, ist als "Peptidomimetikum" bekannt. Morphin ist beispielsweise eine Verbindung, die oral verabreicht werden kann und die ein Peptidomimetikum des Peptid-Endorphins ist. Bisher wurde jedoch bei diesen Versuchen nur von begrenztem Erfolg berichtet, hauptsächlich weil es so schwierig war, den gewünschten Ausgangspunkt zu identifizieren, d. h. die Konformation des bestimmten Oligopeptids oder anderen Peptids, das nachgeahmt werden soll. Siehe z. B. Spatola, A. F. Chemistry and Biochemistry of Amino Acids. Peptides and Proteins (Weistein, B, Hrsg.), Vol. 2, No. 7, S. 267-357, Marcel Dekker, New York (1983), das die Verwendung des Methylenthiobioisosters [CH2 S] als Amidersatz in Enkephalin-Analoga und Szelke et al., In Peptide: Structure and Function, Proceedings of the Eighth American Peptide Symposium, (Hruby and Rich, Eds.) S. 579-582, Pierce Chemical Co., Rockford , Ill. (1983), das Renin-Inhibitoren beschreibt, die sowohl das Methylenamino [CH&sub2;2 NH] und Hydroxyethylen [CHOHCH2 ] Bioisostere an der Leu-Val-Amidbindung im 6-13 Octapeptid, das von Angiotensinogen abgeleitet ist. Daher ist ein rationaler Ansatz erforderlich, um den wahrscheinlichsten Ausgangspunkt für das Design eines bioaktiven Peptidomimetikums zu identifizieren.

Es ist im Stand der Technik auch bekannt, Computersimulationen zu verwenden, um eine stabile Konformation eines Peptids vorherzusagen. Das heißt, da ein Peptid eine Sequenz von Aminosäureresten ist, von denen jeder bekannte Atome enthält, die in bekannten Molekülen mit bekannten Bindungslängen miteinander verbunden sind, mit bekannten elektrostatischen Eigenschaften, die jedem Atom zugeordnet sind, ist es möglich, eine Peptidstruktur auf dem Computer zu simulieren. Die Schwierigkeit bei solchen Computersimulationen war jedoch bis heute die Neigung solcher Simulationen, nur "lokale minimale" Konformationen des betreffenden Peptids zu identifizieren, da die wahrscheinlichste Konformation des Peptids außerhalb einiger der Parameter liegen kann, die zum Zwecke der Übertragung angenommen werden die Simulationsrechnungen aus. Darüber hinaus ist typischerweise ein enormer Rechenaufwand erforderlich, um alle möglichen Konformationsmöglichkeiten des Peptids systematisch zu untersuchen, insbesondere wenn mehr als nur ein kurzes Peptid simuliert wird.

Um die bei solchen Simulationen erforderliche Computerzeit zu verkürzen, ist es bekannt, einen Startpunkt anzugeben, z. B. eine gute Schätzung der Konformation des stabilen Peptids mit einer bekannten Aminosäuresequenz. Eine solche Schätzung kann auf bekannten Daten basieren, die z. B. unter Verwendung von Röntgenkristallographie erhalten wurden, oder wie unter Verwendung von Modellbildung dreidimensionaler Strukturen homologer Proteine ​​vorhergesagt, wenn die dreidimensionale Struktur von mindestens einem der Proteine ​​in der Struktur bekannt. Leider verkürzen solche "Anfangspunkte" zwar die für solche Simulationen erforderliche Computerzeit erheblich, verzerren aber auch die Endergebnisse. Häufig führen solche Simulationen dazu, dass nur ein "lokales Minimum" des vorhergesagten Peptids identifiziert wird, wobei die wahrscheinlichste stabile Konformation des Peptids unentdeckt bleibt. Was daher eindeutig benötigt wird, ist ein Verfahren und eine Technik zur Vorhersage der wahrscheinlichsten stabilen Peptidkonformationen unter Verwendung von Computersimulationen, die durchführbar sind und die Endergebnisse nicht verzerren.

Die vorliegende Erfindung geht vorteilhafterweise auf die obigen und andere mit der Arzneimittelentwicklung verbundene Bedürfnisse ein.

Gemäß einem Aspekt der vorliegenden Erfindung wird ein Verfahren zum rationalen Arzneimitteldesign bereitgestellt, das bioaktive Peptidomimetika identifiziert, die effektiv als Arzneimittel verwendet werden können. Ein solches Verfahren umfasst: (a) Simulieren der wahrscheinlichsten Konformationen eines gegebenen Polypeptids (b) Auswählen der wahrscheinlichsten Konformation der so simulierten Peptide (c) Entwerfen und Synthetisieren eines chemisch modifizierten Analogs des ausgewählten Peptids (d) Bewerten der Bioaktivität von des synthetisierten chemisch modifizierten Analogs und gegebenenfalls (e) Entwerfen eines geeigneten Peptidomimetikums basierend auf der Konformation des synthetisierten chemisch modifizierten Analogs. Wie hier verwendet, bezieht sich der Begriff "chemisch modifiziertes Analogon" auf ein synthetisches Peptid oder eine peptidähnliche Verbindung, die relativ zum Ausgangspeptid verändert wurde, um die chemische Stabilität des Peptids zu verändern (z. B. die metabolische Stabilität zu erhöhen). , um die pharmakokinetischen Eigenschaften des Peptids zu verbessern (z. B. um die Absorption, Verteilung und/oder Elimination des Peptids zu erhöhen), um die Wirksamkeit des Peptids zu erhöhen, um die Bioverfügbarkeit des Peptids zu erhöhen, um die Leichtigkeit der Synthese von besagtem . zu verbessern Peptid, und/oder um die Leichtigkeit der Verabreichung des Peptids zu verbessern.

Gemäß einem anderen Aspekt der Erfindung wird ein Verfahren zum Vorhersagen der wahrscheinlichsten Tertiärstruktur eines Peptids bereitgestellt, ohne jegliche Annahme hinsichtlich der zugrunde liegenden strukturellen Eigenschaften des Peptids. Ein solches Verfahren wird hier als "ab-initio"-Verfahren bezeichnet, wobei der Begriff verwendet wird, um hervorzuheben, dass keine anfänglichen Annahmen darüber getroffen werden, welche Form die simulierte Tertiärstruktur letztendlich annehmen kann. Somit kann dieses Verfahren in Abwesenheit von physikalischen oder chemischen Daten, die andernfalls die wahrscheinlichste Konformation eines interessierenden Peptids anzeigen könnten, vorteilhafterweise als erster Schritt des hier beschriebenen rationalen Wirkstoffdesignverfahrens verwendet werden.

Die von der vorliegenden Erfindung verwendete Ab-initio-Technik umfasst die Schritte: (a) Simulieren einer Primärstruktur eines Polypeptids in echter Größe in einer Lösungsmittelbox (z. B. in einer wässrigen Umgebung) (b) isobares Schrumpfen der Größe des Peptids und isotherm und (c) Expandieren des Peptids auf seine reale Größe und darüber hinaus in ausgewählten Zeiträumen, während der Energiezustand und die Koordinaten, zB die -, -Winkel, des/der expandierenden Moleküls(e) gemessen werden. Wenn sich das Peptid zu seiner vollen Größe und darüber hinaus ausdehnt, nimmt es eine stabile Tertiärstruktur an. In den meisten Fällen ist diese Tertiärstruktur aufgrund der Art und Weise, in der die Expansion auftritt, entweder die wahrscheinlichste Struktur (d. h. stellt ein globales Minimum für die Struktur dar) oder eine der wahrscheinlichsten Strukturen. In jedem Fall liefert eine Wiederholung der Ab-initio-Technik und/oder eine weitere Analyse der so erhaltenen Tertiärstruktur, z. B. unter Verwendung von Konformationsenergie-Diagrammen und/oder Balaji-Diagrammen, wie nachstehend beschrieben, ein weiteres Maß für die Wahrscheinlichkeit des Auftretens der Struktur.

Vorteilhafterweise können drei Protokolle der Ab-initio-Technik der Erfindung selektiv praktiziert werden. In einem ersten Protokoll werden die Reste der Peptidkette geschrumpft und dann nacheinander erweitert. In einem zweiten Protokoll wird die gesamte Peptidkette gleichzeitig geschrumpft und erweitert. In einem dritten Protokoll werden, falls vorhanden, bekannte physikalische und/oder chemische Daten verwendet, um die Simulation auf ein bekanntes Ergebnis hin auszurichten.

Noch ein weiterer Aspekt der Erfindung stellt neue analytische Werkzeuge oder Verfahren bereit, um die Analyse und das Verständnis der komplexen dreidimensionalen Tertiärstrukturen von Polypeptiden oder Peptidomimetika stark zu vereinfachen. Ein neues analytisches Werkzeug wird hier als "Balaji-Diagramm" bezeichnet und bietet eine signifikante Verbesserung gegenüber ähnlichen Werkzeugen oder Diagrammen, die in der Technik bekannt sind. Vorteilhafterweise werden die zum Generieren des "Balaji-Plots" erforderlichen Daten automatisch erzeugt, während das Ab-initio-Verfahren der Erfindung durchgeführt wird, oder können aus anderen Quellen erhalten werden. Diese Daten umfassen die , -Winkel für jeden Rest des Peptids, wenn es sich auf seine normale Größe und darüber hinaus ausdehnt. Das Balaji-Diagramm wird verwendet für: (a) Identifizierung der relativen proportionalen Verweilzeit, die von einer bestimmten Tertiärstruktur eines simulierten Peptids oder Peptidomimetikums angenommen wird, (b) Bestimmen von Sequenzen oder Bereichen der Flexibilität und Starrheit in solchen Peptiden oder Peptidomimetika und (c) Bereitstellen von Anweisungen und/oder Einblick in die Art und Weise, in der starre, eingeschränkte oder flexible Peptidanaloga modelliert werden sollten, z. B. durch Computergenerierung. Der Balaji-Plot stellt somit ein wertvolles Werkzeug dar, das verwendet werden kann, um die Schritte des Auswählens der wahrscheinlichsten Peptidkonformation und des Entwerfens und Synthetisierens eines chemisch modifizierten Analogs des ausgewählten Peptids gemäß dem hierin beschriebenen rationalen Arzneimitteldesignverfahren zu unterstützen.Andere analytische Werkzeuge, die zum Identifizieren der wahrscheinlichsten Tertiärstruktur eines Polypeptids nützlich sind, umfassen eine Konformationsenergiekarte und eine Konturwahrscheinlichkeitskarte, die beide unter Verwendung der hier beschriebenen Computersimulationstechnik erzeugt werden können.

Noch ein weiterer Aspekt der Erfindung stellt die Simulation des Wachstums oder der Expansion einer Proteinverbindung innerhalb einer Akzeptor-Bindungsstelle bereit, wenn die Akzeptor-Geometrie bekannt ist, aber die Art der Protein-Akzeptor-Bindung nicht bekannt ist, wodurch ein besseres Verständnis des Bindungsereignisses erleichtert wird und damit das rationale Wirkstoffdesign weiter verbessern.

Weiterhin umfasst die Erfindung eine Datenbank von Konformationsmerkmalen von eingeschränkten Peptiden sowie die Verfahren und Techniken für den Zugriff auf eine solche Datenbank zur Verwendung bei der Simulation von Peptidomimetika. Die Peptidomimetika werden beispielsweise durch Modifikation des Rückgrats und/oder der Seitenketten ausgewählter Zielpeptide simuliert.

Vorteilhafterweise kann jeder der Schritte des rationalen Arzneimitteldesignverfahrens der vorliegenden Erfindung als ein Schritt im gesamten Arzneimitteldesignverfahren der Erfindung oder als separate Prozeduren oder Prozesse unabhängig von den anderen Schritten zum Zweck der Bewertung von a . durchgeführt werden bestimmtes Peptid, Peptidomimetikum oder Gruppen davon. Zum Beispiel kann das Ab-initio-Verfahren der Erfindung, das als erster Schritt zum Simulieren der wahrscheinlichsten Konformation eines Peptids verwendet wird, auch verwendet werden, um ein beliebiges Peptid zu simulieren, ob kurz oder lang. Ferner kann eine solche Simulation verwendet werden, um eine Datenbank mit wahrscheinlichen Konformationen für einen Satz von interessierenden Peptiden aufzubauen.

In ähnlicher Weise kann der zweite Schritt des Gesamtverfahrens, der die Auswahl der wahrscheinlichsten Konformation der simulierten Peptide betrifft, auch allein verwendet werden, um die bereits vorhandenen Peptiddaten zu untersuchen, um zu bestimmen, welche der mehreren möglichen Konformationen die wahrscheinlichste ist. welche der Amidbindungen eines definierten Peptids die flexibelste ist und welche der Amidbindungen daher möglicherweise durch ein starreres Bioisoster ersetzt werden kann, um eine stabilere Konformation bereitzustellen.

Vorteilhafterweise können alle Peptid- oder Peptidomimetik-Simulationen, die gemäß der vorliegenden Erfindung durchgeführt werden, von Fachleuten leicht unter Verwendung eines Computers durchgeführt werden. Aufgrund der großen Anzahl der beteiligten Berechnungen ist es bevorzugt, dass der Computer ein "Supercomputer" ist, z. B. ein Computer mit einem großen Speicher und in der Lage, Berechnungen mit hoher Geschwindigkeit unter Verwendung von Parallelverarbeitung durchzuführen. Jedoch kann jeder Computer oder jedes Verarbeitungssystem, das in der Lage ist, die erforderlichen Berechnungen und Berechnungen einzeln durchzuführen, verwendet werden, um die Ausführung der vorliegenden Erfindung zu unterstützen.

Es ist somit ein Merkmal der vorliegenden Erfindung, ein Verfahren zum rationalen Arzneimitteldesign bereitzustellen, das die oben im "Hintergrund der Erfindung" erwähnten Probleme, die mit Arzneimitteldesignverfahren des Standes der Technik verbunden sind, überwindet oder minimiert.

Es ist ein weiteres Merkmal der Erfindung, ein Verfahren zum rationalen Arzneimitteldesign bereitzustellen, das bioaktive Peptidomimetika identifiziert, die effektiv als Arzneimittel verwendet werden können.

Es ist ein weiteres Merkmal der Erfindung, ein Simulationsverfahren bereitzustellen, das die wahrscheinlichste(n) Tertiärstruktur(en) eines Polypeptids, z. B. eines Oligopeptids, vorhersagt, wie durch die Rückgratstruktur einer Primär- oder Sekundärstruktur definiert.

Noch ein weiteres Merkmal der Erfindung stellt analytische Werkzeuge bereit, um leicht diejenigen Teile einer vorhergesagten Peptidstruktur zu identifizieren, die am flexibelsten und/oder am meisten chemisch modifiziert sind, und die zusätzliche Einblicke in das Verständnis von tertiären und quartären Peptidstrukturen liefert.

Noch ein weiteres Merkmal der Erfindung ermöglicht es, die flexiblen Abschnitte der Struktur durch geeignete Bioisostere oder Äquivalente zu ersetzen, so dass eine gewünschte Konformation, einmal vorhergesagt, aufrechterhalten werden kann. Wie hierin verwendet, bezieht sich der Begriff "Bioisostere" auf Atome oder Atomgruppen, die eine ähnliche Größe wie das Atom oder die Atomgruppe haben, die ersetzt werden sollen, wobei die Verbindung, die das Ersatzatom oder die Atomgruppe enthält, eine wesentliche Grad, die biologische Aktivität des ursprünglichen, unmodifizierten Peptids. Siehe zum Beispiel Nelson, Mautner und Kuntz, auf den Seiten 227, 271 bzw. 285, in Burger's Medicinal Chemistry, Part 1, the Basis of Medicinal Chemistry, 4. Auflage, M. E. Wolff, Hrsg. (John Wiley & Sons, N. Y., 1980).

Weiterhin ist es ein Merkmal der Erfindung, dass beliebige Teile oder Abschnitte der Peptidstruktur, die bei der Verabreichung des Peptids einem Abbau unterliegen, gleichermaßen durch Bioisostere oder Äquivalente ersetzt werden können, die nicht abgebaut werden und die die gewünschte Bindung beibehalten.

Es ist noch ein weiteres Merkmal der Erfindung, ein Arzneimittelsimulationsverfahren und -system bereitzustellen, die unter Verwendung eines Computers durchgeführt werden können.

Es ist noch ein weiteres Merkmal der Erfindung, ein Mittel zum Identifizieren des wahrscheinlichsten Ausgangspunkts für das Design einer bioaktiven peptidomimetischen Verbindung bereitzustellen.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Die obigen und andere Aspekte, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden genaueren Beschreibung davon ersichtlich, die in Verbindung mit den folgenden Zeichnungen dargestellt wird und wobei:

FIG. 1, 2A, 2B, 2C, 3A, 3B und 3C wurden oben in Verbindung mit dem Abschnitt "Hintergrund der Erfindung" der Anmeldung beschrieben, wobei sie verwendet wurden, um bei der Beschreibung und Definition verschiedener Merkmale, Parameter, Strukturen und Eigenschaften von Peptiden zu helfen und Polypeptidketten. Genauer:

FEIGE. 1 zeigt die chemische Darstellung einer typischen kurzen Peptidkette,

FEIGE. 2A veranschaulicht die planare Amidbindung in einem Peptid,

FEIGE. 2B veranschaulicht diejenigen Teile einer Peptidkette, die innerhalb der Amidebene eingeschränkt sind, und veranschaulicht ferner, wie sich solche Ebenen an den C α -Atomen der Peptidkette verbinden.

FEIGE. 2C definiert die φ, ψ-Winkel eines bestimmten Aminosäurerestes innerhalb der Peptidkette,

FEIGE. 3A zeigt eine Peptidkette in einer helikalen Struktur und ist repräsentativ für eine Sekundärstruktur,

FEIGE. 3B veranschaulicht schematisch die komplexe, dreidimensionale Form einer Tertiärstruktur, und

FEIGE. 3C ist eine schematische Darstellung einer quaternären Struktur.

FEIGE. 4 ist ein Flussdiagramm des rationalen Arzneimitteldesignverfahrens der vorliegenden Erfindung

FIG. 5A, 5B und 5C sind Flussdiagramme, die zusätzliche Details bezüglich des Ab-initio-Simulationsprozesses der Erfindung liefern

FEIGE. 6 ist ein Blockdiagramm eines Verarbeitungssystems, das verwendet wird, um die Simulationsverfahren und -techniken der vorliegenden Erfindung auszuführen

FEIGE. 7A ist ein Flussdiagramm, das ein bevorzugtes Verfahren zum Auswählen der wahrscheinlichsten Konformation für eine Tertiärstruktur veranschaulicht

FEIGE. 7B ist eine grafische Darstellung einer dreidimensionalen Peptidstruktur, die Poly-L-Alanin veranschaulicht

FEIGE. 8A ist ein Balaji-Diagramm eines repräsentativen Oligopeptids, das die Verwendung eines Keils für jeden Rest zeigt, um die φ-, -Werte darzustellen, wobei die Basis des Keils dem φ-Winkel entspricht und die Spitze des Keils dem ψ-Winkel entspricht

FIG. 8B und 8C zeigen Balaji-Diagramme für die Zeit T und T + t für ein repräsentatives Oligopeptid, das gemäß den Simulationstechniken der vorliegenden Erfindung expandiert wurde

FEIGE. 8D zeigt ein Balaji-Diagramm der Differenz zwischen den FIG. 8B und 8C

FEIGE. 8E zeigt schematisch ein komplexes gefaltetes Polypeptid

FEIGE. 8F zeigt schematisch das Polypeptid von FIG. 8E im ausgeklappten Zustand

FEIGE. 9A zeigt eine repräsentative Konformationsenergiekarte eines Oligopeptids, wie sie durch Computersimulation gemäß der vorliegenden Erfindung erzeugt wurde

FEIGE. 9B stellt Konturwahrscheinlichkeitsdaten für eine Modellverbindung dar, wie sie durch die vorliegende Erfindung erzeugt wird

FEIGE. 10 zeigt eine Art und Weise zum Entwerfen und Synthetisieren von starren oder anderweitig chemisch modifizierten Analoga gemäß der vorliegenden Erfindung

FEIGE. 11 zeigt grafische Darstellungen von dreidimensionalen Peptidstrukturen bezogen auf Beispiel 1

FEIGE. 12 zeigt eine Konformationsenergiekarte für ein Cyclopropyldipeptid

______________________________________
Globales Minimum tritt bei θ . auf1,2 = 70°, -90° (Energie = 28,3 kcal/mol) min. θ1 θ2 # (°) (°)
______________________________________

1 70 -90 0.0
2 -70 90 0.0
3 60 50 0.2
4 -60 -50 0.2
5 70 -170 0.4
6 -70 170 0.4
7 -180 -70 1.5
8 -180 70 1.5
9 180 -70 1.5
10 180 70 1.5
11 180 -180 2.3
12 -180 180 2.3
13 180 180 2.3
14 -180 -180 2.3
______________________________________

Prozentuale Besetzung der
1 bis 5 kcal/mol Energie
Konturen im1,2 Platz
abgeleitet von der Konformation
Energiekarte:
9 26 43 60 77
Linienstärke von Konturen
kodiert nach Energie
(am dicksten = 1 und am dünnsten = 5).
Schattierte Bereiche entsprechen
Energie >6,5 kcal/mol.
______________________________________

10 Relative Energie in kcal/mol (globales Minimum auf 0.0 eingestellt).

FEIGE. 13A zeigt eine Konformationsenergiekarte für ein L-Alanyldithiopeptid

FEIGE. 13B ist eine Reihe von Balaji-Plots von Poly-L-Alanin, wie es Rückstand für Rückstand gezüchtet wird

FEIGE. 14 ist ein Balaji-Diagramm von Polyglycin

FEIGE. 15 ist ein Balaji-Diagramm von Poly-L-Prolin

FEIGE. 15A ist eine grafische Anzeige, die eine dreidimensionale Peptidstruktur zeigt, die für Poly-L-prolin berechnet wurde

FEIGE. 16 ist ein Balaji-Diagramm von poly(Aib)

FEIGE. 17 ist ein Balaji-Diagramm von Poly-L-Leucin

FEIGE. 17A ist eine grafische Anzeige, die eine dreidimensionale Peptidstruktur zeigt, die für Poly-L-leucin berechnet wurde

FEIGE. 18 ist ein Balaji-Diagramm von Poly-L-Isoleucin

FEIGE. 18A ist eine grafische Anzeige, die eine dreidimensionale Peptidstruktur zeigt, die für Poly-L-Isoleucin berechnet wurde.

FEIGE. 19 ist ein Balaji-Plot von Poly-L-Serin

FEIGE. 20 ist ein Balaji-Plot von Poly-L-Histidin

FEIGE. 21 ist ein Balaji-Diagramm von Poly-L-phenylalanin

FEIGE. 22 ist ein Balaji-Diagramm von Poly-L-Asparaginsäure und

FIG. 23A – 23G sind Flussdiagramme eines Batch-Computerprogramms, das verwendet wird, um das Ab-initio-Verfahren der vorliegenden Erfindung auszuführen.

DETAILLIERTE BESCHREIBUNG DER ERFINDUNG

Die folgende Beschreibung enthält die beste Art und Weise, die derzeit zur Ausführung der Erfindung in Betracht gezogen wird. Diese Beschreibung ist nicht einschränkend zu verstehen, sondern dient lediglich der Beschreibung der allgemeinen Prinzipien der Erfindung. Der Umfang der Erfindung sollte unter Bezugnahme auf die Ansprüche bestimmt werden.

Zu Beginn sollte angemerkt werden, dass es mehrere Wege gibt, die beim rationalen Design von Arzneimitteln verfolgt werden können, und insbesondere beim Design von peptidomimetischen Analoga eines Zielpeptids. Wie hierin verwendet, werden die Begriffe "Rezeptor" und "Ziel" verwendet, um sich allgemein auf Verbindungen zu beziehen, die als Grundlage für die Struktur- und Konformationsmodellierung gemß der vorliegenden Erfindung verwendet werden. Die Kategorien der verfügbaren Daten, die für die Entwicklung von Peptidomimetika nützlich sind, können wie folgt klassifiziert werden:

(a) die Rezeptorgeometrie und aktive Konformation des Peptids ist bekannt, dh die Konformation des Zielpeptids ist bekannt, wenn es an den Rezeptor gebunden ist, wie entdeckt, z. B. durch Verfahren wie Röntgenkristallographie oder NMR (Nuclear Magnetic Resonanz)

(b) die Rezeptorgeometrie bekannt ist, aber die spezifische bioaktive (oder bindende) Konformation des Peptids in Bezug auf den Rezeptor unbekannt ist und

(c) nur die Sequenz des Zielpeptids ist bekannt und die Rezeptorgeometrie ist unbekannt.

Wie oben angegeben, können unterschiedliche Informationsmengen bezüglich der Peptide verfügbar sein, die als geeignet für die Manipulation gemäß der vorliegenden Erfindung betrachtet werden. Die Aminosäuresequenzen solcher Peptide können aus einer Vielzahl von Quellen stammen, z. B. direkte Sequenzierung von Verbindungen bekannter biologischer Aktivität, Anwendung molekularbiologischer Techniken usw.

Es wurden Protokolle erstellt, um die bioaktive Konformation in jedem der drei beschriebenen Fälle zu bestimmen. Diese Protokolle haben eine gewisse Anwendbarkeit auf die Verfahren der vorliegenden Erfindung und werden daher kurz beschrieben. Die Verfahren der vorliegenden Erfindung sind am besten auf die Fälle (b) und (c) anwendbar.

Fall (a): Wenn die dreidimensionale Struktur des Rezeptors (z. B. Enzym) und seine spezifische Wechselwirkung mit dem Zielpeptid bekannt sind, kann eine Datenbank mit eingeschränkten metabolisch stabilen Nicht-Peptid-Einheiten verwendet werden, um geeignete zu suchen und vorzuschlagen Analoga für das Zielpeptid. Das heißt, eine Suche kann in einer dreidimensionalen Datenbank nach Nicht-Peptid-(organischen) Strukturen (z. B. Nicht-Peptid-Analoga und/oder Dipeptid-Analoga) mit dreidimensionaler Ähnlichkeit mit der bekannten Struktur der Zielverbindung durchgeführt werden. Siehe z. B. die Cambridge Crystal Structure Data Base, Crystallographic Data Center, Lensfield Road, Cambridge, CB2 1EW, England und Allen, F.H., et al., Acta Crystallogr., B35: 2331-2339 (1979).

Alternativ können dreidimensionale Strukturen herangezogen werden, die mit anderen Mitteln wie der Molekularmechanik erzeugt wurden. Siehe z. B. Burkert et al., Molecular Mechanics, American Chemical Society, Washington, D. C. (1982) und Weiner et al., J. Am. Chem.-Nr. Soc., 106(3): 765-84 (Eng.) (1984).

Es wird darauf hingewiesen, dass in der Literatur Suchalgorithmen für dreidimensionale Datenbankvergleiche verfügbar sind. Siehe z. B. Cooper et al., J. Comput.-Aided Mol. Design, 3: 253–259 (1989) und darin zitierte Referenzen Brent et al., J. Comput.-Aided Mol. Design, 2: 311-310 (1988) und darin zitierte Referenzen. Kommerzielle Software für solche Suchen ist auch von Anbietern wie Day Light Information Systems, Inc., Irvine, CA 92714, und Molecular Design Limited, 2132 Faralton Drive, San Leandro, CA 94577, erhältlich. Die Suche erfolgt auf systematische Weise durch Simulieren oder Synthetisieren von Analoga mit einer Ersatzeinheit auf jeder Restebene. Vorzugsweise wird darauf geachtet, dass der Austausch von Teilen des Rückgrats die Tertiärstruktur nicht stört und dass die Seitenkettensubstitutionen kompatibel sind, um die Rezeptor-Substrat-Wechselwirkungen beizubehalten.

Die Synthese und biologische Bewertung einer Reihe solcher Verbindungen erfolgt auf herkömmliche Weise, und dann kann eine iterative Verfeinerung des Peptidomimetikums (im Fall eines eingeschränkten Analogs selbst) durchgeführt werden.

Fall (b): Wenn die Rezeptorgeometrie bekannt ist, z. B. aus Röntgenkristallographie oder durch Homologiemodellbildung, aber die Art und Weise, in der das Zielpeptid mit dem Rezeptor interagiert, nicht bekannt ist, kann die Modellierung des Peptids durchgeführt werden in der Umgebung der Bindungsstelle des Rezeptors und die dadurch identifizierte bioaktive oder bindende Konformation des Peptids. Dies kann weiter untermauert werden, indem chemisch modifizierte Analoga dieser anfänglichen Bindungskonformation entworfen werden, die unter Verwendung der Schritte, wie in Fall (a) beschrieben, erhalten wurde. Vorteilhafterweise erleichtern die Ab-initio-Verfahren der vorliegenden Erfindung dieses Verfahren.

Fall (c): Wenn die Rezeptorgeometrie nicht bekannt ist und nur die Ziel-Oligopeptidsequenz bekannt ist, werden die wahrscheinlichsten Konformationen des Oligopeptids simuliert, z. B. durch molekulardynamische Verfahren und durch Durchsuchen einer Datenbank von eingeschränkten Peptidanaloga. Sobald die wahrscheinlichsten Konformationen identifiziert wurden, werden sie verwendet, um Analoga vorzuschlagen, die die wahrscheinlichen Konformationen an jedem Rest nachahmen.

Eine Bewertung der biologischen Aktivität (oder der Bindungsaffinitätsdaten – falls zutreffend) und die Verwendung eines iterativen Ansatzes (einschließlich Aktivitäts- und Inaktivitätsprofilen von starren oder anderweitig chemisch modifizierten Analoga bewertet) wird dann verwendet, um die bioaktive Konformation zu identifizieren. Diese bioaktive Konformation kann dann optional verwendet werden, um Peptidomimetika zu entwerfen oder eine dreidimensionale Datenbank organischer Strukturen zu durchsuchen, um potenzielle Peptidomimetika vorzuschlagen. Auch in diesem Fall ist die Ab-initio-Technik der Erfindung besonders nützlich, ebenso wie die hier beschriebenen Konformationsenergiekarten und Balaji-Plots.

Rationales Arzneimitteldesign – Ein Überblick

Bezugnehmend auf FIG. 4 gibt ein Flussdiagramm einen Überblick über die Hauptschritte des rationalen Arzneimitteldesignverfahrens der vorliegenden Erfindung. Jeder im Flussdiagramm enthaltene Schritt oder Prozess wird kurz in einem "Kasten" oder "Block" des Flussdiagramms beschrieben. Im Folgenden wird auf einen bestimmten Block des Flussdiagramms durch das daran angebrachte Bezugszeichen Bezug genommen.

Wie in FIG. 4 umfasst das Gesamtverfahren der vorliegenden Erfindung die folgenden Schritte:

(a) Simulieren der wahrscheinlichsten Konformationen eines gegebenen Polypeptids (Block 20)

(b) Auswählen der wahrscheinlichsten Konformation der so simulierten Peptide (Block 22)

(c) Entwerfen und Synthetisieren eines chemisch modifizierten Analogs des ausgewählten Peptids (Block 24)

(d) Bewerten der Bioaktivität des synthetisierten chemisch modifizierten Analogons des ausgewählten Peptids (Blöcke 26 und 28) und danach optional

(e) Entwerfen eines geeigneten Peptidomimetikums basierend auf der Konformation des synthetisierten chemisch modifizierten Analogs des ausgewählten Peptids (Block 36).

Es wird darauf hingewiesen, dass bei der Durchführung von Schritt (d) ein geeignetes Peptidomimetikum identifiziert werden kann und daher möglicherweise keine Notwendigkeit besteht, Schritt (e) durchzuführen. Selbst wenn Schritt (d) jedoch kein geeignetes Peptidomimetikum ergibt, können die Ergebnisse von Schritt (d) dennoch nützliche Daten für den Beginn von Schritt (e) oder für andere Zwecke liefern. Daher sollte der obige Schritt (e) als ein optionaler Schritt betrachtet werden, der als Teil des hierin offenbarten Arzneimitteldesignverfahrens durchgeführt werden kann, jedoch nicht als ein wesentlicher Schritt.

Bei der Durchführung des in FIG. In 4 ist zu beachten, dass, wenn das chemisch modifizierte Analog des ausgewählten Peptids nicht bioaktiv ist (Block 28), wie durch geeignete Tests bestimmt, dann ein zusätzlicher Schritt (Block 30) die Bestimmung betrifft, ob andere chemisch modifizierte Analoga dafür entworfen werden sollten das gleiche ausgewählte Peptid. Wenn dies der Fall ist, wird ein anderes chemisch modifiziertes Analogon für das ausgewählte Peptid entworfen (Block 32) und die Bioaktivität dieses neu entworfenen chemisch modifizierten Analogons wird bewertet (Block 26). Wenn festgestellt wird, dass kein anderes chemisch modifiziertes Analogon für dasselbe Peptid entworfen werden sollte, dann wird die nächstwahrscheinlichste Konformation des simulierten Peptids ausgewählt (Block 34), und ein chemisch modifiziertes Analogon wird für ein solches ausgewähltes Peptid entworfen und synthetisiert ( Block 24), und der Vorgang wird wiederholt.

Eine detailliertere Beschreibung jedes der Schritte, die im Flussdiagramm von FIG. 4 wird als nächstes vorgestellt.

Simulation der wahrscheinlichsten Konformationen

Der erste Schritt des Gesamtverfahrens (Block 20 in Fig. 4) besteht darin, die wahrscheinlichsten Konformationen eines gegebenen Polypeptids zu simulieren. Die bevorzugte Art und Weise zur Durchführung dieses Schrittes besteht darin, das zuvor erwähnte Ab-initio-Verfahren zu verwenden. Dieser Ab-initio-Prozess beinhaltet (a) die Simulation einer Primärstruktur eines Polypeptids in realer Größe in einer Lösungsmittelbox (z. B. in einer wässrigen Umgebung, wie unten definiert), (b) die Größe des Peptids isobar und isotherm zu schrumpfen und (c) zu expandieren das Peptid in ausgewählten Zeiträumen auf und über seine reale Größe hinaus, während der Energiezustand und die Koordinaten, z. B. die -, -Winkel des expandierenden Moleküls bzw. der expandierenden Moleküle gemessen werden.

Das Schrumpfen und Expandieren des simulierten Peptids wird natürlich auch mit einem geeigneten Computer simuliert.Die Simulation erfolgt durch Spezifizieren der chemischen und physikalischen Parameter der Peptidkette zur Verwendung durch das Computersimulationsprogramm. Solche Parameter umfassen eine Definition der speziellen Atome und/oder Atomgruppen, die in jedem Rest der Peptidkette vorhanden sind. Physikalische Daten, die mit jedem Atom und/oder jeder Gruppe von Atomen verbunden sind, z. B. einschließlich Bindungslängen und elektrische Kräfte, die mit dem bestimmten Atom und/oder Molekül verbunden sind, sind in der Literatur gut dokumentiert. Siehe z. B. Weiner et al., in J. Comput. Chem.-Nr. 7: 230-252 (1986) und Weiner et al., in J. Am. Chem.-Nr. Soz. 106: 765-784 (1984).

Vorzugsweise sind die Simulationsdaten nach jedem Aminosäurerest der Peptidkette organisiert. Da nur eine begrenzte Anzahl von Aminosäuren in einer natürlich vorkommenden Peptidkette vorkommen kann (d. h. zwanzig), wird die anfängliche Dateneingabe in den Computer für die Berechnung natürlich vorkommender Peptidketten stark vereinfacht. Das heißt, ein Datensatz für jeden möglichen Aminosäurerest wird gesammelt und zum leichten Abrufen im Simulationsprogramm gespeichert. Ein repräsentativer Aminosäuredatensatz ist in Tabelle C-1 gezeigt. Datensätze für alle natürlich vorkommenden Aminosäuren sowie D-Aminosäuren, synthetische Aminosäuren (z. B. Aib) und dergleichen sind im Mikrofiche-Anhang enthalten. Die anfängliche Dateneingabe in das Computersimulationsprogramm erfordert somit die Spezifikation der Anzahl der Reste in der primären Peptidstruktur und dann die Spezifizierung der speziellen Aminosäure, die durch jeden Rest repräsentiert wird. Das Simulationsprogramm ruft dann den geeigneten Datensatz für den spezifizierten Rest ab und gibt die erforderlichen Parameter dieses Rests in das Programm ein.

Der Datensatz für jede Aminosäure kann die Werte der φ-, -Winkel umfassen, die die Amidebenen jedes Rests relativ zum C α -Atom des Rests ausrichten. Wenn für diese Winkel chemische/physikalische Daten bekannt sind, können solche bekannten Daten verwendet werden, so dass die Simulation mit einer Konformation beginnt, die einer erwarteten Konformation nahe kommt. Wenn solche Daten jedoch nicht bekannt sind, können die Winkel , vorteilhafterweise einfach auf einen beliebigen Wert, z. B. Null, eingestellt werden. Daher besteht ein vorteilhaftes Merkmal des Ab-initio-Simulationsverfahrens der Erfindung darin, dass es keine Annahmen bezüglich einer bestimmten Konformation erfordert.

Chemische/physikalische Daten, die mit irgendwelchen anhängenden Gruppen (oder Seitenketten) des Peptids verbunden sind, werden in ähnlicher Weise auch in das Simulationsprogramm eingegeben. Da die anhängenden Gruppen, falls vorhanden, zahlreiche Formen annehmen können, ist der verwendete Datensatz typischerweise etwas umfassender als der Datensatz, der nur für die Aminosäurereste des Rückgrats des interessierenden Peptids verwendet wird. Die Daten der hängenden Gruppe können jedoch systematisch erweitert werden, indem auf bekannten Daten Atom für Atom aufgebaut wird, wie es für eine bestimmte Simulation erforderlich ist.

Bevor oder nachdem die Daten für die Primärstruktur des simulierten Peptids in das Simulationsprogramm eingegeben werden, werden auch ähnliche Daten eingegeben, die den Hintergrund oder die Umgebung angeben, in der das Peptid simuliert wird. Diese Umgebung ist vorzugsweise eine wässrige Umgebung, z. B. H&sub2;2 O oder ein anderes Lösungsmittel. Da diese Hintergrunddaten während der Simulation gleich bleiben, müssen sie nur einmal eingegeben werden.

Mit dem so definierten Hintergrundlösungsmittel und der Peptidkette ermöglicht das Simulationsprogramm, dass die verschiedenen in der Kette vorhandenen Moleküle gemäß den normalen elektrischen und/oder molekularen Kräften, die in solchen Molekülen vorhanden sind, miteinander wechselwirken. Die normale Wechselwirkung zwischen den Molekülen findet in Übereinstimmung mit wohldefinierten "molekularmechanischen" Kräften statt, die durch bekannte Energiegleichungen definiert sind. Molekularmechanik-Simulationspakete sind in der Technik bekannt. Ein Beispiel für ein Molekularmechanikpaket, das mit der vorliegenden Erfindung verwendet werden kann, ist das CONCORD-Programm, erhältlich von Evans and Sutherland Computer Corporation, Salt Lake City, Utah. Siehe auch Karplus, M. "Molecular Dynamics: Applications to Proteins" in Computer Simulation of Chemical and Bimolecular Systems, (Bevendge und Jorfensen, Hrsg.) Annals of the New York Acad. Wissenschaft, Bd. 482, S. 255-266 (1986) Weiner et al., "A New Force Field for Molecular Mechanical Simulation of Nucleic Acids and Proteins", J. Am. Chem.-Nr. Soc., Bd. 106(3), S. 765-784 (1984).

In Übereinstimmung mit solchen Simulationspaketen oder Äquivalenten (und es wird anerkannt, dass Fachleute ihre eigenen äquivalenten Simulationspakete für die Molekularmechanik erstellen könnten) weist jedes Ion, Atom und Molekül eine damit verbundene bekannte elektrische Ladung auf. Einige der Ladungen bewirken, dass die Atome oder Ionen voneinander angezogen werden, andere bewirken, dass die Atome oder Ionen voneinander abgestoßen werden. Die Bindungslängen zwischen den verschiedenen Ionen, Atomen und Molekülen jedes Rests sind definiert. Im Fall einer Peptidkette sind diese Moleküle in relativ starren Amidebenen angeordnet, die an "Drehpunkten" mit C α -Atomen verbunden sind, wie zuvor beschrieben. Als Reaktion auf die verschiedenen Anziehungs- und Abstoßungskräfte, die durch die speziellen vorhandenen Ionen, Atome und Moleküle aufgebaut werden, biegt und biegt sich die simulierte Peptidkette an den Drehpunkten und sucht eine stabile Konformation.

Um sicherzustellen, dass die wahrscheinlichste Konformation während dieses Ab-initio-Simulationsprozesses identifiziert wird, wird ein Schrumpf- und Wachstumsprozess aufgerufen, wie in dem Flussdiagramm von Fig. 4 gezeigt. 5A. Gemäß diesem Schrumpf- und Wachstumsprozess werden zusätzliche Parameter selektiv definiert, um ein gewünschtes Protokoll für den Prozess zu spezifizieren (Block 40 von 5A ). Sobald diese zusätzlichen Parameter spezifiziert sind, werden die anfänglichen Bindungslängen (d. h. diejenigen, die in den jeweiligen Aminosäuredatensätzen enthalten sind) auf einen spezifizierten Größenfaktor oder Prozentsatz ihrer normalen Größe herunterskaliert (Block 42 von 5A ). Dieser spezifizierte Größenfaktor wird durch das bestimmte ausgewählte Protokoll eingestellt (Block 40). Ein bevorzugter Größenfaktor beträgt 20 % (wie im Flussdiagramm bei Block 42 angegeben), obwohl auch andere Größenfaktoren verwendet werden könnten, z. B. 10 %, 15 %, 25 % oder 30 % oder je nach Wunsch jeder andere Wert.

Es wird darauf hingewiesen, dass nur die Bindungslängen der Atome im Peptidkettengerüst um den angegebenen Größenfaktor verkleinert werden. Die mit dem Hintergrundlösungsmittel verbundenen Bindungslängen bleiben bei ihrer normalen Größe.

Wenn die Bindungslängen auf den angegebenen Größenfaktor reduziert sind, wird eine Simulation der "modifizierten Molekularmechanik" aufgerufen (Block 44 von Fig. 5A). Diese modifizierte Molekularmechanik-Simulation ist die gleiche wie die konventionelle Molekularmechanik-Simulation, außer dass sie mit verkleinerten Bindungslängen auftritt. Da die Bindungslängen anfänglich kürzer sind, unterscheiden sich die wechselwirkenden molekularen Kräfte zwischen den verschiedenen geladenen Spezies und Atomen in der Peptidkette signifikant von denen bei Bindungslängen voller Größe.

Weiterhin ist anzumerken, dass die Verkleinerung der Bindungslängen sowohl isobar als auch isotherm erfolgt. Das heißt, mit der Verkleinerung der Bindungslängen werden auch die bei der Durchführung der molekularmechanischen Simulation verwendeten Umgebungsdruck- und Temperaturwerte entsprechend verkleinert.

Der Computer, der die molekularmechanische Simulation durchführt, arbeitet in Übereinstimmung mit programmierten Zyklen. In einem ersten Zyklus, der eine vorgeschriebene Anzahl von Computertaktzyklen umfasst, um eine vorgeschriebene Anzahl von Berechnungen abzuschließen (und daher eine gewisse Computerzeit erfordert), werden die molekularen Kräfte, die mit der dann aktuellen Position der Peptidmoleküle verbunden sind berechnet werden. Diese Kräfte interagieren mit dem Molekül gemäß einer bekannten Dynamik, um zu beginnen, sich zu bewegen oder die aktuelle Position der Moleküle in eine neue Position zu ändern. In einem zweiten Zyklus werden die gleichen Berechnungen neu berechnet, um die Kräfte zu bestimmen, die mit der neuen Position der Peptidmoleküle auf der Grundlage ihrer neuen Position verbunden sind, wobei die Kräfte interagieren, um die Moleküle zu einer noch neueren Position zu bewegen. Wie bei Block 44 von FIG. In 5A wird dieser Prozess für 500 Zyklen fortgesetzt oder bis die Energieänderung zwischen den Zyklen weniger als 0,001 Kcal/mol beträgt. (Eine Energieänderung zwischen den Zyklen von weniger als 0,001 Kcal/mol gilt als Hinweis auf das Erreichen einer stabilen Position der Moleküle.)

Die simulierten Moleküle verbleiben für einen vorgeschriebenen Zeitraum (Simulationszeit) auf der verkleinerten Größe, wie in Block 46 des Flussdiagramms von Fig. 4 angegeben. 5A. Während dieses Simulationszeitraums, der 100 bis 500 Pikosekunden betragen kann, erfährt das Molekül während des vorgeschriebenen Zeitraums jegliche Konformationsänderungen, die sich aus der modifizierten molekularmechanischen Simulation ergeben. Am Ende dieser Zeit können Werte von Schlüsselparametern der simulierten Peptidreste, z. B. die Winkel , , aufgezeichnet oder anderweitig notiert werden (Block 47).

Außerdem wird am Ende der 100 bis 500 Pikosekunden Simulationszeit bestimmt, ob die Struktur die normale Größe hat (Block 48). Falls nicht, wird die Struktur um 5 bis 10 % skaliert (Block 50) und die modifizierte Molekularmechanik-Simulation wiederholt (Block 44). Wenn festgestellt wird, dass die Struktur eine normale Größe hat, wird der Ab-initio-Wachstumsprozess beendet (Block 60). Nach Beendigung werden die mit dem Prozess verbundenen Wachstumsparameter, hauptsächlich die endgültigen -, -Winkel, aufgezeichnet und stehen für den nächsten Schritt des Arzneimitteldesignverfahrens zur Verfügung.

Unter Bezugnahme als nächstes auf FIG. In 5B ist ein Diagramm gezeigt, das weitere Details bezüglich der modifizierten Molekularmechanik-Simulation (durchgeführt bei Block 44 von 5A ) des Ab-initio-Simulationsverfahrens bereitstellt. Wie in FIG. In 5B gibt es drei Protokolle, die während der modifizierten Molekularmechanik verwendet werden können. Das jeweils verwendete Protokoll wird durch die Größe des Moleküls bestimmt. Daher wird beim Durchführen einer modifizierten molekularmechanischen Simulation (Block 44' in Fig. 5B) eine Bestimmung hinsichtlich der Größe des simulierten Moleküls durchgeführt (Block 64). Wenn die Größe die anfängliche skalierte Größe ist, auf die das Molekül geschrumpft wurde, z. B. 20 % seiner normalen Größe (oder eine andere ausgewählte Ausgangsgröße), werden ausgewählte Energieterme im Molekülmodell deaktiviert, wodurch das Modell eine größere bewegen und seine Konformation ändern. Diese "ausgeschalteten" Energieterme umfassen die Torsionsparameter der elektrostatischen Ladung, mit Ausnahme der Amidbindung (d. h. das simulierte Modell behält die Starrheit der Amidebene bei) und die abstoßenden und anziehenden Kraftkonstanten von Lennard Jones (LJ) (Block 66). Somit sind die einzigen verbleibenden Energieterme in diesem Anfangsstadium diejenigen, die mit der Amidebene und den Bindungen verbunden sind.

Wenn die Größe des simulierten Moleküls (Block 64) irgendwo zwischen seinem Anfangswert (zB 20 %) liegt, aber noch nicht gleich 100 % seiner normalen Größe ist, werden die Kraftkonstanten, die den in der Simulation verwendeten Energietermen zugeordnet sind, von ihre Anfangswerte (die null sein können) entweder auf lineare oder nichtlineare Weise, wenn die Größe des simulierten Moleküls von seiner Ausgangsgröße auf seine normale Größe anwächst (Block 68).

Wenn die Größe des simulierten Moleküls (Block 64) gleich seiner normalen Größe ist, d. h. 100 %, dann werden alle Parameter auf normale Größenwerte gesetzt (Block 70).

Für einige Anwendungen kann es wünschenswert sein, das simulierte Peptid über seine normale Größe hinaus weiter wachsen zu lassen, z. B. auf 110% seiner normalen Strukturgröße. Dadurch können zusätzliche Daten gesammelt werden, die weitere Einblicke in die Neigung der expandierenden Peptidkette geben, eine stabile Konformation zu suchen.

Wie zuvor angegeben, nimmt das Peptid, wenn es sich auf seine volle Größe und darüber hinaus ausdehnt, eine stabile Tertiärstruktur an. In den meisten Fällen ist diese Tertiärstruktur aufgrund der Art und Weise, in der die Expansion erfolgt, entweder die wahrscheinlichste Struktur (dh sie stellt ein globales Minimum für die Struktur dar) oder, falls es mehr als ein relativ stabiles lokales Minima gibt , eine der wahrscheinlichsten Strukturen. Je nach Wunsch oder Bedarf liefert eine Wiederholung der Ab-initio-Technik und/oder eine weitere Analyse der so erhaltenen Tertiärstruktur, z .

Es gibt auch drei Protokolle, die mit der Art und Weise verbunden sind, in der das Schrumpfen und Wachsen des simulierten Moleküls des Ab-initio-Verfahrens praktiziert werden kann. In einem ersten Protokoll werden die Reste der Peptidkette geschrumpft und dann nacheinander erweitert. Das heißt, der erste Rest der Kette wird in die Lösungsmittelbox gelegt, geschrumpft und von selbst expandiert. Wenn nur ein einzelner Rest vorhanden ist, gibt es bei der simulierten Expansion nur eine geringe Wechselwirkung mit anderen Molekülen, da außer dem umgebenden Lösungsmittel keine anderen Atome vorhanden sind. Es treten jedoch einige Wechselwirkungen innerhalb des Rückstands und des Hintergrundlösungsmittels auf, die die φ, ψ-Winkel geringfügig beeinflussen können, wodurch einige Daten bereitgestellt werden. Der zweite Rest der Kette wird dann in die Lösungsmittelbox gegeben, an den ersten Rest gekoppelt, geschrumpft und expandiert, während der erste Rest seine normale Größe behält. Dieser Vorgang wird für den dritten Rest der Peptidkette wiederholt, und so weiter, durch alle Reste, wobei jeder neu hinzugefügte Rest der Kette für sich selbst geschrumpft wird (ohne die vorherigen Reste zu schrumpfen) und dann von selbst in der wächst Umgebung des Hintergrunds und vorherige Rückstände in normaler Größe.

Ein Flussdiagramm für dieses erste Protokoll des Ab-initio-Prozesses ist in Fig. 4 dargestellt. 5C. Wie in FIG. In 5C beinhaltet ein erster Schritt das Einstellen der Anfangsparameter und das Sammeln der notwendigen Daten (Block 72 ), die erforderlich sind, um die Simulation durchzuführen. Diese Daten erhält man durch Ablesen der Gesamtzahl der Reste (N) in der zu simulierenden Peptidkette und auch durch Ablesen der Sequenz der Peptidkette. Jeder Rest der Sequenz wird durch einen Indikator "I" identifiziert. Somit beinhaltet das Lesen der Peptidsequenz das Lesen der mit dem ersten Rest assoziierten Daten, I = 1, das Lesen der Daten für den zweiten Rest I = 2 und so weiter bis zum N-ten Rest, I = N. Die Simulation beginnt mit dem Setzen von I=1.

Bei I = 1 werden die einem solchen Rest zugeordneten Daten aus der Restdatenbank erhalten und auf seine Ausgangsgröße, z. B. 20 % seiner normalen Größe, geschrumpft und in eine Wasserbox gegeben (Block 74). Die Größe des Wasserkastens wird so gewählt, dass eine Wasserlösung (das Hintergrundlösungsmittel) mit mindestens etwa 11 Wasserschale auf jeder Seite des darin platzierten Rückstands bereitgestellt wird. Die Systemenergie wird dann mit periodischen Randbedingungen mit konstanter Dielektrizitätskonstante ε=1 minimiert. Dieses Schrumpfen wird wie zuvor in Verbindung mit Block 66 von Fig. 1 beschrieben durchgeführt. 5B. Das (kleine) Säuglingsmolekül für den ersten Rest wird dann gezüchtet oder auf seine normale Größe expandiert (Block 76), wie auch zuvor beschrieben, z. B. in Verbindung mit Block 68 von Fig. 1 . 5B oder Blöcke 44-50 von FIG. 5A. Sobald die normale Molekülgröße erreicht ist, wird die Moleküldynamik fortgesetzt, d. h. die Energiegleichungen bleiben für eine vorgegebene Zeitdauer T . in KraftS (Block 78). Normalerweise ist dieses Mal TS liegt in der Größenordnung von 50 Pikosekunden (Simulationszeit), kann jedoch so gewählt werden, dass sie in den Bereich von 0,1 bis 10.000 Pikosekunden fällt. Die Koordinaten des resultierenden Moleküls werden nach einem vorgeschriebenen Simulationszeitraum gespeichert, z. B. nach jeweils 0,1 Pikosekunden, wie auch in Block 78 angegeben.

Nachdem dieser Prozess für den ersten Rest, I = 1, durchgeführt wurde, wird der Wert von I inkrementiert, um den nächsten Rest der Kette zu spezifizieren, dh der Wert von I wird auf I = I + 1 gesetzt, wie in Block 80 gezeigt von FIG. 5C. Der neue Wert von I wird dann überprüft, um zu sehen, ob er gleich N+1 ist, wobei N die Anzahl der Reste in der Peptidkette ist, wie auch in Block 80 angezeigt. Wenn dieser neue Wert von I kleiner als N+1 , dann wird der dem neuen Wert von I zugeordnete Rest aus der Restdatenbank abgerufen, mit dem vorherigen Rest gekoppelt und in der Lösungsmittelbox auf seine Anfangsgröße geschrumpft. Der Vorgang wird dann für diesen neuen Rest wiederholt, wie zuvor oben in Verbindung mit den Blöcken 74, 76, 78 und 80 beschrieben. Wenn der neue Wert von I, der in Block 80 eingestellt wurde, gleich N+1 ist, dann wird der Ab-initio-Vorgang gestoppt. und die Ergebnisse werden analysiert (Block 82).

In einem zweiten Protokoll des Ab-initio-Prozesses wird die gesamte Peptidkette in der Lösungsmittelbox modelliert, wobei jeder Rest der Kette geschrumpft und gleichzeitig expandiert wird. Die Berechnungen, die während der Simulation unter Verwendung des zweiten Protokolls durchgeführt werden, sind die gleichen wie die im ersten Protokoll verwendeten, aber es müssen eine größere Anzahl solcher Berechnungen durchgeführt werden.

In einem dritten Protokoll des Ab-initio-Prozesses werden, falls vorhanden, bekannte physikalische und/oder chemische Daten verwendet, um die Simulation in Richtung eines bekannten Ergebnisses zu beeinflussen. Somit werden gemäß diesem dritten Protokoll, wenn die Anfangsdaten für ein bestimmtes simuliertes Peptid aus der Restdatenbank abgerufen werden, die Daten auf bekannte chemische oder physikalische Daten gesetzt. In einigen Fällen ermöglichen die bekannten chemischen oder physikalischen Daten, dass die Schrumpf- und Expansionsschritte umgangen werden, da die Konformation des Moleküls durch die bekannten Daten gut definiert ist. In anderen Fällen werden die bekannten chemischen und physikalischen Daten verwendet, um den Startpunkt des (geschrumpften) Säuglingsmoleküls zu beeinflussen, wenn es zu wachsen beginnt.

Die Energiegleichungen, die zur Durchführung der molekularmechanischen Simulation während des Ab-initio-Prozesses verwendet werden, basieren auf der potentiellen Energie des simulierten Moleküls. Die potentielle Energiefunktion eines Moleküls ist eine Funktion seiner Atomkoordinaten und wird als V(r) dargestellt.

In der dynamischen Simulation wird die Funktion V(r) dargestellt als: wobei: KBi ist die Bindungsdehnungskraftkonstante, bich ist die i-te Bindungslänge, bi0 die Gleichgewichtsbindungslänge ist und NB ist die Gesamtzahl der Anleihen.

K θi ist die Bindungswinkel-Biegekraftkonstante θich ist der i-te Bindungswinkel, θi0 ist der Gleichgewichtsbindungswinkel für den i-ten Bindungswinkel, N θ ist die Gesamtzahl der Bindungswinkel.

K φi ist die Kraftkonstante des Flächenwinkels, φich ist der i-te Diederwinkel, vri ist der Phasenfaktor für den i-ten Diederwinkel, n ist die Faltung des i-ten Diederwinkelpotentials und N φ ist die Gesamtzahl der Diederwinkel.

EINij ist die Lennard-Jones-Abstoßungskraftkonstante für das (ij)-te Atompaar, Bij ist die Lennard-Jones-Anziehungskraftkonstante für das (i,j)-te Atompaar, rij der Abstand zwischen i-ten und j-ten Atomen ist und N die Gesamtzahl der Atome ist.

Qich ist die Teilladung am i-ten Atom, qJ die Partialladung am j-ten Atom ist und ε die Dielektrizitätskonstante ist.

Mit den oben definierten Energiegleichungen ist anzumerken, dass der Ab-initio-Prozess eine "Ausgangsgeometrie" verwendet, die ein bestimmter Prozentsatz der physikalisch beobachteten oder "normalen Geometrie" ist. Während des Wachstumsprozesses des ersten Protokolls werden die Startparameter für die Bindungsterme in den Potentialenergiegleichungen wie folgt definiert:

KBi ist gleich der normalen Größenfunktion bio beträgt etwa 20 % des Normalwertes.

Die Startparameter für die Winkelbiegeterme in der Potentialfunktion sind wie folgt definiert: K θi ist gleich der Normalgrößenfunktion θio ist die gleiche wie die normale Größenfunktion.

Die Ausgangsparameter in den Diedertermen in den Potentialfunktionen sind wie folgt: K θi wird auf Null gesetzt mit Ausnahme der Rückgrat-Amidbindung (ω), die den Diederwinkel der Peptidbindung definiert durch die Atome C α -C-N . bezeichnet --Cα. Die Werte von n und vri werden für alle Fälle auf ihre normalen Werte gesetzt.

Die Startparameter für den elektrostatischen Term qich und qJ sind auf Null gesetzt.

Beim Wachsen des Moleküls von der Ausgangsgröße, nämlich von "20% Größe" auf "volle 100% Größe", werden die Parameter in den Potentialfunktionen bei jedem dynamischen Schritt in linearer Weise kontinuierlich aktualisiert. Falls gewünscht, können sie auch auf beliebige nichtlineare Weise aktualisiert werden.

Die Form der Aktualisierung kann im Allgemeinen eine lineare oder nichtlineare Funktion sein. Die Ausgangsgeometrie kann auch von nahe null bis 100 % betragen.

Bei vollständigem Wachstum (gleichzeitiges Quellen des Moleküls, wie es für das zweite Protokoll des Ab-initio-Prozesses verwendet wird) erfolgt der dynamische Vorgang vorzugsweise über einen Zeitraum von 2 Nanosekunden Simulationszeit für ein typisches Molekül der Größe 20 Amino Säurerückstände.

Bei sequentiellem Wachstum (erstes Protokoll) erfolgt der Lauf über einen Zeitraum von 50 Pikosekunden pro Aminosäurezugabe.

Es versteht sich, dass diese Werte nur veranschaulichend sind. Die Erfindung umfasst die Anwendung dieser Verfahren auf andere Simulationszeitrahmen und Restlängen. Zum Beispiel könnte sequentielles Wachstum über Zeiträume im Bereich von 1 bis >100 Pikosekunden pro Aminosäurezugabe durchgeführt werden. In ähnlicher Weise könnte ein gleichzeitiges Wachstum über Zeiträume von >0 bis 1 Nanosekunde für ein Molekül mit typischer Größe, das 20 Aminosäuren enthält, durchgeführt werden.

Eine Beschreibung der wichtigsten Computerprogramme, die bei der Durchführung des besten Modus des Ab-initio-Prozesses verwendet werden, ist unten angegeben. Aktuelle Programmlisten für viele der Computerprogramme sind in dem hiermit eingereichten Mikrofiche-Anhang enthalten. Im Allgemeinen sind solche Auflistungen in Fortran oder anderen wohlbekannten Sprachen verfasst, mit Kommentaren gut dokumentiert und für den Fachmann leicht verständlich. Routinemäßige Teile des Ab-initio-Prozesses, die vom Computer ausgeführt werden, z. B. Datenhandhabung, Koordinatenumwandlung, bekannte Molekulardynamik usw., die in der Technik gut bekannt sind. sind weder hierin noch im Mikrofiche-Anhang aufgeführt.

Wie zuvor angegeben, ist in einigen Fällen des Arzneimitteldesigns die Rezeptorgeometrie bekannt, z. B. aus der Röntgenkristallographie oder durch Homologiemodellbau. Die Art und Weise, in der das Zielpeptid mit dem Rezeptor interagiert, ist jedoch nicht bekannt. In diesen Fällen kann das Ab-initio-Verfahren der vorliegenden Erfindung vorteilhafterweise verwendet werden, um das Peptid zu modellieren, das darauf beschränkt ist, sich in der Umgebung der Bindungsstelle des Rezeptors zu befinden. Wenn das Peptid durch die Umgebung der Bindungsstelle des Rezeptors in Übereinstimmung mit dem ab-initio-Verfahren gezüchtet oder expandiert wird, wird die bioaktive oder Bindungskonformation leichter identifiziert und verstanden. Starre oder anderweitig chemisch modifizierte Analoga können dann nach Bedarf entworfen werden, um diese anfängliche Bindungskonformation zu bestätigen.

Die Hardware des Simulationssystems

FEIGE. 6 zeigt ein vereinfachtes Blockdiagramm eines Verarbeitungssystems 10 des Typs, der verwendet wird, um die Ab-initio-Simulationsverfahren und andere Verarbeitungstechniken der vorliegenden Erfindung auszuführen. Das System 10 ist um eine geeignete Zentraleinheit (CPU) 12 herum zentriert. An die CPU 12 ist ein Dateneingabe-Subsystem 14 gekoppelt, das eine Tastatur oder andere herkömmliche Dateneingabevorrichtungen umfassen kann. Ebenfalls mit der CPU 12 verbunden ist ein Datenspeicher-Subsystem 16. Das Datenspeicher-Subsystem 14 enthält vorzugsweise nichtflüchtige Speicherelemente, die es ermöglichen, Datensätze und Betriebsprogramme dauerhaft zu speichern, z. B. auf magnetischen oder optischen Plattenmedien, Magnetbandmedien, Nur-Lese-Speicher (ROM) oder programmierbarer Nur-Lese-Speicher (PROM) zum schnellen Abrufen bei Bedarf. Das Speichersubsystem 16 enthält ferner flüchtige Speicherspeicherelemente, z. B. einen Direktzugriffsspeicher (RAM), um die bestimmten Betriebsprogramme und Datensätze zu halten, die zu einer bestimmten Zeit verwendet werden. Ein Datenanzeige-Subsystem 15, wie beispielsweise ein herkömmlicher Monitor und/oder eine Flachbildschirm-LCD-Anzeige, ist ebenfalls mit der CPU 12 verbunden und ermöglicht die Anzeige eingegebener Daten, verarbeiteter Daten und anderer Informationen zur Verwendung durch eine Bedienungsperson. Ein Drucker-Subsystem 17 und ein X-Y-Plotter 18 können auch mit der CPU 12 verbunden sein und ein bequemes Mittel zum Anfertigen einer Hardcopy der Daten oder anderer Informationen, die durch das Simulationsprogramm erzeugt werden, bereitstellen. Diese Daten umfassen z. B. die automatische Erzeugung der Balaji-Plots und Energiekonformationskarten, die unten beschrieben werden.

Wie Fachleuten auf dem Gebiet der Computer- und Simulationstechnik offensichtlich ist, sind alle in FIG. 6 kann unter Verwendung kommerziell erhältlicher Computerausrüstung realisiert werden. Aufgrund der Natur der Datenverarbeitung, die bei der Durchführung einer Simulation eines Peptids in einer wässrigen Umgebung wie oben beschrieben beteiligt ist (dh Eingabe einer Datenbank, die jeden der Reste und anhängenden Gruppen charakterisiert, die in der Simulation verwendet werden, Schrumpfen des Peptids, Erweiterung des Peptids, Aufzeichnen und Berechnen von Konformationsparametern an Schlüsselpunkten während der Simulation usw.), sind die Datenmenge und die Verarbeitung, die in der Ab-initio-Methode verwendet werden, nicht unerheblich. Während für diesen Zweck jeder geeignete Computer programmiert werden kann, einschließlich eines Personalcomputers mit ausreichendem Speicher und vorzugsweise einer mathematischen Coprozessorplatine, wird eine solche Verarbeitung viel effizienter (d. h. unter Verwendung von weniger Computerzeit) ausgeführt, wenn sie unter Verwendung eines Supercomputers durchgeführt wird.

Ein Supercomputer ist ein Computer, der durch seine große Speicherkapazität und seine Fähigkeit gekennzeichnet ist, viele Berechnungen parallel auszuführen (d. h. er verwendet viele parallel betriebene Prozessoren, so dass mehrere Berechnungen gleichzeitig während desselben Computertaktzyklus ausgeführt werden können). Ein Supercomputer ist ferner dadurch gekennzeichnet, dass er einen "breiten" Betriebscode verwendet, z. B. 64 Bit, wodurch die Informationsmenge, die während jedes Computertaktzyklus verarbeitet werden kann, signifikant erhöht wird. Ein typischer Supercomputer hat eine damit verbundene RAM-Speicherkapazität in der Größenordnung von 4-8 MWords, wobei 8 Bytes gleich einem "Wort" sind und "M" eine Million bedeutet. (Eine Speicherkapazität von 4-8 MWords entspricht also 32-64 Megabyte.) Natürlich ist viel mehr Speicher verfügbar, wenn ein externer nichtflüchtiger Speicher verwendet wird, wie beispielsweise eine Hochleistungsfestplatte, die entweder eine der beiden Festplatten sein kann magnetisch und/oder optisch. Mehrere Modelle von Supercomputern sind im Handel erhältlich, wie beispielsweise von Cray Research Incorporated, Chippewa Falls, Wis., oder Convex Computer Corporation, Richardson, Texas. Die Grundstruktur des Cray-Supercomputers ist in US-Pat. 4,128,880, welches Patent hierin durch Bezugnahme aufgenommen ist.

Auswahl der postwahrscheinlichen Peptidkonformation aus den simulierten

Der zweite Schritt des gesamten rationalen Arzneimitteldesignverfahrens der vorliegenden Erfindung, wie in Block 22 von FIG. 4 bezieht sich auf die Auswahl der wahrscheinlichsten Konformation der Peptide, die durch den Ab-initio-Prozess simuliert wurden. In gewisser Hinsicht kann dieser zweite Schritt lediglich als eine Erweiterung des ersten Schrittes der Simulation der wahrscheinlichsten Peptidkonformationen (Block 20) ​​betrachtet werden, dh der erste und der zweite Schritt können als ein einzelner Schritt des "Simulierens und Auswählens" betrachtet werden. die wahrscheinlichsten Peptidkonformationen. Dies ist insbesondere dann der Fall, wenn das oben beschriebene Ab-initio-Verfahren verwendet wird, da ein solches Verfahren das simulierte Peptid von Natur aus auf eine stabile Konformation weist. Somit kann am Ende der Ab-initio-Simulation bereits die wahrscheinlichste Peptidkonformation ausgewählt worden sein. In vielen Fällen führt die Durchführung des Ab-initio-Simulationsschrittes jedoch zu mehreren Peptidkonformationen, z. B. einer Familie simulierter Peptide, von denen jedes in unterschiedlichem Maße stabil ist. In einem solchen Fall ist ein Auswahlverfahren erforderlich, um festzustellen, welches der simulierten Peptide die stabilste Konformation aufweist. Es ist dieser Auswahlprozess, der als nächstes beschrieben wird.

Ein Überblick über diesen Auswahlprozess ist im Flussdiagramm von Fig. 4 dargestellt. 7A. Es ist anzumerken, dass die ersten beiden Blöcke in FIG. 7A (Blöcke 84a und 84b) beziehen sich auf den Ab-initio-Simulationsprozess, der zuvor in Verbindung mit den FIG. 5A-5C. Obwohl der Ab-initio-Prozess das bevorzugte Verfahren zum Durchführen der Peptidsimulation darstellt, versteht es sich, dass auch andere Simulationsverfahren verwendet werden könnten. Ungeachtet des verwendeten Simulationsverfahrens erkennt die vorliegende Erfindung, dass wünschenswerterweise ein systematisches und rationales Verfahren verwendet werden sollte, um die Simulationsdaten zu analysieren, um die wahrscheinlichste(n) Konformation(en) zu ermitteln. Gemäß der vorliegenden Erfindung wird dieser Auswahlprozess vorzugsweise durchgeführt durch:

(a) Klassifizieren der simulierten Strukturen unter Verwendung einer geeigneten Klassifizierungstechnik, wie z. B. eines rms-Abweichungskriteriums der mittleren Geometrien der Strukturen

(b) Ordnen dieser klassifizierten Strukturen nach Wahrscheinlichkeit und

(c) Analysieren der geordneten Strukturen, um zu bestätigen, dass die wahrscheinlichsten Konformationen tatsächlich ausgewählt wurden.

Die Schritte des Klassifizierens (Schritt (a) oben) und Ordnens (Schritt (b) oben) der Strukturen (Block 86 von Fig. 7A) werden unter Verwendung klassischer Techniken durchgeführt, die in der Technik bekannt sind. Der Schritt des Analysierens der geordneten Struktur (Schritt (c) oben), um zu bestätigen, ob es die wahrscheinlichste Struktur ist, ist subtiler. Dieser analytische Schritt beinhaltet viele der gleichen Untersuchungen und Überlegungen, die beim Designen und Synthetisieren von starren oder anderweitig chemisch modifizierten Analoga der simulierten Peptide (der dritte Schritt des gesamten Arzneimitteldesignverfahrens, Block 24 in Fig. 4) beteiligt sind.

Gemäß einem bevorzugten Analyseschritt werden die Winkel φ, für die wahrscheinlichsten Strukturen berechnet (oder anderweitig aus früheren Berechnungen abgerufen) und verwendet, um einen oder mehrere Balaji-Plots zu konstruieren, die die simulierte Konformation darstellen, wie bei . angegeben Block 87 von FIG. 7A. Die durch diese Plots angezeigten Konformationen werden dann nach Bedarf weiter auf konsistente Strukturmerkmale untersucht (Block 88). Diese Untersuchung kann, falls gewünscht oder erforderlich, unterstützt werden, indem Modelle der so vorhergesagten Strukturen durch eine dreidimensionale graphische Anzeige (auch Block 88) unter Verwendung von in der Technik bekannten Techniken untersucht werden. Siehe z. B. Molecular Display Program MOGLI Version 2.0, erhältlich von Evans and Sutherland Computer Corporation, Salt Lake City, Utah. Ein Beispiel einer repräsentativen grafischen Anzeige, die eine dreidimensionale Peptidstruktur (für Ploy-L-Alanin) zeigt, ist in Fig. 1 zu sehen. 7B. Eine andere repräsentative grafische Anzeige ist in Fig. 4 zu sehen. 11, die unten in Verbindung mit Beispiel 1 diskutiert wird.

Als nächstes wird auf Fig. 1 Bezug genommen. 8A, um ein Balaji-Diagramm zu beschreiben und wie es von der vorliegenden Erfindung verwendet wird (nicht nur zum Zweck der Analyse der vorhergesagten Strukturen, um die wahrscheinlichsten zu bestimmen, sondern auch für andere Facetten der hierin beschriebenen Erfindung). FEIGE. 8A zeigt ein Balaji-Diagramm der , -Winkel eines hypothetischen Polypeptids (von dem nur die ersten sieben Reste gezeigt sind). Das Balaji-Diagramm enthält eine vertikale Winkelachse und eine horizontale Restzahlachse. Die vertikale Winkelachse weist einen Winkelbereich auf, der 360° oder 2π Radiant abdeckt, vorzugsweise um 0° oder 0 Radiant zentriert. Wie in FIG. In 8A enthält beispielsweise die vertikale Winkelachse Markierungen für alle 20°, die von +180° bis -180° reichen. Natürlich könnte die Winkelachse je nach Bedarf für eine bestimmte Anwendung in anderen Winkeleinheiten als Grad, z. B. im Bogenmaß, markiert werden. Da jedoch die meisten chemischen und physikalischen Daten für Peptide typischerweise die Winkel , in Grad angeben, wird die Verwendung von Grad für die Winkelachse bevorzugt. Die horizontale Achse ist mit der Restnummer markiert. In Fig. 2 sind nur sieben Restnummern gezeigt. 8A, aber es versteht sich, dass die horizontale Achse für so viele Reste fortgesetzt wird, wie in einer bestimmten Polypeptidkette enthalten sind. Siehe z. B. FIG. 14-22, die Balaji-Plots für tatsächliche Polypeptide zeigen. Es versteht sich auch, dass, während die Winkelachse in FIG. 8A als vertikale Achse und die Restachse als horizontale Achse gezeigt, könnten diese Rollen umgekehrt werden. Wichtig ist nur, dass die beiden Achsen orthogonal zueinander stehen oder eine definierte Winkelbeziehung zueinander aufweisen.

Wie in FIG. In 8A sind die Winkel φ, im Balaji-Diagramm als Basis bzw. Spitze eines Keils dargestellt. Für jeden Rest ist ein Keil enthalten, und der Keil wird in Ausrichtung mit der horizontalen Achse positioniert, um die jeweilige Restzahl der so aufgetragenen , -Winkel anzuzeigen. So ist beispielsweise, wie in FIG. In 8A weist der erste Rest des bestimmten dargestellten Peptids einen -Winkel von 100° und einen -Winkel von –80° auf. In ähnlicher Weise hat der zweite Rest einen -Winkel von 80° und einen -Winkel von 20°. Der dritte Rest hat einen -Winkel von –80° und einen -Winkel von 60°. Auf ähnliche Weise werden die Winkel φ, für jeden Rest auf dem Balaji-Plot definiert.

Es wird darauf hingewiesen, dass das Balaji-Plot eine Verfeinerung oder Modifikation eines "Balasubramanian-Plots" ist. Siehe Balasubramanian, R., "Neuer Typ der Darstellung für das Mapping Chain Folding in Protein Molecules", Nature 266, S. 856-857 (1974). Das Balasubramansche Diagramm stellt die Werte der φ-, -Winkel jedes Rests einer Polypeptidkette als durchgezogene Punkte bzw. offene Kreise dar, die durch eine vertikale Linie verbunden sind. Das Balasubramansche Diagramm verwendet eine vertikale Winkelachse und eine horizontale Restzahlachse. Das Peptid wird somit in einem Balasubraman-Diagramm als eine Reihe verschiedener vertikaler Linien dargestellt, von denen jede durchgezogene Punkte und offene Kreise aufweist, die mit den entsprechenden φ, ψ-Winkelwerten auf der vertikalen Achse ausgerichtet sind, und wobei jede Linie der bestimmten Zahl des Rests entspricht mit den aufgetragenen φ, -Winkeln, wie auf einer horizontalen Achse angezeigt.

Im Gegensatz zum Balasubraman-Diagramm zeigt das Balaji-Diagramm der vorliegenden Erfindung die Werte der Winkel φ, als Basis bzw. Spitze eines vertikalen Keils (unter Annahme einer vertikalen Winkelachse), wobei ein separater Keil horizontal auf . positioniert ist die Auftragung als Funktion der Restzahl der so aufgetragenen , -Winkel. Mit anderen Worten, das Balaji-Diagramm ersetzt die ausgefüllten Punkte und offenen Kreise des Balasubraman-Diagramms durch die Basis eines Keils bzw Körper des Keils. Dieser scheinbar kleine Unterschied bietet jedoch einen bemerkenswerten Vorteil in der Fähigkeit eines Analytikers, die Balaji-Darstellung zu betrachten und zusätzliche Einblicke in die Art und Weise zu gewinnen, in der ein bestimmtes Polypeptid gefaltet oder auf andere Weise seine verschiedenen Reste in einer komplexen Konformation angeordnet hat.

Um eine Verwendung des Balaji-Diagramms gemäß der vorliegenden Erfindung zu veranschaulichen, wird als nächstes auf die Fig. 1 und 2 Bezug genommen. 8B, 8C und 8D gezeigt, wo Balaji-Diagramme für die Zeiten T und T+Δt und die Differenz dazwischen für ein hypothetisches Peptid gezeigt sind, das molekulardynamischen Veränderungen unterzogen wurde, dh das eine äußere oder innere Kraft erfahren hat, die hat seine Gestalt verändert. Wenn sich die Konformation des Peptids ändert, werden die Winkel , aufgezeichnet oder auf andere Weise bestimmt. Somit ist, wie in FIG. In 8B weist der erste Rest zum Abtastzeitpunkt T , -Winkel von ungefähr 90° bzw. –30° auf. Wie in FIG. 8C, zu einem Abtastzeitpunkt Δt später, d. h. bei T + t, hat der erste Rest auch , -Winkel von 90° bzw. –30°. Somit haben sich die Winkel dieses Restes während der Zeitdauer t nicht geändert, und daher ist kein "Keil" in Fig. 1 gezeigt. 8D, das "differentielle Balaji-Plot", für den ersten Rest.

Im Gegensatz dazu zeigt der zweite Rest eine geringfügige Änderung des Winkels ψ, jedoch nicht des Winkels φ während der Zeit Δt. Das heißt, zum Abtastzeitpunkt T (Fig. 8B) betragen die φ, -Winkel für den zweiten Rest ungefähr +120° bzw. +30°, während zum Abtastzeitpunkt T+Δt (Fig. 8C) die φ, -Winkel betragen ungefähr +120° bzw. +15°. Somit ist in der differentiellen Balaji-Darstellung in FIG. In 8D gibt es einen sehr kleinen Keil für den zweiten Rest, der eine 0°-Differenz für den -Winkel und eine +15°-Differenz für den ψ-Winkel anzeigt.

In ähnlicher Weise ist zu sehen, dass der dritte Rest während der Zeit Δt eine leichte Änderung des -Winkels erfährt, während sich der ψ-Winkel des dritten Rests nicht ändert. Das heißt, zum Abtastzeitpunkt T (Fig. 8B) betragen die φ, -Winkel für den dritten Rest ungefähr +120° bzw. +15°, während zum Abtastzeitpunkt T+Δt (Fig. 8C) die φ, ψ-Winkel betragen ungefähr +135° bzw. +15°. Somit ist in der differentiellen Balaji-Darstellung in FIG. In 8D gibt es einen sehr kleinen Keil für den dritten Rest, der eine Differenz von -15° für den -Winkel und eine 0°-Differenz für den -Winkel anzeigt.

Somit ist ersichtlich, dass nicht nur die Balaji-Diagramme der FIG. 8B und 8C liefern wertvolle Einblicke in die Struktur des jeweiligen dargestellten Polypeptids, aber die differenzielle Balaji-Darstellung ( 8D ) zeigt deutlich, wie sich die Struktur über die Zeit t verändert hat. Wenn sich die Winkel φ, eines gegebenen Restes nicht geändert haben, gibt es für diesen Rest keinen Keil im Differential-Balaji-Plot. Wenn sich die Winkel φ, für einen gegebenen Rest nur geringfügig geändert haben, ist der im Differential-Balaji-Plot erscheinende Keil ein kleiner Keil nahe 0°. Wenn sich andererseits die Winkel φ, für einen gegebenen Rest während der Zeit Δt um einen signifikanten Betrag geändert haben, sind die Keile, die in der diesem Rest entsprechenden Differentialdarstellung erscheinen, entweder große Keile und/oder nicht nahe 0 °. Das heißt, entweder die Basis des Keils und/oder die Spitze des Keils weisen eine große Abweichung von 0° auf.

Ein kurzer Blick auf das in FIG.8D zeigt somit, dass der fünfte Rest , -Winkel hat, die sich signifikant geändert haben. Der Keil für den fünften Rest ist zwar nicht groß, hat aber eine große Verschiebung von 0° mit seiner Basis bei +120° und seiner Spitze bei 165°. Dies bedeutet, dass sich die Winkel φ, in der Zeit Δt um +120° bzw. +165° geändert haben. Andere Reste, die eine signifikante Änderung der φ- oder -Winkel zeigen, sind Rest Nummer 6 (a von +60°) und Rest Nummer 7 (a von +75). Daher untersucht man die Balaji-Plots der FIG. 8B-8D wird schnell zu dem Schluss geführt, dass die meisten φ, ψ-Winkel der Reste der dargestellten Struktur ziemlich stabil sind (einige ohne jegliche Änderung), mit Ausnahme der Reste 5, 6 und 7. Wenn also das Ziel besteht darin, eine gewünschte Konformation beizubehalten, z. B. wie durch das Balaji-Diagramm von FIG. 8B, dann die Balaji-Diagramme, die in den FIG. 8B-8D kann daher als analytisches Werkzeug verwendet werden, um nach einem geeigneten Bioisoster oder Äquivalent zu suchen, das die Amidbindungen der Reste 5, 6 und 7 durch eine stabilere Bindung ersetzen könnte.

Die Bedeutung des Balaji-Plots als analytisches Werkzeug wird durch die Fig. 2 und 3 hervorgehoben. 8E und 8F. FEIGE. 8E zeigt schematisch ein komplexes dreidimensionales gefaltetes Polypeptid, dargestellt durch die gefaltete, verdrillte Linie 90 mit zahlreichen Erhebungen und Windungen entlang ihrer Länge. Eine solche komplexe Form scheint unmöglich zu charakterisieren und zu verstehen, obwohl die Primärstruktur des Polypeptids bekannt ist. Durch die Simulationsverfahren der vorliegenden Erfindung, dh durch Schrumpfen des Polypeptids in einer Lösungsmittelbox und Expandieren auf und über seine normale Größe hinaus, werden jedoch ein oder mehrere Balaji-Diagramme, die die φ-, -Winkel oder die Änderungen in φ, ψ . charakterisieren, Winkel erzeugt werden können. Solche Diagramme können deutlich zeigen, dass nur eine Handvoll der φ, -Winkel der zahlreichen Reste im Polypeptid irgendeine Neigung zur Veränderung aufweisen. Diese Winkel, d. h. die Reste, die diese Winkel enthalten, können somit als Scharniere oder Drehpunkte der Kette angesehen werden. Durch selektives Aufklappen der Kette an diesen Scharnier- oder Schwenkpunkten wird die komplexe Form von FIG. 8E kann sich leicht entfalten und entwirren, um eine Reihe einfacher, gut erkannter Formen zu zeigen, z. B. Sekundärstrukturen, wie schematisch in 8 gezeigt. 8F.

In FIG. 8F, die einfach ein entfaltetes Äquivalent der schematischen Darstellung von FIG. In 8E ist zu sehen, dass mehrere Serien einfacher Formen 94a , 94b , 94c , . . . , 94n, die schematisch bekannte Verbindungen oder kurze Peptide darstellen, sind an Gelenk- oder Drehpunkten 92a, 92b, 92c, . . . , 94n. Durch Falten der Kette 90 an den Gelenkpunkten 92a, 92b, 92c, . . . , 92n, können sich mehrere komplexe dreidimensionale Konformationen ergeben, die in Fig. 9 gezeigt sind. 8E ist einer von ihnen. Das Problem besteht darin, dass es sehr schwierig ist, die Reihe einfacher Formen 94a, 94b, 94c, . . . , 94n verborgen in der komplexen Form, die in FIG. 8E. Mit Hilfe der Balaji-Diagramme der vorliegenden Erfindung ist es jedoch relativ einfach, die komplexe Form von Fig. 1 zu entwirren. 8E, um seine Bestandteile zu erkennen.

Wie somit aus den FIG. 8E und 8F dienen die Balaji-Diagramme nicht nur als bequemes Mittel zum Anzeigen der mit einer Peptid-basierten Verbindung assoziierten Daten, einschließlich der Analyse solcher Daten zum Zweck der Ermittlung der wahrscheinlichsten Strukturen, sondern das Balaji-Diagramm ist auch ein ein sehr wertvolles analytisches Werkzeug zum Entwirren komplexer Polypeptidkonformationen, wodurch ein scharfer Einblick in die Nachahmung und/oder Stabilisierung des Peptids zum Zweck der Bereitstellung eines für das Arzneimitteldesign nützlichen Peptidomimetikums bereitgestellt wird.

Die konformative Energiekarte

Unter Bezugnahme als nächstes auf FIG. 9A zeigt ein weiteres Werkzeug, das bei der Analyse einer simulierten oder einer anderen Peptidstruktur nützlich ist. Dieses Werkzeug ist die Konformationsenergiekarte. FEIGE. 9A zeigt eine repräsentative Konformationsenergiekarte eines Oligopeptids (insbesondere des Dipeptids Cyclopropyl). Diese Energiekarte wird durch Computersimulation des Oligopeptids gemäß der vorliegenden Erfindung erzeugt. Auf das zur Erzeugung der Konformationsenergiekarte verwendete Computerprogramm wird unten Bezug genommen. Die Konformationsenergiekarte zeigt die Energie, die erforderlich ist, um einen bestimmten φ, -Winkel der Oligopeptidkonformation aufrechtzuerhalten. Somit entspricht eine stabile Konformation einem Bereich auf der Energiekarte mit der niedrigsten Energie, um die φ, -Winkel für diese Konformation beizubehalten.

Wie in FIG. In 9A ist der -Winkel entlang einer Achse der Energiekarte aufgetragen, und der -Winkel ist entlang der anderen Achse der Energiekarte aufgetragen. Wie in FIG. In 9A ist der -Winkel entlang der horizontalen Achse aufgetragen und der -Winkel ist entlang der vertikalen Achse aufgetragen. (In einigen Energiekartendarstellungen, einschließlich Tabelle 1 unten, sind die Winkel θ1,2 können anstelle der Winkel φ bzw. ψ verwendet werden.) Jede Kombination der , -Winkel wird somit als ein Punkt in der Energiekarte dargestellt, der dem Schnittpunkt des φ-Winkels mit dem ψ-Winkel entspricht.

Die Energie der jeweiligen φ, ψ-Kombination wird durch eine Reihe von Energiekonturlinien oder Äquivalenten angezeigt, die auf der Oberfläche der Energiekarte erscheinen. Wie in FIG. 9A, je schwerer oder fetter die Energiekonturlinie ist, desto niedriger ist die Energie an dieser Stelle (und damit desto stabiler die Konformation). Je heller oder dünner die Energiekonturlinie ist, desto höher ist die Energie an dieser Stelle (und damit desto instabiler die Konformation). Die Bereiche mit der höchsten Energie werden als schattierte Bereiche dargestellt. Solche schattierten Bereiche können als "Spitzen" (Punkte mit der höchsten Energie) betrachtet werden, und die von den fettesten Höhenlinien umgebenen Bereiche können als "Täler" (Punkte mit der niedrigsten Energie) betrachtet werden. Eine stabile Konformation des Peptids ist somit eine Konformation, bei der die Winkel φ, in einem "Tal" oder einem Ort minimaler Energie liegen.

Zur Veranschaulichung ist in FIG. 9A entspricht der Punkt (φ, ψ)=(0°, 0°), einem Ort relativ hoher Energie, dh einem Punkt, an dem die Molekulardynamik es nicht zulässt, dass die φ, -Winkel in dieser Position bleiben, wenn sie . sind nicht eingeschränkt. Daher ist dieser Punkt keine stabile Konformation. Im Gegensatz dazu entspricht der Punkt (φ, ψ) = (-80°, 100°) einem Ort minimaler Energie und einer stabileren Konformation. Wie in FIG. In 9A gibt es etwa acht Bereiche minimaler Energie für das gezeigte Peptid, die durch die weiß-auf-schwarzen Ziffern 1-8 markiert sind. Die mit jeder dieser "Taschen" oder Täler minimaler Energie verbundene relative Energie wird quantifiziert und wie unten in Tabelle 1 gezeigt geordnet.

Tabelle 1 listet beide Werte der φ, ψ-Winkel (identifiziert als die Winkel θ1 und2), die den bestimmten Ort mit minimaler Energie und die relative Energie des Ortes mit minimaler Energie definieren, wobei die minimale oder niedrigste Energie gleich 0,0 gesetzt wird. Somit ist aus Tabelle 1 und Fig. 2 ersichtlich. 9A, dass das globale Minimum (der Bereich der niedrigsten Energie) der Bereich Nummer 1 ist, der bei (θ, ψ) = (–80°, 100°) zentriert ist. Der Bereich mit der nächstniedrigeren Energie ist der Bereich Nummer 2, zentriert bei (φ, ψ) = (80°, -100°). Beachten Sie aus Tabelle 1, dass das globale Minimum bei (φ, ψ)=(-80°, 100°) auftritt und einer Energie von 112,1 kcal/mol entspricht. Die relative Energie des lokalen Minimums bei (φ, ψ)=(80°, 100°) beträgt 0,1, was darauf hindeutet, dass die Energie an dieser Stelle etwa 10 % höher ist. Im Gegensatz dazu beträgt die dem lokalen Minimum bei (φ , ) = (-80°, -70°) zugeordnete relative Energie 1,1 oder ungefähr doppelt so viel wie die Energie am globalen Minimum.

TABELLE 1
______________________________________
Globales Minimum tritt bei θ . auf1,2 = 80°, 100° (Energie = 112,1 kcal/mol) min. θ1 θ2 # (°) (°)
______________________________________

1 80 100 0.0
2 80 -100 0.1
3 -80 -70 1.1
4 80 70 1.1
5 -180 -90 4.0
6 180 -90 4.1
7 -180 90 4.1
8 180 90 4.2
______________________________________

Prozentuale Besetzung der 1 bis 5 kcal/mol Energie (dickste = 1 und dünnste = 5). Schattierte Bereiche entsprechen einer Energie > 6,5 kcal/mol Relative Energie inkcal/mol (globales Minimum auf 0,0 gesetzt).

Die Konformationsenergiekarte stellt ein nützliches Werkzeug dar, da sie einen visuellen Hinweis auf die globale minimale Konformation für ein gegebenes Peptid liefert. Eine solche Karte bietet daher wertvolle Einblicke in die Auswahl der wahrscheinlichsten simulierten Konformation, für die ein chemisch modifiziertes Analogon entworfen werden sollte. Die Energiekarten liefern auch nützliche Informationen bezüglich der allgemeinen Suche und Gestaltung eines geeigneten Peptidomimetikums, das ein gewünschtes Peptid nachahmen kann.

Es wird darauf hingewiesen, dass in der Literatur über konformative Energiekarten für Modelldipeptidverbindungen berichtet wurde. Siehe z. B. Ramachandran et al., (1968) supra. Vorläufige Daten zu Dipeptid-Konformationsenergiekarten, die Thiopeptide und Peptidanaloga mit Glycyl-, Alanyl- und Aib (α-Amino) isobuttersäure)-Einheiten enthalten, finden sich beispielsweise in Balaji et al., "Mean Geometry of the Thiopeptide Unit and Conformational Features". of Dithiopeptides and Polythiopeptides", Biochem. Biophys. Res. Commun., 145: 834 (1987) und Balaji et al., Peptides, p. 639 (Hrsg. J. E. Rivier), ESCOM, Leiden (1990).

Die vorliegende Erfindung umfasst vorteilhafterweise ein verfeinertes Protokoll zum Erhalten von Konformationsenergiekarten und eine Zusammenstellung von Konformationsmerkmalen mehrerer neuer Modell-Dipeptidanaloga. Dieses Protokoll umfasst die Berechnung der Konformationsenergien mit einem geeigneten Simulationsprogramm für die Molekularmechanik. Die Energien werden in der (φ, ψ)-Ebene berechnet. Die für solche Berechnungen verwendeten Parameter sind diejenigen, die durch Anpassen der Dipolmomente an experimentelle und Gaußsche 80/82-Strukturen und Konformationsenergien von Modellverbindungen (z. B. Peptide und Thiopeptide) abgeleitet werden. Vorzugsweise werden alle Berechnungen unter Verwendung von Monopolladungen und einer Dielektrizitätskonstante von 4,0 durchgeführt. Die (φ, ψ)-Winkel werden eingefroren, um die Energie an einem bestimmten (φ, ψ)-Punkt in der Karte zu bestimmen. Für jeden gefrorenen (φ, ψ)-Punkt wird die Energie unter Verwendung von Konvergenzkriterien von 0,1 kcal/Mol minimiert. Die Konformationsenergie-Konturkarten (mit trans-Peptid- und Thiopeptid-Einheiten) werden vorzugsweise in der (φ, )-Ebene in 1 kcal/Mol-Intervallen bezüglich des globalen Minimums für jede der modellierten Verbindungen aufgetragen. Konturen von mehr als 5 kcal/Mol werden ausgelassen. Die prozentuale Verfügbarkeit des Konformationsraums mit 1, 2, 3, 4 und 5 kcal/mol vom globalen Minimum für jede Konformationsenergiekarte wird berechnet. Wahrscheinlichkeitskarten werden dann bei 300° K berechnet.

FEIGE. 9B zeigt Konturwahrscheinlichkeitsdaten für eine Modellverbindung, die unter Verwendung des oben beschriebenen Protokolls erzeugt wurde. Diese Daten sind auch in einer Karte ähnlich der Konformationsenergiekarte organisiert, wobei der Wert von entlang einer Achse definiert ist und der Wert von ψ entlang der anderen Achse definiert ist. Die auf der Karte gezeigten Zahlen geben einen Hinweis auf die relative Population der Moleküle im gesamten φ, ψ-Raum jedes Minima, wobei die höheren Zahlen die höhere Wahrscheinlichkeit angeben. Die Konturwahrscheinlichkeitsdaten stellen somit auch ein nützliches Werkzeug zur Identifizierung der wahrscheinlichsten Strukturen bereit, für die chemisch modifizierte Analoga entworfen werden.

Die Zusammenstellung von Konformationsmerkmalen mehrerer neuer Modell-Oligopeptide, z. B. Dipeptid-Analoga, ist unten angegeben. Diese Merkmale sind sehr nützlich beim Suchen und/oder Entwerfen eines chemisch modifizierten Analogs, um ein gewünschtes Peptid nachzuahmen.

Peptidomimetisches Design und Synthese chemisch modifizierter Analoga

Der vierte Schritt des Arzneimitteldesignverfahrens (Block 24 in Fig. 4) der vorliegenden Erfindung besteht darin, ein chemisch modifiziertes Analogon des ausgewählten simulierten Peptids zu entwerfen und zu synthetisieren. Einige der resultierenden chemisch modifizierten Analoga sind biologisch aktiv und können als solche ohne weitere Modifikation als Peptidomimetika verwendet werden.

Im Allgemeinen beinhaltet das Entwerfen und Synthetisieren eines chemisch modifizierten Analogs, dass mit der Sequenz des Peptids und den Konformationsdaten (z. B. Geometriedaten, wie Bindungslängen und -winkel) eines gewünschten Peptids (z. B. des wahrscheinlichsten simulierten Peptids) begonnen wird. , und Verwenden solcher Daten, um die Geometrien zu bestimmen, die in das chemisch modifizierte Analogon konstruiert werden sollten. Zur Durchführung dieses Schrittes sind zahlreiche Verfahren und Techniken bekannt, von denen jedes verwendet werden könnte. Siehe z. B. Farmer, P.S., Drug Design, (Ariens, E.J. 10, S. 119-143 (Academic Press, New York, London, Toronto, Sydney und San Francisco) (1980) Farmer et al., in TIPS, 9/82, S. 362-365 Verber et al., in TINS, 9/85, S. 392-396 Kaltenbronn et al., in J. Med. Chem.-Nr. 33: 838-845 (1990) und Spatola, A.F., in Chemistry and Biochemistry of Amino Acids. Peptide und Proteine, Bd. 2, No. 7, S. 267-357, Kapitel 5, "Peptide Backbone Modifications: A Structure-Activity Analysis of Peptides Containing Amide Bond Surrogates. Conformational Constraints, and Relations" (B. Weisten, Hrsg. Marcell Dekker: New York, Pub.) (1983) Kemp, DS, "Peptidomimetics and the Template Approach to Nucleation of β-Faltblätter und α-Helices in Peptides", Tibech, Vol. 2, No. 8, S. 249–255 (1990).

Eine bevorzugte Technik zum Bereitstellen nützlicher Daten und anderer Informationen, die beim Design und Synthetisieren eines chemisch modifizierten Analogs helfen, ist in dem Diagramm von Fig. 1 gezeigt. 10. Wie in FIG. In 10 werden mindestens zwei parallele, jedoch miteinander verbundene Pfade oder Verfahren verwendet, um mittlere Geometriedaten zu erhalten. Da die Pfade miteinander in Beziehung stehen, werden die resultierenden mittleren Geometriedaten vorteilhafterweise mit den zwei (oder mehr) verwendeten Verfahren korreliert, wodurch die besten Entwurfsinformationen zur Verwendung beim Synthetisieren des chemisch modifizierten Analogs bereitgestellt werden.

Wie in FIG. 10 (Block 102) liefert eine Datenbank von Aminosäuregeometrien (sowohl natürlich als auch nicht natürlich, einschließlich Endgruppen und Hauptketteneinheiten) Eingabedaten, die verwendet werden können, um mittlere Geometriedaten zur Verwendung beim Design von chemisch modifizierten zu erhalten Analoga. Aus den Daten in der Datenbank (102) können beispielsweise mittlere Geometriedaten aus röntgenkristallographischen Daten von Bindungslängen und -winkeln gewonnen werden, wie in Block 104 angegeben. Zu diesem Zweck werden herkömmliche Techniken verwendet. Solche röntgenkristallographischen Daten liefern einen ersten ungefähren Wert der mittleren Geometrien des gewünschten Analogs.

Zusätzlich zu den herkömmlichen kristallographischen Röntgenstrahldaten besteht eine zweite Technik zum Erhalten von Daten der mittleren Geometrie darin, die zuvor beschriebenen Ab-initio-Techniken zu verwenden, um eine stabile Peptidstruktur vorherzusagen (Block 106). Vorteilhafterweise kann das Ab-initio-Verfahren die Daten aus der Datenbank (102), die röntgenkristallographischen Daten (104) und/oder keine Anfangsdaten verwenden, um zu einer Vorhersage der Peptidstruktur und somit zu einem Maß für die zu gelangen Geometrie bedeuten. In die Ab-initio-Technik eingeschlossen sind natürlich die molekularmechanischen Parameter, die einen zweiten ungefähren Wert der mittleren Geometrien des gewünschten Analogs definieren.

Der erste und der zweite angenäherte mittlere Geometriewert werden dann unter Verwendung eines geeigneten Korrelationsverfahrens korreliert, wie in Block 108 von 1 angezeigt. 10. Das ausgewählte Korrelationsverfahren ist vorzugsweise ein gewichteter Durchschnitt der beiden Näherungswerte, wobei den Ab-initio-Simulationsdaten mehr Gewicht beigemessen wird als den röntgenkristallographischen Daten.

Sobald die mittleren Geometrien des gewünschten Analogs festgelegt sind und diejenigen Reste des ursprünglichen Peptids, die für Umlagerung und/oder Abbau besonders anfällig sind, identifiziert wurden, können Modifikationen des ursprünglichen Peptids in Betracht gezogen werden. Dem Fachmann sind zahlreiche Peptidrückgratsubstitutionen bekannt, die einem Peptid eine erhöhte Steifigkeit, chemische und/oder metabolische Stabilität usw. verleihen können. Beispielsweise kann die normale Amidbindung eines Peptidrückgrats durch Ersetzen des Amidstickstoffs durch eine Methyleneinheit (d. h. -CH&sub2;2 --), eine Sauerstoff-Einheit (--O--) oder eine Schwefel-Einheit (--S--), oder durch Austausch von H am Amid-Stickstoff durch eine geeignete R-Gruppe, wodurch ein N-substituiertes Amid erzeugt wird .

Alternativ kann die normale Amidbindung eines Peptidrückgrats modifiziert werden, beispielsweise durch Ersetzen der Amidcarbonylgruppe durch ein reduziertes Carbonyl (d. h. -CH2 --) eine α,α-disubstituierte Methyleneinheit: worin jedes von R und R' unabhängig H oder ein Hydrocarbyl- oder substituierter Hydrocarbylrest ist, orientiert, um entweder die L- oder D-Konfiguration zu erzeugen, ein Thiocarbonyl Gruppe: eine Sulfoneinheit eine Sulfoxideinheit oder dergleichen.

Eine zusätzliche Modifikation des Peptids kann durch Einführen von Substituenten am alpha-Kohlenstoffatom erreicht werden, so dass das Peptidrückgrat unverändert bleibt, aber zusätzliche Seitenkettensubstituenten in dem chemisch modifizierten Analogon vorhanden sind. Beispielsweise kann das α-Kohlenstoffatom Teil einer Cyclopropylgruppe sein: einer Ethylidengruppe: einer Amingruppe: und dergleichen.

Der Fachmann erkennt, dass verschiedene Kombinationen der oben beschriebenen Modifikationen verwendet werden können. Beispielsweise kann die gesamte Amideinheit ersetzt werden durch:

(b) das Methylensulfon-Bioisoster: (c) das Methylensulfoxid-Bioisoster: (d) eine Ethylen-Einheit (-CH2 --CH2 --), (e) das Ketomethylen-Bioisoster: (f) das Methylenamino-Bioisoster: -CH2 --NH--

(g) das Methylenhydroxyamino-Bioisoster: (h) das N-Methylpeptid-Bioisoster: (i) eine Isopropenyl-Einheit: (j) das Thiopeptid (dh Thioamid-Bindung) Bioisostere: (k) das N-Methylthiopeptid Bioisostere: (l) das Esterbioisostere: (m) eine Alkylethereinheit (-O-CH .)2 --), (n) eine "umgekehrte" Amideinheit, d. h. anstelle von und so weiter. Beachten Sie, dass jede dieser Ersatzgruppen in jeder Orientierung (d. h. in der gezeigten Orientierung oder in der "umgekehrten" Orientierung) in die Peptidkette eingeführt werden kann.

Alternativ kann die gesamte Amideinheit ersetzt werden durch:

(a) eine Ethylideneinheit (--CHCH--),

(b) das Hydroxyethylen-Bioisoster: (c) eine Dihydroxyethylen-Einheit: (d) das Epoxid-Bioisoster: (e) das Hydroxy-Doppelbindungs-Bioisoster: (f) das Trihydroxybioisoster: (g) eine 2,5-Pyrrol-Einheit: und so weiter.

Außerdem erkennt der Fachmann, dass verschiedene Substituenten am Amidstickstoff und am α-Kohlenstoff aneinander gebunden sein können, wodurch eine cyclische Struktur gebildet wird, die auch ein eingeschränktes Analoges erzeugt. Andere eingeschränkte cyclische Strukturen sind ebenfalls möglich, indem andere Substituenten verknüpft werden, um cyclische Strukturen zu bilden.

Da die Ersatzreste typischerweise von den Enzymen, die natürlich vorkommende Proteine ​​abbauen, nicht erkannt werden, sind diese chemisch modifizierten Analoga typischerweise viel resistenter gegenüber enzymatischer Spaltung als die nativen Peptide, von denen sie abgeleitet sind.Darüber hinaus bietet die breite Palette möglicher Ersatzgruppen, die verwendet werden können, um das Rückgrat und die Seitenketten von Peptiden zu modifizieren, die Möglichkeit, die konformative Flexibilität der Grundstruktur zu reduzieren. Somit kann die Möglichkeit, dass das Peptid eine andere Konformation(en) als die spezifisch gewünschte(n) Konformation(en) annimmt, durch geeignete Modifikation des Peptids im Wesentlichen minimiert werden.

Sobald das gewünschte Analog (einschließlich Rückgrat- und Seitenketten-Modifikationen, wie geeignet) identifiziert wurde, wird eine chemische Synthese unter Verwendung von Standard-Synthesetechniken durchgeführt. Für eine gegebene Zielverbindung kann der Fachmann leicht geeignete Syntheseansätze für die Herstellung der Zielverbindung identifizieren.

Der vierte Schritt des Arzneimitteldesignverfahrens der vorliegenden Erfindung (Block 26 von 4 ) besteht darin, die Bioaktivität des synthetisierten chemisch modifizierten Analogs zu bewerten. Zum Testen der chemisch modifizierten Analogverbindungen stehen physiologische, pharmakologische und biochemische Standardverfahren zur Verfügung. Das spezielle Protokoll, das zur Bewertung der Bioaktivität verwendet wird, ist eine Funktion der zu testenden Verbindung. Beispielsweise kann eine Verbindung, von der angenommen wird, dass sie als Renin-Antagonist wirkt, in Ratten mit Bluthochdruck getestet werden [siehe z. B. Kaltenbronn et al., in J. Med. Chem; das die GnRH-stimulierte Gonadotropinfreisetzung blockiert, kann unter Verwendung von Hypophysenzellkulturtechniken erkannt werden, um den Grad der Hemmung der Gonadotropinfreisetzung aus diesen Zellen zu messen [siehe Valadez, FJ, Staley, D. und Conn, PM, Release of gonadotropin alpha subunit from rat Hypophysenkulturen als Reaktion auf GnRH, Mol. Cell Endocrinol 56: 81-89 (1988)]. Die Wirksamkeit des Mittels zur Hemmung der Fruchtbarkeit wird dann in Feldversuchen unter Verwendung verschiedener Säugetier-Tiermodelle getestet.

Als noch ein weiteres Beispiel kann die Wirksamkeit eines Endothelin-Antagonisten (Endothelin ist ein potentes endogenes vasokonstriktorisches Peptid, das an Bluthochdruck beteiligt ist, ein Endothelin-Antagonist ist ein Antikörper oder ein Medikament zur Hemmung der Endothelin-stimulierten Vasokonstriktion und Kontraktionen) zuerst unter Verwendung der Pfortader der Ratte bestimmt werden und Aorta sowie Rattenuterus, Trazchea und Samenleiter [siehe Borges, R., Yon Grafenstein, H. und Knight, DE, Tissue selectivity of endothelin, Eur. J. Pharmacol 165: 223–230, (1989)], und schließlich kann die Bioaktivität bei hypertensiven Ratten getestet werden (siehe Kaltenbronn et al., supra.

Als noch ein weiteres Beispiel kann die Bioaktivität von Antikörpern oder Arzneimitteln, die die Stimulation des Schweinewachstums durch Schweinesomatotropin (pST, Wachstumshormon) nachahmen, bestimmt werden, indem zuerst die Bioaktivität von pST-Nachahmern unter Verwendung eines Ratten-Tibia-Knochenkultur-Assays getestet wird, um die pST-stimulierte Freisetzung zu messen von insulin-like growth factor-I/Somatomedin-C [siehe Stracke, H., Schultz, A., Moeller, D., Rossol, S. und Schatz, H., Effect of growth hormone on osteoblasts and Demonstration of Somatomedin -C/IGF-I in Knochenorgankultur, Acta Endocrinol. 107: 16–24 (1984)]. Die Bioaktivität der Antikörper oder Testverbindungen wird dann an Schweinen getestet, um festzustellen, ob sie das Wachstum auf futtereffiziente Weise stimulieren. Jedes geeignete Verfahren oder eine Kombination dieser Verfahren kann verwendet werden, um die Bewertung durchzuführen.

Weiteres Design peptidomimetischer Verbindungen

Ein zusätzlicher, optionaler Schritt des Arzneimitteldesignverfahrens der vorliegenden Erfindung (Block 36 von 4 ) ist das Design zusätzlicher peptidomimetischer Verbindungen, basierend auf der Struktur und Aktivität von zuvor bewerteten, chemisch modifizierten Analog(en). Unter Bezugnahme auf verfügbare Datenbanken, wie die kristallographische Datenbank von Cambridge, können Ersatzreste, die mit verschiedenen Resten der interessierenden Verbindung bioisosterisch sind, identifiziert und verwendet werden, um den nativen Rest in der interessierenden Verbindung zu ersetzen. Der Fachmann kann leicht geeignete bioisosterische Einheiten identifizieren, die anstelle der natürlich vorkommenden Aminosäurereste verwendet werden können. Beispiele für einige häufig verwendete bioisosterische Einheiten wurden oben dargestellt.

Eine wichtige Überlegung beim Design des chemisch modifizierten Analogs und auch des Peptidomimetikums besteht darin, alle flexiblen Teile der Struktur zu identifizieren, die durch geeignete starre oder konformativ eingeschränkte(s) Bioisostere(s) ersetzt werden sollten. Darüber hinaus können beliebige Teile oder Abschnitte der Struktur, die einem Abbau unterliegen, wenn die Peptidstruktur verabreicht wird (z. B. durch orale Verabreichung, intramuskuläre Injektion, intravenöse Injektion, subkutane Injektion oder dergleichen, wobei die orale Verabreichung derzeit am meisten bevorzugt ist) ebenfalls sein: durch Bioisostere oder Äquivalente ersetzt werden, die biologisch nicht leicht abgebaut werden und die die gewünschte Bindung zwischen Zielpeptiden und Rezeptoren oder Peptidomimetika aufrechterhalten.

Sobald das gewünschte Peptidomimetikum identifiziert wurde, kann dessen chemische Synthese unter Verwendung von Standardsynthesetechniken durchgeführt werden.

Um die Verfahren und Systeme der vorliegenden Erfindung zu veranschaulichen, werden die folgenden Beispiele für die Berechnung der wahrscheinlichsten Peptidstruktur und den Entwurf eines Peptidomimetikums vorgestellt.

Beispiel 1: Tyr-βAla-Glu-Cys-βAla-DArg

Die wahrscheinlichste Konformation für ein synthetisches Polypeptid, Thr-&bgr;Ala-Glu-Cys-&bgr;Ala-DArg, wurde gemäß dem hierin beschriebenen erfindungsgemäßen Verfahren berechnet. Somit lautete die für die Ab-initio-Berechnung verwendete Eingabedatei MASTER wie folgt: ACE 4TYR BAL GLU CYS BAL RDO NH2 END

4TYR bezeichnet die zu verwendende Dielektrizitätskonstante (4) für das Medium, in dem die Berechnung durchgeführt werden soll, und TYR ist ein Tyrosinrest

BAL ist ein β-Alaninrest

GLU ist ein Glutaminsäurerest

CYS ist ein Cysteinrest

RDO ist ein D-Arginin-Rest

NH2 ist eine Aminogruppe und

END bezeichnet das Ende der Eingabedatei.

Die obige Eingabedatei MASTER wurde dann von LINK in eine Liste von Anfangskoordinaten übersetzt, wobei die in Tabelle 2A aufgeführten Daten verwendet wurden. Die verwendeten Anfangskoordinaten geben auch an, wie die einzelnen Atome des Moleküls aneinander gebunden sind, wie in Tabelle 2B angegeben.

TABELLE 2A
______________________________________
AMINOSÄURE RES- RAUMKOORDINATEN Nr. TYP* IDUE (NR.) x y z
______________________________________

1 HA1 ACE (1) -4.625
-6.045
-0.570
2 CA ACE -4.305
-5.311
0.189
3 HA2 ACE -5.061
-5.241
0.969
4 HA3 ACE -3.356
-5.708
0.572
5 C ACE -4.062
-3.986
-0.481
6 O ACE -3.028
-3.812
-1.122
7 N REIFEN (2) -4.816
-2.963
-0.072
8 HN TYR -5.569
-3.187
0.563
9 CA-TYR -4.594
-1.575
-0.425
10 HA REIFEN -4.360
-1.571
-1.490
11 CB REIFEN -5.919
-0.850
-0.210
12 HB1 TYR -6.277
-1.124
0.782
13 HB2 TYR -6.658
-1.149
-0.956
14 CG TYR -5.808
0.647 -0.379
15 CD1 TYR -6.048
1.544 0.670
16 HD1 TYR -6.224
1.186 1.673
17 CE1 TYR -6.229
2.902 0.382
18 HE1 REIFEN -6.625
3.624 1.081
19 CZ TYR -5.768
3.415 -0.836
20 OH TYR -5.547
4.756 -0.958
21 HOH TYR -5.793
5.341 -0.238
22 CE2 TYR -5.345
2.536 -1.839
23 HE2 TYR -4.776
2.992 -2.636
24 CD2 TYR -5.503
1.158 -1.646
25 HD2 TYR -5,183
0.463 -2.408
26 C REIFEN -3.386
-0.911
0.220
27 O REIFEN -2.609
-0.254
-0.476
28 N BAL (3) -3,207
-1.013
1.540
29 HN BAL -3.826
-1.577
2.104
30 CA BAL -2.109
-0.342
2.208
31 HA1 BAL -2,195
-0.462
3.289
32 HA2 BAL -2.181
0.725 1.998
33 CB BAL -0.732
-0.918
1.890
34 HB1 BAL -0.465
-0.684
0.859
35 HB2 BAL -0.662
-1.992
2.066
36 C BAL 0,294 -0,220
2.773
37 O BAL 0,087 0,919 3,184
38 N GLU (4) 1,423 -0,889
3.018
39 HN GLU 1.435 -1.821
2.626
40 CA GLU 2.576 -0.380
3.732
41 HA GLU 2,295 0,094 4,672
42 CB GLU 3.474 -1.561
4.089
43 HB1 GLU 4.466 -1.131
4.239
44 HB2 GLU 3.460 -2.190
3.198
45 CG GLU 3.137 -2.337
5.360
46 HG1 GLU 3,974 -2,998
5.583
47 HG2 GLU 2.177 -2.849
5.288
48 CD GLU 3.136 -1.515
6.640
49 OE1 GLU 4.106 -0.747
6.822
50 OE2 GLU 2.148 -1.574
7.402
51 C GLU 3,365 0,675 2,967
52 O GLU 4.070 1.462 3.595
53 N CYS (5) 3,345 0,752 1,635
54 HN CYS 2.708 0.181 1.088
55 CA CYS 4,131 1,737 0,917
56 HA CYS 4,099 2,667 1,081
57 CB CYS 5,573 1,269 0,748
58 HB1 CYS 6.086 1.027 1.699
59 HB2 CYS 6,122 2,077 0,266
60 SG CYS 5,517 - 0,141
-0.386
61 HSG-CYS 5,176 0,589 -1.452
62 C CYS 3,458 2,015 -0,420
63 O CYS 2,867 1,073 -0,944
64 N BAL (6) 3,612 3,218 -0,978
65 HN BAL 4,227 3,838 -0,469
66 CA BAL 3,133 3,578 -2,298
67 HA BAL 3,152 2,735 -2,988
68 HA2 BAL 3.899 4.214 -2.740
69 CB BAL 1.788 4.295 -2.216
70 HB1 BAL 1.453 4.645 -3.192
71 HB2 BAL 1,768 5,185 -1 587
72 C BAL 0,684 3,370 -1.723
73 O BAL -0,018
3.655 -0.756
74 N RDO (7) 0,522 2,234 -2.411
75 HN RDO 1,238 2,153 -3,147
76 CA RDO -0.475
1.239 -2.176
77 HA RDO -0.828
1.196 -1.146
78 CB RDO 0,122 -0,129
-2.496
79 HB1 RDO -0.755
-0.777
-2.480
80 HB2 RDO 0.761 -0.369
-1.645
81 CG RDO 1.012 -0.312
-3.722
82 HG RDO 1,954 0,218 -3,579
83 HG2 RDO 0,492 0,061 -4,604
84 CD RDO 1.350 -1.770
-4.023
85 HD1 RDO 1.973 -1.768
-4.912
86 HD2 RDO 0,478 -2.353
-4.320
87 NE RDO 1.980 -2.514
-2.933
88 HNE RDO 1.379 -3.079
-2.350
89 CZ RDO 3.179 -2.214
-2.413
90 NH1 RDO 4.157 -1.668
-3.150
91 N11 RDO 4.047 -1.510
-4.141
92 N12 RDO 5.067 -1.471
-2.760
93 NH2 RDO 3.346 -2.357
-1.090
94 H21 RDO 2.592 -2.517
-0.438
95 H22 RDO 4.282 -2.208
-0.741
96 C RDO -1.701
1.650 -2.982
97 O RDO -1.752
2.752 -3.523
98 RDO
______________________________________

*Atomtypen werden wie folgt abgekürzt:

HA1 bezieht sich auf ein Wasserstoffatom am Alpha-Kohlenstoff und ist somit das erste dieser Wasserstoffatome

HA2 bezieht sich auf das 2. Wasserstoffatom am Alpha-Kohlenstoff

CA bezieht sich auf den Alpha-Kohlenstoff

C allein bezieht sich auf den Carbonylkohlenstoff

O allein bezieht sich auf den Carbonylsauerstoff

N allein bezieht sich auf den Amidstickstoff

HN bezieht sich auf den Amidwasserstoff

CB bezieht sich auf das Beta-Kohlenstoffatom

HB1, HB2 bezieht sich auf die Beta-Wasserstoffe,

CG bezieht sich auf den Gamma-Kohlenstoff

CD1 bezieht sich auf eines der Delta-Kohlenstoffatome, und

CD2 bezieht sich auf ein zweites Delta-Kohlenstoffatom

HD1 und HD2 beziehen sich auf Wasserstoffatome an den Delta-Kohlenstoffatomen

CE1 und CE2 beziehen sich auf die Epsilon-Kohlenstoffatome

HE1 und HE2 beziehen sich auf Wasserstoffatome an den Epsilon-Kohlenstoffatomen

CZ bezieht sich auf den Zeta-Kohlenstoff

OH bezieht sich auf den Hydroxyl-Sauerstoff

HOH bezeichnet den Wasserstoff der Hydroxygruppe

HG1 und HG2 beziehen sich auf die Wasserstoffatome an den Gamma-Kohlenstoffen

OE1 und OE2 beziehen sich auf die Sauerstoffatome oder den Epsilon-Kohlenstoff

SG bezieht sich auf ein Schwefelatom an einem Gamma-Kohlenstoff

HSG bezieht sich auf das Wasserstoffatom am Atom "SG"

NE bezieht sich auf ein Stickstoffatom an einem Epsilon-Kohlenstoff und

HNE ist das Wasserstoffatom auf dem Atom "NE".

TABELLE 2B
______________________________________
Atom-Nr. Gebunden an Atom-Nr.
______________________________________

1 2
2 5 1 3 4
3 2
4 2
5 7 2 6
6 5
7 9 5 8
8 7
9 11 7 10 26
10 9
11 14 12 13 9
12 11
13 11
14 15 15 11 24
15 17 16 14 14
16 15
17 19 19 18 15
18 17
19 22 20 17 17
20 19 21
21 20
22 24 24 23 19
23 22
24 25 22 22 14
25 24
26 9 27 27 28
27 26 26
28 26 29 30
29 28
30 28 31 32 33
31 30
32 30
33 30 34 35 36
34 33
35 33
36 33 37 38
37 36
38 36 39 40
39 38
40 38 41 42 51
41 40
42 40 43 44 45
43 42
44 42
45 42 46 47 48
46 45
47 45
48 45 49 49 50
49 48 48
50 48
51 40 52 52 53
52 51 51
53 51 54 55
54 53
55 53 56 57 62
56 55
57 55 58 59 60
58 57
59 57
60 57 61
61 60
62 55 63 63 64
63 62 62
64 62 65 66
65 64
66 64 67 68 69
67 66
68 66
69 66 70 71 72
70 69
71 69
72 69 73 74
73 72
74 72 75 76
75 74
76 74 77 96 78
77 76
78 76 79 80 81
79 78
80 78
81 78 82 83 84
82 81
83 81
84 81 85 86 87
85 84
86 84
87 84 88 89
88 87
89 84 93 90
90 89 92 91
91 90
92 90
93 89 94 95
94 93
95 93
96 76 97
97 96
______________________________________

Ausgehend von den in Tabelle 2A angegebenen Anfangskoordinaten wurde das Zielmolekül "erzeugt", Rest für Rest, beginnend mit einem Rest, der den Schrumpf- und Expansionsschritten der Erfindung unterzogen wurde, um eine höchstwahrscheinliche Konformation davon zu erreichen, dann der zweite Rückstand wurde hinzugefügt, der Vorgang wiederholt und so weiter. Auf diese Weise wurde eine Reihe von Ergebnissen erhalten, wie in Tabelle 2C dargestellt.

TABELLE 2C
__________________________________________________________________________
SIMULATIONSDATEN FÜR POLYPEPTID Tyr--βAla--Glu--Cys--βAla--DArg--NH2
__________________________________________________________________________

Anzahl der Rückstände:
2
ACE TYR
Atomnummer:
1 2
φ Winkel:
NAD 44
ψ Winkel:
NAD NAD
ω Winkel:
-179
NAD
3
ACE TYR BAL
1 3 3
NAD -69 -84
NAD -52 NAD
177 -176
NAD
4
ACE TYR BAL GLU
1 2 3 4
NAD -172
180 -165
NAD -52 -133 NAD
-170 177 -143 NAD
5
ACE TYR BAL GLY CYS
1 2 3 4 5
NAD -149
151 74 -167
NAD 122 175 -74 NAD
180 178 -167 -175
NAD
6
ACE TYR BAL GLU CYS BAL
1 2 3 4 5 6
NAD -48 46 94 -150 69
NAD 135 2 -38 -53 NAD
177 - 179
-156 175 176 NAD
7
ACE TYR BAL GLU CYS BAL RDO
1 2 3 4 5 6 7
NAD -72 -77 -71 -154 66 86
NAD -50 -32 -25 151 -107
NAD
170 -177
-159 -178
174 157 NAD
__________________________________________________________________________

*NAD = kein Winkel an dieser Stelle definiert

Sobald dieser Wachstumsprozess abgeschlossen ist, wird eine erste vorgeschlagene Struktur für die Zielverbindung erhalten, wie oben für die sieben Restspezies dargestellt. Die Molekulardynamiksimulation wird dann für einen zusätzlichen Zeitraum (z. B. 50–100 Pikosekunden) fortgesetzt. Die Daten aus der Molekulardynamiksimulation werden dann in regelmäßigen Abständen gesammelt (oder alternativ werden die Daten jedes Mal gesammelt, wenn die quadratische mittlere Abweichung der φ-, ψ-Werte, Bindungslängenwerte oder dergleichen um mehr als einen bestimmten Wert variiert Schwellwert). Die gesammelten Daten werden dann analysiert, um die wahrscheinlichste Konformation für die Zielstruktur zu ermitteln. Diese Analyse kann auf verschiedene Weise durchgeführt werden, z. B. durch die Konstruktion und Analyse von differentiellen Balaji-Plots, durch Analyse der Daten unter Verwendung von Mustererkennungstechniken und dergleichen.

Sobald die wahrscheinlichste Konformation des Zielpeptids bestimmt wurde, können damit verwandte analoge Strukturen identifiziert werden. Dies wird durchgeführt, indem zuerst die ,ψ-Winkel für jeden Rest der Zielverbindung mit den φ,ψ-Winkeln von eingeschränkten Dipeptidanaloga (die wie unten beschrieben bestimmt werden) verglichen werden. Dann wird die wahrscheinlichste Konformation für eine solche analoge Struktur mit einem oder mehreren darin substituierten geeigneten eingeschränkten Dipeptid-Analog(en) unter Verwendung der oben beschriebenen Methodik bestimmt.

Auf diese Weise wird ein Thioamid-Analogon des oben beschriebenen Hexapeptids vorgeschlagen: Acetyl-X1 --X2 --Glu--Cys--βAla--DArg--NH2,

wobei X1 ein Thio-Tyrosin-Rest ist und X2 ist ein Thiobeta-Alanin-Rest. Die Verbindung wird dann den zuvor beschriebenen Ab-initio-Techniken unterzogen, um die wahrscheinlichste Konformation der analogen Struktur vorherzusagen. Wie in FIG. In 11 ist die wahrscheinlichste Konformation der analogen Struktur im Wesentlichen dieselbe wie die wahrscheinlichste Konformation, die für das ursprüngliche Zielpeptid bestimmt wurde.

In ähnlicher Weise wird ein cyclisches Analogon des oben beschriebenen Hexapeptids vorgeschlagen: Acetyl-Y-Glu-Cys-βAla-DArg-NH2,

worin Y ist: worin --cy-C6 h10 -- eine 1,4-disubstituierte Cyclohexylgruppe ist und p-OH-Ph- eine para-Hydroxyphenylgruppe ist. So wurden die Tyrosin- und Beta-Alanin-Reste des ursprünglichen Zielpeptids durch die tyrosylcyclische Spezies Y.

Die cyclische analoge Verbindung wird dann den zuvor beschriebenen Ab-initio-Techniken unterzogen, um die wahrscheinlichste Konformation der analogen Struktur vorherzusagen. Wie in FIG. In 11 ist die wahrscheinlichste Konformation der cyclischen analogen Struktur im Wesentlichen dieselbe wie die wahrscheinlichste Konformation, die für das ursprüngliche Zielpeptid bestimmt wurde.

Jede der analogen Strukturen kann dann unter Verwendung von Standardsynthesetechniken hergestellt werden, wonach jede auf Bioaktivität getestet wird. Jene Verbindungen, die Bioaktivität zeigen, sind Kandidaten für Peptidomimetika, während diejenigen Verbindungen, die keine Bioaktivität zeigen, dabei helfen, Teile des Moleküls zu definieren, die besonders daran beteiligt sind, der betreffenden Verbindung Bioaktivität zu verleihen. Wo analoge Verbindungen nicht bioaktiv sind, werden zusätzliche analoge Verbindungen entworfen, dem Molekulardynamik-Simulationsverfahren der vorliegenden Erfindung unterzogen und dann auf Bioaktivität getestet. Zusätzliche analoge Strukturen werden entwickelt, indem entweder der oben beschriebene Prozess wiederholt wird und versucht wird, andere Teile der Zielstruktur chemisch modifiziert zu machen, oder indem man stattdessen versucht, chemisch modifizierte Teile der nächstwahrscheinlichsten Konformation zu erzeugen (da die thermodynamisch wahrscheinlichste Konformation möglicherweise nicht immer die biologisch aktive Form des Zielpeptids sein).

Als weiterer, optionaler Schritt können die entsprechenden physikalischen und chemischen Eigenschaften (dh Stellen der Wasserstoffbrückenbindung, Oberfläche, Atom- und Molekülvolumen, Ladungsdichte, Richtung der Ladungen usw.) von biologisch aktiven Analoga verwendet werden, um ein Sammlung von Parametern, die für die gewünschte Bioaktivität erforderlich sind. Eine Datenbank bekannter Verbindungen (z. B. die Cambridge Crystal Structure Data Base, supra) kann dann nach Strukturen durchsucht werden, die die sterischen Parameter enthalten, die für die gewünschte Bioaktivität erforderlich sind. Verbindungen, von denen festgestellt wurde, dass sie die gewünschten sterischen Parameter enthalten, werden wiedergewonnen und weiter analysiert, um zu bestimmen, welche der gewonnenen Verbindungen auch die gewünschten elektronischen Eigenschaften in Bezug auf die Zielverbindung aufweisen. Verbindungen, von denen gefunden wurde, dass sie sowohl die gewünschten sterischen als auch elektronischen Eigenschaften aufweisen, sind zusätzliche Kandidaten, da die Peptidominetiken der ursprünglichen Zielpeptid-Suchalgorithmen für dreidimensionale Datenbankvergleiche zuvor diskutiert wurden.

Bekannte Verbindungen, die auch die Sammlung von Parametern besitzen, die für die gewünschte Bioaktivität erforderlich sind, können dann getestet werden, um zu sehen, ob sie auch die gewünschte Bioaktivität besitzen. Alternativ können bekannte Verbindungen, die auch die Sammlung von Parametern besitzen, die für die gewünschte Bioaktivität erforderlich sind, modifiziert werden, um überschüssige Funktionalität zu entfernen, die für die bestimmte getestete Bioaktivität nicht erforderlich ist. Eine solche modifizierte Verbindung kann sich als einfaches, leicht herzustellendes Peptidomimetikum für das ursprüngliche Zielpeptid erweisen.

Das in Beispiel 1 beschriebene Verfahren wurde wiederholt, um Daten zu erzeugen, aus denen eine Reihe von Balaji-Plots für Ala30 (ein Oligomer aus 30 Alanin-Einheiten) hergestellt werden. Siehe ABB. 13B für eine Reihe von repräsentativen Balaji-Plots für Poly-L-Alanin, wie es Rückstand für Rückstand gezüchtet wird.

Die dreidimensionalen Koordinaten wurden temporär gespeichert, wenn jeder Rest während der Simulation hinzugefügt wurde, und die gewünschten Strukturparameter (d. h. die Winkel und ψ) wurden extrahiert. Für das ausgewachsene Polypeptid wurde die Simulation fortgesetzt und bei jeder Pikosekunde wurden die φ- und -Winkel erfasst. Beispieldaten während der Simulation sind unten in komprimiertem Format angegeben: ##STR25##

Die Balaji-Plots wurden aus Daten wie den oben gezeigten für mehrere dynamische Simulationen erstellt. Die wahrscheinlichste Konformation ist im Mikrofiche-Anhang aufgeführt. Die vollständige Entwicklung der α-helikalen Struktur wird beobachtet, nachdem die Zahl der Aminosäurereste über 2 Reste hinaus angewachsen ist. Das Balaji-Diagramm zeigt deutlich, dass es die rechtsgängige α-helikale Struktur annimmt, wie durch ein kurzes Segment von Keilen um -60° dargestellt. Das C-terminale Ende weist aufgrund der Wahl des NH . eine unregelmäßige Struktur auf2 Endgruppe. Die Vorhersage, dass Poly-L-alanin eine α-helikale Struktur annimmt, wird im Stand der Technik gut unterstützt [siehe beispielsweise Blount et al., J. Am. Chem.-Nr. Soz. 82: 3787–3789 (1960) und Kotelchuck & Scheraga, Proc. Natl. Akad. Wissenschaft USA 62:1163-1170 (1988)].

Das in Beispiel 1 beschriebene Verfahren wurde wiederholt, um einen Balaji-Plot für Gly . zu erstellen40 (Fig. 14), die die hohe Konformationsflexibilität für das Polyglycin zeigt. Eine Untersuchung der dynamischen Simulationen während des Kettenwachstums zeigt viele Übergänge von einer Struktur zur anderen, wie es für einen flexiblen Rest wie Glycin erwartet wird [Siehe zum Beispiel Ramachandran und Sasisekharan in Prot. Chem.-Nr. 23:283-437 (1868)].

Das in Beispiel 1 beschriebene Verfahren wurde wiederholt, um den Balaji-Plot für Pro . zu erstellen30 (Fig. 15), die die für Poly-L-Prolin möglichen erweiterten Strukturen zeigt, und die dreidimensionale Darstellung (in Fig. 15A gezeigt), die die wahrscheinlichste Konformation von Poly-L-Prolin veranschaulicht. Die Variabilität der φ-, -Winkel stimmt mit den für Poly-L-Proline möglichen linkshändigen Dreifach- und Vierfachstrukturen überein. (Siehe zum Beispiel Ramachandran und Sasisekharan, oben.)

Beispiel 5: Poly (Aib). Poly-L-Leucin, Poly-L-Isoleucin, Poly-L-Serin,

Poly-L-Histidin, Poly-L-phenyalanin und Poly-L-Asparaginsäure

Das in Beispiel 1 beschriebene Verfahren wurde wiederholt, um Balaji-Plots für Poly(Aib), Poly-L-leucin und andere Homopolymere ( 16 , 17 , 18 , 19 , 20 und 21 ) sowie die 3-dimensionalen Plots zu erstellen in den FIG. 17A und 18A, die die wahrscheinlichste Konformation von Poly-L-Leucin und Poly-L-Isoleucin veranschaulichen.

Während der Simulation von Aib35, ein Schlüsselübergang (Fig. 16) von linkshändig 310 für Rechtshänder 310 helikale Strukturen und Fluktuationen um diese Strukturen wurden beobachtet. Sobald ein Segment einer Struktur eine kritische Länge (>7 Reste) erreicht, wird die Struktur in ihrer Konfiguration stabilisiert. Diese Ergebnisse stimmen mit den verfügbaren experimentellen Daten über Aib-Reste und molekularmechanischen Rechnungen überein [Siehe beispielsweise Marshall & Bosshard, in Circ. Res. (Suppl. 2) 30/31: 143–150 (1972) Burgess & Leach in Biopolymers 12: 2599–2605 (1973) und Pletnev et al. in Khim. Prir. Soedin.9: 224-229 (1973)].

FEIGE. 16 zeigt, dass die Simulation überwiegend eine e-helikale Struktur ähnlich der von Poly-L-Alanin ist. Dies steht im Einklang mit mehreren früheren Studien, wie oben erwähnt.

Simulationen anderer Homopolymere wie Poly-L-Isoleucin (Fig. 17) Poly-L-Serin (Fig. 18) Poly-L-Histidin (Fig. 19) Poly-L-Phenylalanin (Fig. 20) und Poly-L- Asparaginsäure ( 21 ) sagen die wahrscheinlichsten Strukturen voraus, die mit den berichteten Strukturen in der Literatur übereinstimmen, siehe zum Beispiel Ramachandran und Sasisekharan, supra.

Beispiel für konformative Energiekarten und Balaji-Plots

Unter Verwendung der Verfahren der vorliegenden Erfindung wurden verschiedene Peptide simuliert und analysiert. Repräsentative Ergebnisse solcher Simulationen sind in den folgenden Abbildungen dargestellt. Repräsentative Daten, die wie in den obigen Beispielen formatiert sind, die die Zusammenstellung von Konformationsmerkmalen mehrerer neuer Modell-Oligopeptide, z. B. Dipeptid-Analoga, anzeigen, sind unten angegeben.

FEIGE. 12 zeigt eine Konformationsenergiekarte für ein Cyclopropyldipeptid.

FEIGE. 13A zeigt eine konformative Energiekarte für ein C-Alanyldithiopeptid

FEIGE. 14 ist ein Balaji-Diagramm von Polyglycin

FEIGE. 15 ist ein Balaji-Diagramm von Poly-L-Prolin

FEIGE. 16 ist ein Balaji-Diagramm von poly(Aib)

FEIGE. 17 ist ein Balaji-Diagramm von Poly-L-Leucin

FEIGE. 18 ist ein Balaji-Diagramm von Poly-L-Isoleucin

FEIGE. 19 ist ein Balaji-Plot von Poly-L-Serin

FEIGE. 20 ist ein Balaji-Plot von Poly-L-Histidin

FEIGE. 21 ist ein Balaji-Diagramm von Poly-L-phenylalanin und

FEIGE. 22 ist ein Balaji-Diagramm von Poly-L-Asparaginsäure.

Wie hierin beschrieben, ist somit ersichtlich, dass die vorliegende Erfindung ein Verfahren zum rationalen Arzneimitteldesign bereitstellt, das viele der Probleme oder frühere Arzneimitteldesignverfahren und -techniken minimiert. Bezeichnenderweise sagt ein solches Verfahren vorteilhafterweise die wahrscheinlichsten Tertiärstrukturen eines Polypeptids, z. B. eines Oligopeptids, ohne jegliche Annahmen bezüglich der Konformation der zugrunde liegenden Primär- oder Sekundärstruktur voraus.

Wie hierin weiter beschrieben wird, stellt die vorliegende Erfindung einen Satz nützlicher Analysewerkzeuge bereit, z. B. Balaji-Plots, Energiekonformationskarten und Wahrscheinlichkeitskarten, um die wahrscheinlichsten Peptidstrukturen sowie die Teile der vorhergesagten Peptidstruktur, die am flexibelsten und/oder am steifsten sind. Solche Werkzeuge bieten außerdem zusätzliche Einblicke in das Verständnis von tertiären und quartären Strukturen.

BESCHREIBUNG DER COMPUTERPROGRAMME

Hierin beschrieben sind die Schlüsselcomputerprogramme, die verwendet werden, um das rationale Arzneimitteldesignverfahren der vorliegenden Erfindung auszuführen. Aktuelle Computerprogrammlisten für viele der Computerprogramme sowie Muster der von solchen Computerprogrammen erzeugten Daten sind im hiermit eingereichten Mikrofiche-Anhang enthalten. Im Allgemeinen sind herkömmliche Datenverarbeitungsprogramme oder Datenkonvertierungsprogramme (z. B. zum Übertragen von Daten von einer Datei in eine andere oder zum Konvertieren von Daten von einem Koordinatensystem in ein anderes) weder enthalten noch beschrieben, da solche von Fachleuten leicht geschrieben werden können im Stand der Technik, oder sind im Handel erhältlich. Außerdem stellen die beschriebenen Programme nicht notwendigerweise alle möglichen Variationen bereit, die unter Verwendung der vorliegenden Erfindung ausgeführt werden können. Die beschriebenen Programme sind jedoch repräsentativ für alle Schlüsselprogramme, die zur Ausführung der Erfindung erforderlich sind.

Die hier beschriebenen Computerprogramme führen die folgenden Funktionen aus:

(1) Ausführen des Ab-initio-Simulationsverfahrens der vorliegenden Erfindung

(2) Erzeugen von Balaji-Diagrammen, z. B. des in den Fig. 1 und 2 gezeigten Typs. 14-22 und

(3) Generieren von Konformationsenergie-Konturkarten, z. B. des in den Fig. 1 und 2 gezeigten Typs. 9, 12 und 13 sowie Konturwahrscheinlichkeitsdaten, z. B. des in FIG. 10.

Das Ab-initio-Simulationsverfahren, wie hierin beschrieben, kann unter Verwendung eines beliebigen geeigneten Simulationscomputerprogramms ausgeführt werden, das in der Lage ist, die interessierenden Peptide zu schrumpfen und zu expandieren. Die von den Erfindern derzeit als beste Methode zur Durchführung dieses Simulationsverfahrens in Betracht gezogen wird, besteht darin, die vielen und unterschiedlichen Aufgaben, die während des Simulationsprozesses ausgeführt werden, in einzelne Programme und Unterroutinen aufzuteilen. Dann wird ein "Stapel"-Programm aufgerufen, das bewirkt, dass die verschiedenen Programme in der richtigen Reihenfolge und Reihenfolge ausgeführt werden, damit die Ab-initio-Simulation fortschreiten kann.

Es ist selbstverständlich anzumerken, dass diese Art der "Stapelverarbeitung" nicht die einzige Möglichkeit ist, die Erfindung auszuführen. Beispielsweise kann ein einzelnes ab-initio-Programm geschrieben werden, das alle notwendigen Verarbeitungsschritte des ab-initio-Prozesses kombiniert, und ein solches einzelnes Programm könnte dann ausgeführt werden. Für die gegenwärtige Zeit haben es die Erfinder jedoch zum Steuern, Debuggen und Aufrechterhalten des Simulationsprozesses für vorteilhafter gefunden, den Ab-initio-Prozess in kleinere Segmente, Module oder Teile zu unterteilen, von denen jedes eine spezifische Funktion oder Funktionen hat, und spezifische Computerprogramme schreiben (oder anderweitig erwerben), um jede Funktion(en) auszuführen. Dann wird das Batch-Programm verwendet, um die bestimmte Reihenfolge und Art und Weise zu steuern, in der die spezifischen Computerprogramme ausgeführt werden.

FIG. 23A-23G enthalten ein Flussdiagramm des derzeit bevorzugten Batch-Programms, um die Ab-initio-Simulation der vorliegenden Erfindung auszuführen. Es wird angenommen, dass dieses Batch-Programm-Flussdiagramm selbsterklärend ist. Die folgenden Kommentare dienen jedoch dem Verständnis.

Jede Figur der FIG. 23A-23G enthält einen Teil des Gesamtflussdiagramms, wobei Großbuchstaben als Verbinderbezeichnungen verwendet werden, die die Verbindung zwischen den verschiedenen Figuren zeigen. So zeigt beispielsweise FIG. 23A hat einen Zweig, der mit dem Bezeichner "A" endet, und einen Zweig, der mit dem Bezeichner "B" endet. Sowohl Bezeichner "A" als auch "B" sind die Ausgangspunkte für Verzweigungen, die in Fig. 1 erscheinen. 23B. FEIGE. 23A hat ferner einen Bezeichner "J" als Eingangszweig. Der Bezeichner "J" ist ein Ausgangszweig von FIG. 23G.

Beim ersten Start des Batch-Programms müssen die Parameter für den ersten Lauf eingestellt werden. Zu diesen Parametern gehören die Art des Laufs, "typerun", die Anzahl der Rückstände, "ncyc" und die Art des Lösungsmittels, "solvens". Der Lauftyp kann entweder ein "normaler" Lauf oder ein "Start"-Lauf sein. Ein Startlauf wird verwendet, wenn Daten zum ersten Mal in das Simulationsprogramm geladen werden. Ein normaler Lauf ist ein Lauf nach einem Startlauf, z. B. nachdem die Anfangsdaten in das Programm geladen wurden und der Wachstums- oder Erweiterungsvorgang durchgeführt wurde. Somit wird das Batch-Programm anfänglich mit "typerun" gleich "start" ausgeführt. Nach diesem ersten Durchlauf wird "typerun" automatisch gleich "normal" gesetzt (siehe Fig. 23G) und das Batch-Programm wird für so viele Reste wiederholt, wie durch den Parameter "ncyc" spezifiziert sind.

Ein Steuerparameter "icyc" verfolgt, wie oft das Batch-Programm ausgeführt wurde. Bei jedem Durchlauf des Programms wird "icyc" inkrementiert (Fig. 23G). Wenn "icyc" größer als "ncyc" ist, die Anzahl der Reste, dann endet das Programm.

Wie in den FIG. 23A-23G gibt es zahlreiche Dateien, die als "Dateneingabedateien" bezeichnet werden und zu verschiedenen Zeiten abgerufen werden. Diese Dateneingabedateien werden durch Kleinbuchstaben mit einer dreistelligen Erweiterung identifiziert, wie z. B.: linkin.ace parmgr.cdr parm.cdr parm.dat usw. Eine vollständige Liste dieser Dateneingabedateien ist unten in Tabelle A-1 dargestellt. Tabelle A-1 enthält außerdem eine kurze Beschreibung des Inhalts jeder der aufgeführten Dateien. Repräsentative Muster einiger der Dateneingabedateien sind im Mikrofiche-Anhang enthalten, der hiermit eingereicht wird.

TABELLE A-1
______________________________________
Dateneingabedateien Dateiname Beschreibung
______________________________________

aa.per Aminosäure-Störungsdaten
enormalgas.cdr
Eingabe für EDIT für "normalen" Einlauf
"Gasphase"
enormalwat.cdr
Eingabe für EDIT für "normalen" Einlauf
"Wasser"
estartgas.cdr
Eingabe für EDIT für "Start" Lauf in "Gas ."
Phase"
estartwat.cdr
Eingabe für EDIT für "Start" Einlauf
"Wasser"
linkin.ace Eingang für LINK-Modul
mingas.cdr Eingang für BORN-Modul zur Minimierung
in der Gasphase
mingasside.cdr
Eingang für BORN-Modul zur Minimierung
von Seitenketten in der Gasphase
mingshake.cdr
Eingang für BORN-Modul zur Minimierung
in der Gasphase mit SHAKE
minwatside.cdr
Eingang für BORN-Modul zur Minimierung
von Seitenketten in Wasser
parm.cdr Eingang für PARM-Modul
parm.dat Eingang für PARM-Modul
parmgr.cdr Eingang für PARM-Modul für Parameter
Abtretung
pineqgas.cdr
Eingang für GIBBS-Modul für
Gleichgewicht im Gas
pineqwat.cdr
Eingang für GIBBS-Modul für
Gleichgewicht im Wasser
pingrgas.cdr
Input für GIBBS-Modul für Wachstum in
Gas
pingrgas0.cdr
Input für GIBBS-Modul für Wachstum in
Gas
pingrgas1.cdr
Input für GIBBS-Modul für Wachstum in
Gas
pingrgas2.cdr
Input für GIBBS-Modul für Wachstum in
Gas
pingrwat.cdr
Input für GIBBS-Modul für Wachstum in
Wasser
wat216.dat Datendatei der Kiste mit Wassermolekülen
für EDIT-Modul
______________________________________

Als allgemeine Regel wird beim Abrufen von Daten aus einer der Dateneingabedateien ein Befehl "checkfile" ausgegeben, um zu überprüfen, ob die Datendatei existiert. Wenn nicht, wird eine Fehlermeldung gedruckt. Wenn die Datendatei existiert, wird ihr Inhalt typischerweise in eine "Parameterdatei" kopiert. Die Parameterdateien sind durch Großbuchstaben gekennzeichnet, z.B. "MINDESIDE". (Es ist zu beachten, dass die verschiedenen Computerprogramme oder Module, die als Teil des Stapelprogramms verwendet werden, ebenfalls durch alle Großbuchstaben gekennzeichnet sind.) 23A wird eine Prüfdatei für die Datei "linkin.ace" erstellt. Falls diese Datendatei existiert, wird sie in die Parameterdatei LINKIN kopiert.

Es wird darauf hingewiesen, dass einige der "Parameterdateien" (dh die Dateien, die durch alle Großbuchstaben gekennzeichnet sind) nicht aus Dateneingabedateien generiert werden, sondern Ausgabedateien sind, die von den verschiedenen Programmen, Modulen oder Unterprogrammen generiert werden, die als Teil des Batch-Programms. Wie beispielsweise in FIG. 23B erzeugt das Programm LINK, wenn es ausgeführt wird, die Parameterdateien LINKOUT und LINKBIN als Ausgabedateien.

Die verschiedenen Parameterdateien, die als Teil des in den FIG. 23A-23G sind unten in Tabelle A-2 angegeben. Tabelle A-2 enthält auch eine kurze Beschreibung jeder Parameterdatei, d. h. welche Daten sie enthält oder die Quelle oder das Ziel der darin enthaltenen Daten. Repräsentative Beispiele einiger der Parameterdateien sind in den Computerprogrammlisten enthalten, die im Mikrofiche-Anhang enthalten sind, der hiermit eingereicht wird.

TABELLE A-2
______________________________________
Ab Initio Parameterdateien Parameterdatei Beschreibung Ziel oder Quelle
______________________________________

SOLUTPDB-Koordinatendatei
Ausgabe von GIBBS nach
PDB-Format
PARMGRN kopiert nach PARMIN
Ausgabe von PARM
MASTER-Datei q Aminosäure
Bekannte Literatur
Wohnt zu sein
Gewachsen
MINSIDEN Aktuelle Inhalte
Neuester Lauf von BORN
von Datei
minside.cdr
LINKIN-Eingabe für LINK Von linkin.ace kopiert oder
SKLAVE
MINSIDE Eingang zu LINKFUL
Von linkin.ace kopiert oder
mingasside.cdr
PARMGR-Eingang zu LINKFUL
Von parmgr.cdr . kopiert
PERAA-Eingang zu LINKFUL
Von aa.per kopiert
SLAVE Nach LINKIN kopiert
Temporäre Ausgabedatei
von LINKFUL
LINKOUT Aminosäure-Ausgabedatei von LINK
Verlinkung und
Konnektivitätsdaten
LINKBIN Binäre Verknüpfung
Ausgabedatei von LINK
Daten zur Verwendung durch
BEARBEITEN
EDITIN Input to EDIT Von estartwat.cdr kopiert,
estartgas.cdr,
enormalgas.cdr,
oder enormalwat.cdr
INPDB Eingabe-PDB-Datei
Von SOLUTPDB kopiert
MCWAT Wasserkisten
Von wat216.dat kopiert
Moleküle
EDITOUT Daten, die eine Datei von EDIT ausgeben
beschreibt Amino
Säureatome
umgeben von
Lösungsmittelatome
EDITBIN Binärdaten für
Ausgabedatei von EDIT
Verwendung durch PARM
PARMIN Eingabe in PARM Von parm.cdr . kopiert
PARMDAT-Eingabe in PARM Von parm.dat kopiert
PARMOUT Daten, die zuordnen
Ausgabedatei von PARM
Parameter zu
Atome
PPARM-Störungsdaten
Ausgabedatei von PARM
INPCRD-Anfangskoordinate
Ausgabedatei von PARM
Daten
MININ Eingabe zu BORN Von MINSIDEN kopiert
MINOUT Ausgabekoordinate
Ausgabedatei von BORN
Daten von BORN
RESTRT minimiert (geschrumpft)
Ausgabedatei von BORN
Koordinatendaten
MINFO-Koordinatendaten
Ausgabedatei von BORN
während
Minimierung bei an
fortgeschrittenes Stadium
PARMIN Eingabe in PARM Von PARMGRN kopiert
PINCRD-Eingabekoordinate
Von RESTRT kopiert oder
Daten zu GIBBS PERST
PIN-Eingabe für GIBBS
Von pineqgas.cdr kopiert,
pingrgas0.cdr,
pingrgas1.cdr,
pingrgas2.cdr,
pineqwat.cdr,
oder pingrwat.cdr
PERST-Koordinatendaten
Ausgabe von GIBBS
POUT Hauptausgangsdaten
Ausgabe von GIBBS
von POUT
PINFO-Zwischenausgabe von GIBBS
Ausgabe
SOLUT0PDB PDB-Koordinaten
Von SOLUTPDB kopiert
SOLUT1PDB PDB-Koordinaten
Von SOLUTPDB kopiert
SOLUT2PDB PDB-Koordinaten
Von SOLUTPDB kopiert
______________________________________

Die Computerprogramme, die als Teil des gesamten Batch-Programms von FIG. 23A-23G sind unten in Tabelle A-3 aufgeführt. Computerprogrammlisten der Schlüsselprogramme, die erforderlich sind, um die Ab-initio-Simulation der vorliegenden Erfindung auszuführen, sind im Mikrofiche-Anhang enthalten, der hiermit vorgelegt wird.

TABELLE A-3
______________________________________
Ab-Initio-Computerprogramme
______________________________________

VERBINDLICHE GEBOREN
VERBINDUNGSPARM
GIBBS BEARBEITEN
______________________________________

Das Programm LINKFUL übernimmt die Funktion der Verknüpfung der Aminosäureatome während einer vollständigen Wachstumsoption.

Das Programm LINK führt die Funktion des Verknüpfens oder Verbindens der Aminosäureatome durch, wenn die Atome nicht die volle Größe aufweisen, d. h. wenn die Atome geschrumpft sind oder weniger als die volle Größe aufweisen.

Das Programm EDIT übernimmt die Funktion des Kombinierens oder Umgebens der Aminosäureatome mit Lösungsmittelatomen.

Das Programm PARM führt die Funktion durch, den Aminosäureatomen verschiedene Parameter, z. B. Koordinaten, Bindungslängen usw., zuzuordnen.

Das Programm BORN entnimmt der Parameterdatei MININ die Daten, die die Minimierungsparameter und -bedingungen definieren, und minimiert die Geometrie der Aminosäurereste auf optimale Werte. Eine Programmliste des BORN-Programms ist im hiermit eingereichten Mikrofiche-Anhang enthalten.

Wie in FIG. 23D besteht eine der Optionen, die mit dem Ausführen des BORN-Programms verbunden sind, darin, das Minimieren oder Verkleinern mit einer Shake-Option durchzuführen. Die Shake-Option wird verwendet, um die Bindungslängen auf ihre Gleichgewichtswerte zu beschränken. Ohne diese Option könnten sich einige der Bindungen verlängern oder schrumpfen, um andere Eigenschaften des Systems zu erfüllen.

Das Programm GIBBS erweitert die Größe des simulierten Rückstands gemäß einem definierten Protokoll, wie in der Spezifikation beschrieben. Dies ist eines der Schlüsselprogramme des Ad-initio-Simulationsprogramms. Eine Programmliste des GIBBS-Programms ist im hiermit eingereichten Mikrofiche-Anhang enthalten.

Wie in den FIG. 23E und 23F wird GIBBS während des Batch-Programms mehrmals ausgeführt. Ein Lauf wird als "Äquilibrierungslauf" bezeichnet. Der Äquilibrierungslauf wird durchgeführt, um das Lösungsmittel und den gelösten Stoff in ein thermodynamisches Gleichgewicht zu bringen, bevor eine Störung durchgeführt wird. Ein weiterer Lauf von GIBBS, der nach dem Äquilibrierungslauf durchgeführt wird, ist ein oder mehrere "Störungsläufe". Der Perturbation Run führt das Wachstum der Moleküle von einer geschrumpften Größe auf eine normale Größe durch.

Die Bildung von Balaji-Plots ist einfach, sobald die φich,ich Winkeldaten für jeden Rest, i, über die gewünschten Zeitintervalle wurden gesammelt oder werden anderweitig zur Verfügung gestellt. Die automatische Erzeugung solcher Plots wird durch die Verwendung eines Computers stark erleichtert. Die Programme, die zur Erstellung solcher Plots verwendet werden, sind im Mikrofiche-Anhang enthalten, der hiermit eingereicht wird. Eines der Programme im Mikrofiche-Anhang ist "PHIPSI". Das PHIPSI-Programm druckt die φ, ψ-Werte nach jedem Wachstumsschritt aus.

A3. Conformational Energy Contour Maps Contour-Wahrscheinlichkeitsdaten

Die Erzeugung der konformationellen Energiekonturkarten und der Konturwahrscheinlichkeitsdaten des Typs, der in den FIG. 9, 10, 12 und 13 wird auch durch die Verwendung speziell für diesen Zweck geschriebener Computerprogramme erheblich erleichtert. Wie im Hauptteil der Spezifikation angegeben (siehe die Spezifikation unter der Überschrift "The Conformational Energy Map"), wird ein geeignetes molekularmechanisches Simulationsprogramm verwendet, um diese Bemühungen zu unterstützen. Die bevorzugten Computerprogramme zum Ausführen dieser Funktionen sind unten in Tabelle A-4 angegeben. Auflistungen von Computerprogrammen der in Tabelle A-4 gezeigten Programme, die nicht im Handel erhältlich sind, sind im hiermit eingereichten Mikrofiche-Anhang enthalten.

Im Allgemeinen läuft das Protokoll zur Erzeugung der Energie- und Konturkarten wie folgt ab: (1) ein Molekül wird mit einem geeigneten Grafikpaket wie MOGLI erstellt und (2) eine molekularmechanische Berechnung wird mit einem geeigneten molekularmechanischen Paket durchgeführt, wie z als AMBER oder MMR, unten in Tabelle A-4 identifiziert. Die molekularmechanischen Berechnungen werden in 10°-Intervallen für φ, ψ-Winkel von 0° bis 360° durchgeführt. Die Daten aus den molekularmechanischen Berechnungen werden gesammelt, wenn die Berechnungen in jedem Intervall durchgeführt werden, und die Daten werden dann analysiert und/oder grafisch dargestellt.

TABELLE A-4
______________________________________
Programme zur Erzeugung von Energie-/Wahrscheinlichkeitskarten Name des Programms Programmfunktion der Programmquelle
______________________________________

MOGLI vs. 2.1
Simuliert ein Molekül
EVANS &
SUTHERLAND
SLC, Utah
AMBER Molekulare Mechanik
U. C. Singh 1
MMR Molekulare Mechanik
U. Burkert 2
MP.MAP-Kartendaten für einen bestimmten
AMBER oder MM2
Molekül (Siehe Mikrofiche
Energie
Anhang für Muster)
Berechnungen
TEMPMAP.DAT
Eingabedaten, die zum Erstellen verwendet wurden
AMBER oder MM2
Konturkarten und auswerten
Wahrscheinlichkeiten (Siehe Mikrofiche
Anhang für Muster).
Kartenprotokoll
Befehlsverfahren (Batch
Mikrofiche
Programm) verwendet, um eine Karte zu generieren
Anhang
druckt.
Karte-- Prob.com
Befehlsverfahren verwendet
Mikrofiche
eine Energieanalyse durchführen
Anhang
Daten.
MP.ENR Energiekartendaten
(Siehe Mikrofiche-Anhang
für Probe)
MP.PRB Porbability Map-Daten
(Siehe Mikrofiche-Anhang
für Probe)
MP.PER Prozent Beschäftigung am
Energiekonturdaten
(Siehe Mikrofiche-Anhang
für Probe)
MP.PS Aufgezeichnete Energiekontur
Karte (Siehe Mikrofiche
Anhang für Probe,
sowie FIG. 9 und 12)
Karte-- Prob.für
Extraktion von Daten aus
Mikrofiche
Energy Runs und Genera-
Anhang
Wahrscheinlichkeit und
Energiediagramme (verwendet mit
Standard-VAX
Grafik-Dienstprogramme)
MAP88.FOR erzeugt Energiediagramme
Mikrofiche
Nur als f (φ, ψ)
Anhang
POST3.FOR Erzeugt Plots mit Post
Mikrofiche
Skript-Laserdrucker
Anhang
______________________________________

1 UC Singh, PK Weiner, JS Caldwell und PA Kollman, University of California, San Francisco, 1986. (AMBER Version 3.3 ist eine vollständig vektorisierte Version von AMBER Version 3.0 und beinhaltet Koordinatenkopplung, Intra.inter-Zerlegung und die Option, die Polarisationsenergie als Teil der Gesamtenergie.) Siehe auch SJ Weiner PA Kollman, DA Chase, UC Singh, C. Ghio, G. Alagona, S. Profeta, Jr. und P. Weiner, J. Am. Chem.-Nr. Soc., Bd. 106, s. 765 (1984). 2 U. Burkert und N. L. Allinger, Molecular Mechanics, American Chemical Society, Washington, D. C. (1982) Hinweis: Das MMR-Kraftfeld für Kohlenwasserstoffe wurde erstmals von N. L. Allinger, J. Am. Chem.-Nr. Soc., Bd. 99, s. 8127 (1977). Erweiterungen auf funktionalisierte Moleküle und alle anderen Arten von Spezialproblemen wurden in nachfolgenden Veröffentlichungen beschrieben. Die Originalversion des Programms (MM2(77)) ist beim Quantum Chemistry Program Exchange, University of Indiana Bloomington, Indiana 47405, Program 395 erhältlich.

Um die Struktur-Aktivitäts-Beziehungen natürlich vorkommender Oligopeptid-basierter Medikamente zu verstehen, wurden Strategien zur Einführung von Beschränkungen ausgiebig untersucht. Durch Untersuchung der konformativen Restriktionen auf Dipeptidebene, z. B. durch Betrachtung von Peptidmimetika wie Thioamiden, N-Methylpeptiden und Seitenkettenmodifikationen wie der Einführung von Aib-Resten, substituierten und unsubstituierten cyclischen Propyl-, Butyl-, Pentylringen und anderen ähnlichen Strukturen wurden Konformationsmerkmale mehrerer Peptidanaloga zusammengestellt. Eine solche Zusammenstellung kann als "Datenbank" von Konformationsmerkmalen beschrieben werden. Eine systematische Untersuchung einer solchen Zusammenstellung, die z. B. mit einem Computer durchgeführt wird, schlägt vorteilhafterweise Peptid-Analoga-Ersetzungen (Hauptketten- sowie Seitenketten-Modifikationen) in einem Ziel-Oligopeptid unter Verwendung geeigneter Ähnlichkeitskriterien wie Aminosäurevolumen, Oberfläche, Ladung, usw. Eine solche Zusammenstellung stellt somit ein wertvolles Werkzeug bereit, das bei der Identifizierung einer bioaktiven Konformation eines Ziel-Oligopeptids und beim Design geeigneter peptidomimetischer Wirkstoffe von immensem Nutzen ist.

Die Konformationsmerkmale mehrerer Peptidanaloga auf Dipeptidebene wurden berechnet und zusammengestellt, und repräsentative Berechnungen und Zusammenstellungen sind im hiermit eingereichten Mikrofiche-Anhang enthalten. Diese Zusammenstellungen werden im Mikrofiche-Anhang als "Datenbank der konformativen Merkmale" bezeichnet. Ferner umfassen repräsentative Einheiten einer solchen Zusammenstellung bekannte Peptidbindungs-Isostere-Dipeptid-Modellverbindungen mit Seitenkettenmodifikation sowie Seitenkettensubstitutionen. Es wird darauf hingewiesen, dass Konformationseinschränkungen auch durch Cystinbrücken und ihre Analoga erreicht werden können, wie unten gezeigt.

Eine Erläuterung, die die Art und Weise der Verwendung der hierin enthaltenen Informationen und ähnlicher Informationen veranschaulicht, wird in Balaji et. al., "Mean Geometry of the Thiopeptide Unit and Conformational Features of Dithiopeptides and Polythiopeptides", Biochemical and Biophysical Research Communications, 145(2): 834-841 (15. Juni 1987), welcher Artikel hier durch Bezugnahme aufgenommen ist.

TABELLE B-1
______________________________________
In der Literatur beschriebene Peptidbindungsisostere. [CONCH3] N-Methyl-Peptid [CSNH] Thiopeptid (Thioamid) [CSNCH3] N-Methyl-Thiopeptid [COO] Ester isostere. [CH(OH)CH2 ] Hydroxyethylen-Isostere [CHCH] Doppelbindungs-Isostere [CH2 CH2 ] Dimethylenisostere [CHOHCHOH] Diolisostere [CHOHCHCHCO] Hydroxy-Doppelbindungsisostere [CHOHCHOHCHOHOHCO] Trihydroxyisostere [CHOHCH2 ] Hydroxyethylen-Isostere [COCH2 ] Ketomethylenisostere [CH2 NH] Methylenaminoisostere [CH2 NOH] Methylenhydroxyaminoisostere [CH2 S] Methylenthioisostere [CH2 SO] Methylenthio-Isostere Typische Peptid-Isostere (einschließlich Peptid)-Strukturen. Peptid N-Methylpeptid Thiopeptid (Thioamid) N-Methylthiopeptid (Thioamid) Doppelbindungsisostere Ester Isostere Dimethlenisostere Hydroxyethyleneinheit Epoxidisostere Methylenthioisostere 1 Methylenthioisostere 2 Methylenthioisostere 3 # Dipeptid-Modellverbindungen mit Seitenkettenmodifikationen. Typische untersuchte Dipeptid-Modellverbindung (siehe Tabelle I S2 = H S1 = H und S1 = CH3 entsprechen Glycyl- bzw. L-Alanyl-Seitenketten. R1 und R3 können O oder S sein. R2 und R4 können H&sub2; und CH3 S1 = S2 = CH3 entspricht dem Aib (α-Aminoisobuttersäure)-Rest. Andere untersuchte Verbindungen umfassen S2 = H und S1 = C6H6 und S1 = S2 = C6H6 Seitenketten Typische untersuchte Dipeptid-Modellverbindungen. Siehe Tabelle B-2 mit cyclischen Seitenketten S11, S12, S21, S22 entweder H oder CH3 oder Kombination von H und CH3 n = 0, 1, 2, 3, 4, 5 entsprechen jeweils Cyclopropyl, Butyl, Pentyl-, Hexyl-, Heptyl- und Octyl-Seitenketten Bei vielen cyclischen Seitenketten werden unterschiedliche Faltenzustände betrachtet.
______________________________________

TABELLE BI
______________________________________
Verschiedene Peptidthiopeptide, die dipeptidähnliche Modellverbindungen für eine gegebene Seitenkette enthalten VERBINDUNG* NR. R1 R2 R3 R4
______________________________________

1 0 H 0 H
2 0 CH3 0 H
3 0 H 0 CH3
4 0 CH3 0 CH3
5 S H S H
6 S CH3 S H
7 S H S CH3
8 S CH3 S CH3
9 S H 0 H
10 S CH3 0 H
11 S H 0 CH3
12 S CH3 0 CH3
13 0 H S H
14 0 CH3 S H
15 0 H S CH3
16 0 CH3 S CH3
______________________________________

*Anmerkung: Wenn R2 = CH# ist, werden für die erste Peptideinheit sowohl cis- als auch trans-Konfigurationen berücksichtigt (führt zu insgesamt 24 Modellverbindungen).

Hierin dargestellt ist ein repräsentativer Datensatz der Aminosäurereste, die mit den Ab-initio-Techniken der vorliegenden Erfindung verwendet werden können. Eine Tabelle ist enthalten, Tabelle C-1, die den Datensatz für Alanin enthält. Ähnliche Tabellen könnten ohne weiteres für die anderen möglichen Aminosäuren bereitgestellt werden. Die Daten werden zweckmäßigerweise in Computerdateien organisiert, die zur Verwendung durch die Ab-initio-Techniken der vorliegenden Erfindung geeignet sind. Computerdateien für alle Aminosäuren, die bei der vorliegenden Erfindung verwendet werden, werden im hiermit eingereichten Mikrofiche-Anhang bereitgestellt. Die Namen dieser Computerdateien sind in Tabelle C-2 angegeben.

Die Daten werden in Tabelle C-1 im Wesentlichen auf dieselbe Weise formatiert wie in den Computerdateien, die im Mikrofiche-Anhang enthalten sind. Eine Erläuterung dieses Formats für Tabelle C-1 folgt.

Oben in Tabelle C-1 steht links der Begriff "ALANIN", der die bestimmte Aminosäure identifiziert, für die der Datensatz gilt. Unter diesem Begriff steht der Name der Computerdatei, in der sich die ALANINE-Daten befinden: ALA.DBS.

Die ersten beiden Spalten zeigen die Ordnungszahl und das jeweilige Atom von Alanin. Beachten Sie, dass die ersten drei Atome, wie in Tabelle C-1 konfiguriert, "Dummy"-Atome sind, die mit "DUMM" gekennzeichnet sind. Der erste Buchstabe identifiziert das Atom, während nachfolgende Buchstaben oder Ziffern konventionelle Variationen desselben definieren. Eine Erläuterung dieser Buchstaben und/oder Zahlen kann in der Erläuterung von Tabelle 2A gefunden werden, die in Verbindung mit Beispiel 1 präsentiert wird, das in der Beschreibung diskutiert wird. Die dritte Spalte liefert weitere Informationen über das jeweilige Atom, z. B. den Typ der Atomart. HC bedeutet beispielsweise Wasserstoff, der an einen Kohlenstoff gebunden ist. CT bedeutet jeden sp 3 -Kohlenstoff und CA bedeutet jeden sp 2 -Kohlenstoff. Die dritte Spalte ist nützlich, um geeignete Kraftfeldparameter für die Zuordnung zu den Atomen zu identifizieren.

Die vierte Spalte stellt Konnektivitätsinformationen bereit, die jedem der Atome der Aminosäure zugeordnet sind. Diese Informationen werden durch einen einzelnen Buchstaben-/Zahlencode mit folgender Bedeutung bereitgestellt: M=Haupt-E=Endatom S=ein einziger Zweig ist alles, was an das Atom angehängt werden kann B=zwei Zweige können an das Atom angehängt werden und 3 = drei Zweige können an das Atom gebunden sein. Die fünfte, sechste und siebte Spalte stellen Bezugsatomzahlen bereit, die in Verbindung mit der achten, neunten und zehnten Spalte verwendet werden, um ein internes Koordinatensystem und Bezugspunkte für Bindungslänge, Bindungswinkel und Diederwinkel zu definieren. Für das vierte Atom "N" liefern beispielsweise die fünfte sechste und siebte Spalte die Referenzatomzahlen relativ zu der Bindungslänge, dem Bindungswinkel und den Diederwinkel-Informationen, die in der achten, neunten bzw. zehnten Spalte bereitgestellt werden.

Unterhalb der oben beschriebenen zehn Spalten befindet sich eine Datenmatrix mit dem Titel "CHARGE". Die Zahlen in dieser Matrix repräsentieren die Ladung der jeweiligen Atome beginnend nach den Dummy-Atomen. Wie in Spalte 2 zu sehen ist, enthält ALANIN also 10 Atome, die ersten drei Dummy-Atome nicht mitgezählt. Daher enthält die Ladungsmatrix zehn Zahlen, eine für jedes Atom in ALANINE. Die in der Matrix enthaltenen Ladungswerte werden zuerst horizontal gelesen. Somit entspricht die erste Zahl -0.75456 der Ladung auf N, dem ersten Nicht-Dummy-Atom (Atom #4) in Spalte 2. Die zweite Zahl 0.32541 entspricht der Ladung auf HN, dem zweiten Nicht-Dummy-Atom (Atom #5 ) in Spalte 2 usw., wobei die letzte Zahl -0.57859 dem letzten Nicht-Dummy-Atom (Atom Nr. 13) in Spalte 2 entspricht.

Unterhalb der Ladungsmatrix wird eine weitere Matrix angezeigt, die als "UNPROPER"-Matrix bekannt ist.

Für einige Aminosäuren kann es auch Informationen zum "Schleifenschließen" geben.

TABELLE C-1
__________________________________________________________________________
ALANIN ALA.DBS 1 2 3 4 5 6 7 8 9 10
__________________________________________________________________________

1 DUMM DU M 0 -1 -2 0.0000
0.0000
0.0000
2 DUMM DU M 1 0 -1 1.4490
0.0000
0.0000
3 DUMM DU M 2 1 0 1,5220
111.1000
0.0000
4 N N M 3 2 1 1,3350
116.6000
180.0000
5 HN H E 4 3 2 1.0100
119.8000
0.0000
6 CA CT M 4 3 2 1.4490
121.9000
180.0000
7 HA HC E 6 4 3 1.0900
109.5000
300.0000
8 CB CT 3 6 4 3 1,5250
111.1000
60.0000
9 HB1 HC E 8 6 4 1.0900
109.5000
60.0000
10 HB2 HC E 8 6 4 1.0900
109.5000
180.0000
11 HB3 HC E 8 6 4 1.0900
109.5000
300.0000
12 C C M ​​6 4 3 1.5220
111.1000
180.0000
13 O O E 12
6 4 1.2290
120.5000
0.0000
AUFLADEN
-0.75456 0.32541
0.38159 0.01026
-0.34851
0.09672 0.09672
0.09672 0.67424
-0.57859
UNSACHGEMÄSS
-M CA N HN
CA +M C O
__________________________________________________________________________

TABELLE C-2
__________________________________________________________________________
Datensatz Datensatz Computer Computer Aminosäuredatei Name der Aminosäuredatei Name* Name Name
__________________________________________________________________________

ALANINE ALA.DBS
ENDGRUPPEN ACETYL
ACE.DAT
UND NH2 NH2.DAT
PHENYLALANIN
PHE.DBS
ALPHA AMINO AIB.DBS
ISOBUTTYRISÄURE
TYROSINE TYR.DBS
D-ALA ADO.DAT
VALIN WERTDAT
D-ARGININ RDO.DAT
LYSIN CYS.DBS
D-SPARAGIN NDO.DAT
PROLINE PRT.DAT
D-ASPARTINSÄURE
DDO.DAT
GLYZIN GLY.DBS
D-CYSTEINE CD1.DAT
LEUCINE LEU.DBS
D-CYSTEIN (S-S
CD2.DAT
BRÜCKE)
ISOLEUCIN ILE.DBS
D-GLUTAMIN QDO.DAT
CYSTEINE CYS.DBS
D-GLUTAMIC SÄURE
EDO.DAT
CYSTIN (S-S
CYX.DBS
D-HISTIDIN (delta
HD1.DAT
BRÜCKE) H)
METHIONIN MET.DBS
D-HISTIDIN (delta
HD2.DAT
Epsilon)
GLUTAMINSÄURE
GLU.DBS
D-HISTIDIN (+)
HD3.DAT
GLUTAMIN GLN.DBS
D-ISOLEUCIN IDO.DAT
ARGININ ARG.DBS
D-LEUCINE LDO.DAT
HISTIDIN HID.DBS
D-LYSIN KDO.DAT
DELTA
HISTIDIN HIE.DBS
D-METHIONIN MDO.DAT
EPSILONH
HISTIDIN PLUS
HIP.DBS
D-PHENYLALANIN
FDO.DAT
TRYPTOPHAN TRP.DBS
D-PROLINE PDO.DAT
SPARAGIN ASN.DAT
D-SERINE SDO.DAT
ASPARAGINSÄURE
ASP.DAT
D-THREONIN TDO.DAT
SERINE SER.DAT
D-TRYPTOPHAN WDO.DAT
THREONIN THR.DAT
D-TYROSINE YDO.DAT
MONO-GLUTAMAT
GLO.DAT
D-VALINE VDO.DAT
GLUTAMAT GLE.DAT
BETA-ALANIN BAL.DAT
__________________________________________________________________________

Während die hierin offenbarte Erfindung mittels spezifischer Ausführungsformen und Anwendungen derselben beschrieben wurde, könnten zahlreiche Modifikationen und Variationen von Fachleuten daran vorgenommen werden, ohne vom Umfang der Erfindung abzuweichen, der in den Ansprüchen dargelegt ist.