Information

Geschätzte Proteingröße anhand von CDs-Daten

Geschätzte Proteingröße anhand von CDs-Daten


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Die Anzahl der Aminosäuren in einem Protein ist wichtig, um ihre Größe vorherzusagen. Ich habe die kodierende DNA-Sequenz (CDs) verwendet, um die durchschnittliche Proteingröße von . vorherzusagen E.coli k12 aus einer Probe zur Verfügung gestellt von derseqinrR-Paket. Die Größe jeder Sequenz wird in einer Variablen gespeichertx. Ich habe zwei Histogramme verwendet, um die Verteilung dieser Variablen und ihren Logarithmus anzupassen.

Ich schlage vor, dass die logarithmische lineare Verteilung vernünftiger ist. Der Durchschnitt E kann dann berechnet werden:

E1=Mittelwert(x)/3 E2=Exp(Mittelwert(log(x)))/3
  • Welchen Durchschnitt muss ich verwenden?
  • Gibt es eine Korrelation zwischen der Basiszusammensetzung und dem vorhergesagten Durchschnitt?

RefSeq nicht-redundante Proteine

Mitte 2013 wurde ein neuer Typ des RefSeq-Protein-Records eingeführt, der nicht-redundante Proteinsequenzen repräsentiert. Dieser Datensatztyp wurde eingeführt, um ein wachsendes Problem mit Redundanz im prokaryotischen RefSeq-Proteindatensatz anzugehen, das mit einem signifikanten Anstieg der bakteriellen Genom-Einreichungen von einzelnen Isolaten und eng verwandten Bakterienstämmen zusammenfiel. Beispielsweise kann während eines Krankheitsausbruchs eine große Anzahl hochwertiger Bakteriengenome vorgelegt werden. Die eingereichten Sequenzen können die Entwicklung des Pathogens im Verlauf des Ausbruchs widerspiegeln, aber die Mehrheit der kodierten Proteine ​​aus diesen Genomen können identisch sein. Da RefSeq diese Genome enthält, führte dies auf Anfrage der Community zu einer erhöhten Redundanz. Durch die Darstellung identischer Proteine ​​unter Verwendung einer einzelnen nicht-redundanten Protein-Zugangsnummer (mit dem Präfix 'WP_') wird die Redundanz in der Datenbank erheblich reduziert.

Nicht redundante RefSeq-Proteinaufzeichnungen werden derzeit für archaeale und bakterielle RefSeq-Genome, mit Ausnahme ausgewählter Referenzgenome, von der prokaryotischen Genom-Annotationspipeline des NCBI bereitgestellt. Diese Definition des Geltungsbereichs kann sich in Zukunft ändern, um zusätzliche RefSeq-Unterkönigreiche oder andere Organismengruppen einzubeziehen, und einige konzeptionelle Translationsproteinaufzeichnungen der GenBank können Querverweise zu nicht redundanten RefSeq-Proteinen bereitstellen.

Wenn die NCBI-Genomannotationspipeline ein bakterielles Protein annotiert, das zu 100% identisch ist und die gleiche Länge wie ein vorhandenes nicht-redundantes Protein hat, wird NCBI dieses Protein im Genom annotieren, indem es auf die WP_-Akzession im annotierten CDS-Merkmal verweist. Jede Anmerkung der Proteinfunktion im Genomdatensatz, wie z. B. der Proteinname, wird von dem unabhängig verwalteten, nicht redundanten Proteindatensatz geerbt. Nicht-redundante Proteinaufzeichnungen stellen immer eine exakte Sequenz dar, die ein- oder mehrmals in verschiedenen Stämmen oder Spezies beobachtet wurde. Diese Datensätze haben immer die Versionsnummer '1', da die Sequenz nie geändert wird, obwohl der Name und andere beschreibende Anmerkungen beibehalten und aktualisiert werden. Einzelne nicht-redundante Proteineinträge werden unterdrückt, wenn dieses identische Protein in keinem RefSeq-Genom mehr gefunden wird.

Da in RefSeq-Genomen mehrerer Spezies eine nicht redundante Proteinsequenz gefunden werden kann, spiegeln die im Proteindatensatz bereitgestellten Informationen zum Organismus den niedrigsten gemeinsamen taxonomischen Knoten wider, der vom Gattung Arten Level zum Super-Königreich. Ein nicht redundanter Proteineintrag, der Organismeninformationen auf der Ebene einer Gattung, Familie oder sogar eines Superkönigreichs liefert, bedeutet nicht, dass das Protein in allen RefSeq-Genomen unterhalb dieser taxonomischen Klassifikation gefunden wird. Es weist nur darauf hin, dass das Protein in mehr als einem Genom verschiedener Arten vorkommt, für die die Gattungs-, Familien- oder Superkönigreich-Klassifikation der niedrigste gemeinsame taxonomische Knoten ist. Im Allgemeinen sind identische Proteine, die in mehreren Arten vorkommen, hoch konserviert oder das Ergebnis eines lateralen Gentransfers (entweder durch Rekombination oder Plasmide und Phagen), aber in einigen Fällen kann dies ein Hinweis darauf sein, dass der Organismus in den eingereichten Genomsequenzdaten falsch klassifiziert wurde, was ist die Quelle des RefSeq-Genoms. Ein zusätzlicher Vorteil dieses Ansatzes für die Genom-Annotation besteht darin, dass er diese Art von Problemen in den Eingabesequenzen aufdeckt und so bei der laufenden RefSeq-Kuration hilft, während wir diese Probleme im Laufe der Zeit beheben.

Referenzgenome und Proteome

Wenn ein wichtiges repräsentatives Genom existiert, wie z Escherichia coli K12 Unterstr. MG1655 wird das Referenzgenom mit stammspezifischen Referenzproteinakzessionen mit dem Präfix NP_ oder YP_ annotiert. Diese Proteineinträge beziehen sich auf den übereinstimmenden nicht redundanten Proteineintrag (WP_) im Sequenzblock. Somit werden Referenzproteomaufzeichnungen (NP_ oder YP_) weiterhin taxonomisch orientierte Proteinsätze definieren und Sequenzänderungen im Laufe der Zeit verfolgen. Wenn ein Referenzprotein-Datensatz durch Kuration überarbeitet wird und sich seine Versionsnummer ändert, bezieht er sich nun auf einen anderen nicht redundanten (WP_) Datensatz, der mit der aktualisierten Referenzproteinsequenz identisch ist.


Strukturen und Verteilungen von SARS-CoV-2-Spike-Proteinen auf intakten Virionen

Die Virionen des schweren akuten respiratorischen Syndroms Coronavirus 2 (SARS-CoV-2) sind von einer Lipiddoppelschicht umgeben, aus der Spike (S)-Proteintrimere herausragen 1 . Stark glykosylierte S-Trimere binden an den Angiotensin-Converting-Enzym-2-Rezeptor und vermitteln den Eintritt von Virionen in die Zielzellen 2-6 . S weist umfangreiche konformative Flexibilität auf: Es moduliert die Exposition seiner Rezeptor-Bindungsstelle und durchläuft anschließend eine vollständige strukturelle Neuordnung, um die Fusion von viralen und zellulären Membranen voranzutreiben 2,7,8 . Die Strukturen und Konformationen von löslichen, überexprimierten, gereinigten S-Proteinen wurden im Detail mit Kryo-Elektronenmikroskopie 2,7,9-12 untersucht, aber die Struktur und Verteilung von S auf der Virionoberfläche bleiben unbekannt. Hier haben wir Kryo-Elektronenmikroskopie und Tomographie angewendet, um intakte SARS-CoV-2-Virionen abzubilden und die hochauflösende Struktur, Konformationsflexibilität und Verteilung von S-Trimeren in situ auf der Virionoberfläche zu bestimmen. Diese Ergebnisse zeigen die Konformationen von S auf dem Virion und bieten eine Grundlage, um die Wechselwirkungen zwischen S und neutralisierenden Antikörpern während einer Infektion oder Impfung zu verstehen.

Interessenkonflikt-Erklärung

Konkurrierende Interessen: Die Autoren haben keine konkurrierenden Interessen.

Figuren

Erweiterte Daten Abb. 1. Charakterisierung von SARS-CoV-2…

Erweiterte Daten Abb. 1. Charakterisierung der SARS-CoV-2-Virion-Morphologie.

( ein ) Histogramm von Virion…

50°, was darauf hinweist, dass höhere Neigungen nicht bevorzugt werden. Die horizontale rote gestrichelte Linie zeigt die Winkelverteilung des Rauschens (Spikes, die nicht ausgerichtet wurden), geschätzt basierend auf der Winkeldichte zwischen 140° und 180°. (D) Schematische Darstellung und Beispiele einzelner geneigter Spikes auf Virionen. Das Schema zeigt den gemessenen Winkel an. Auf tomographischen Schnitten durch ein intaktes Virion sind fünf Beispiele einzelner geneigter Spikes mit ihrem zugehörigen Winkel markiert. Maßstabsbalken 50 nm.

Erweiterte Daten Abb. 2. Morphologie von SARS-CoV-2…

Erweiterte Daten Abb. 2. Morphologie von SARS-CoV-2-Virionen, die aus infizierten Calu-3-Zellen freigesetzt wurden.

Erweiterte Daten Abb. 3. Klassifizierung von SARS-CoV-2…

Erweiterte Daten Abb. 3. Klassifizierung von SARS-CoV-2-Spike-RBDs.

( ein ) Klassendurchschnitte erhalten…

Erweiterte Daten Abb. 4. Auflösungsbewertung von…

Erweiterte Daten Abb. 4. Auflösungsbewertung von Subtomogramm-Mittelungsstrukturen.

Erweiterte Daten Abb. 5. Einzelpartikel-Kryo-EM…

Erweiterte Daten Abb. 5. Einzelpartikel-Kryo-EM-Bildverarbeitungsworkflow.

Automatisch aufgenommene Partikel (grüne Kreise)…

Erweiterte Daten Abb. 6. Einzelpartikel-Kryo-EM…

Erweiterte Daten Abb. 6. Einzelpartikel-Kryo-EM-Strukturvalidierung.

( ein ) Aufgeschnittene Kryo-EM-Karten…

Erweiterte Daten Abb. 7. Strukturvergleich von…

Erweiterte Daten Abb. 7. Strukturvergleich von vor Ort Struktur mit rekombinanter löslicher Struktur.

Abb. .1. Charakterisierung der Virusproduktion und…

Abb. .1. Charakterisierung der Virusproduktion und Bilder von SARS-CoV-2-Virionen.

Abb. 2. Strukturanalyse von SARS-CoV-2 S…

Abb. 2. Strukturanalyse von SARS-CoV-2 S-Trimeren auf intakten Virionen.

90° relativ zur Membran (Erweiterte Daten Abb. 1c,d).

Abb. 3. Strukturen von SARS-CoV-2 S-Trimeren…

Abb. 3. Strukturen von SARS-CoV-2 S-Trimeren auf intakten Virionen durch Einzelpartikelrekonstruktion.


Verwendung von Circulardichroismus als Funktion der Temperatur zur Bestimmung der Thermodynamik der Proteinentfaltung und der Bindungswechselwirkungen

Circulardichroismus (CD) ist eine ausgezeichnete spektroskopische Technik, um die Entfaltung und Faltung von Proteinen als Funktion der Temperatur zu verfolgen. Eine seiner Hauptanwendungen besteht darin, die Auswirkungen von Mutationen und Liganden auf die Protein- und Polypeptidstabilität zu bestimmen. Wenn die CD-Änderung als Funktion der Temperatur reversibel ist, kann eine Analyse der Daten verwendet werden, um die Van't-Hoff-Enthalpie und Entfaltungsentropie, den Mittelpunkt des Entfaltungsübergangs und die freie Entfaltungsenergie zu bestimmen. Bindungskonstanten von Protein-Protein- und Protein-Ligand-Wechselwirkungen können auch aus den Entfaltungskurven abgeschätzt werden. Die Analyse von als Funktion der Temperatur erhaltenen CD-Spektren ist auch nützlich, um zu bestimmen, ob ein Protein sich entfaltende Zwischenstufen aufweist. Die Messung der Spektren von fünf gefalteten Proteinen und ihrer Entfaltungskurven bei einer einzigen Wellenlänge dauert ungefähr 8 h.

Figuren

Abbildung 1. Circulardichroismus (CD)-Spektren von…

Abbildung 1. Circulardichroismus (CD)-Spektren von Polypeptiden und Proteinen mit einigen repräsentativen Sekundärstrukturen

Abbildung 2. Spektren von ungebundenem Tropomyosin und…

Abbildung 2. Spektren von ungebundenem Tropomyosin und Troponin-Modellproteinen und Protein-Protein-Komplexen

Abbildung 3. Typische Elliptizitätskurven als…

Abbildung 3. Typische Kurven der Elliptizität als Funktion der Temperatur zur Bestimmung der…

Abbildung 4. Beispiel für die Analyse von…

Abbildung 4. Beispiel für die Analyse eines Satzes von Spektren mit dem konvexen Einschränkungsalgorithmus.


Die Farbe ist stabil, aber alle Messungen sollten innerhalb von 10 Minuten durchgeführt werden. von einander. Wie bei den meisten Assays kann der Biuret für kleinere Küvettengrößen verkleinert werden, wodurch weniger Protein verbraucht wird. Proteine ​​mit einem ungewöhnlich hohen oder niedrigen Anteil an Aminosäuren mit aromatischen Seitengruppen ergeben hohe bzw. niedrige Werte.

Für Rinderserumalbumin erhalten wir typischerweise eine lineare Beziehung zwischen Absorption und Proteinmenge über einen Bereich von 0,5 bis 20 mg Protein. Der Test war für Mengen unter 0,5 mg nicht zuverlässig, jedoch kann der tatsächliche Empfindlichkeitsbereich über die Obergrenze hinausgehen.


Umgang mit Koordinaten

Die im PDB-Archiv gespeicherten Primärinformationen bestehen aus Koordinatendateien, die die Atome in jeder Struktur und ihre 3D-Position im Raum zusammen mit zusammenfassenden Informationen über Struktur, Sequenz und Experiment auflisten. Diese Dateien sind in verschiedenen Formaten verfügbar (PDBx/mmCIF, PDB, XML). Das Archiv enthält auch Datendateien mit experimentellen Beobachtungen, die verwendet werden, um diese Atomkoordinaten zu bestimmen.

Um die Strukturen im PDB-Archiv vollständig zu erkunden, ist es hilfreich, einige Konzepte zu Koordinatendateien zu verstehen. Außerdem hilft dieses Wissen beim Umgang mit Visualisierungsprogrammen.

Daten auf atomarer Ebene

Ein typischer PDB-Eintrag enthält Atomkoordinaten für eine vielfältige Sammlung von Proteinen, kleinen Molekülen, Ionen und Wasser.

Jedes Atom im Koordinatenabschnitt wird durch eine fortlaufende Nummer in der Eintragsdatei, einen spezifischen Atomnamen, den Namen und die Nummer des Rests, zu dem es gehört, einen Ein-Buchstaben-Code zur Angabe der Kette, ihre x, y und z . identifiziert Koordinaten und einen Belegungs- und Temperaturfaktor (weiter unten ausführlicher beschrieben).

Im PDBx/mmCIF-Format werden diese Informationen in der Kategorie _atom_site gespeichert (weitere Informationen finden Sie im Anfängerhandbuch zu PDB-Strukturen und im PDBx/mmCIF-Format). Unten sehen Sie die ersten Zeilen aus diesem Abschnitt des Eintrags 4HHB.

Schleife_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.Belegung
_atom_site.B_iso_or_equiv
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
ATOM 1 N N . LYS A 1 7 ? 12,364 -13,639 8,445 1,00 54,67 ? 527 LYS AN 1
ATOM 2 C CA . LYS A 1 7 ? 11,119 -12,888 8,550 1,00 49,59 ? 527 LYS A CA 1
ATOM 3 C C . LYS A 1 7 ? 9,961 -13,651 7,926 1,00 44,77 ? 527 LYS A C 1
ATOM 4 O O . LYS A 1 7 ? 9,055 -14,126 8,617 1,00 49,39 ? 527 LYS A O 1
ATOM 5 C CB . LYS A 1 7 ? 11,255 -11,538 7,841 1,00 49,41 ? 527 LYS A CB 1
ATOM 6 C CG . LYS A 1 7 ? 10,169 -10,531 8,174 1,00 53,16 ? 527 LYS A CG 1
ATOM 7 C-CD . LYS A 1 7 ? 10.523 -9.771 9.432 1.00 59.71 ? 527 LYS A CD 1
ATOM 8 C CE . LYS A 1 7 ? 11,779 -8,947 9,195 1,00 63,60 ? 527 LYS A CE 1
ATOM 9 N NZ . LYS A 1 7 ? 12,353 -8,381 10,443 1,00 64,85 ? 527 LYS A NZ 1
ATOM 10 N N . ARG A 1 8 ? 10,011 -13,762 6,603 1,00 40,03 ? 528 ARG A N 1
<snip>

Im PDB-Dateiformat wird der ATOM-Datensatz verwendet, um Proteine ​​oder Nukleinsäureatome zu identifizieren, und der HETATM-Datensatz wird verwendet, um Atome in kleinen Molekülen zu identifizieren. Unten sehen Sie die ersten Zeilen aus diesem Abschnitt des Eintrags 4HHB.

ATOM 1 N LYS A 527 12,364 -13,639 8,445 1,00 54,67 N
ATOM 2 CA LYS A 527 11,119 -12,888 8,550 1,00 49,59 C
ATOM 3 C LYS A 527 9,961 -13,651 7,926 1,00 44,77 C
ATOM 4 O LYS A 527 9.055 -14.126 8.617 1.00 49.39 O
ATOM 5 CB LYS A 527 11,255 -11,538 7,841 1,00 49,41 C
ATOM 7 CD LYS A 527 10.523 -9.771 9.432 1.00 59.71 C
ATOM 8 CE LYS A 527 11,779 -8,947 9,195 1,00 63,60 C
ATOM 9 NZ LYS A 527 12.353 -8.381 10.443 1.00 64.85 N
ATOM 10 N ARG A 528 10,011 -13,762 6,603 1,00 40,03 N

Diese Informationen geben Ihnen viel Kontrolle beim Erkunden der Struktur. Mit den meisten molekularen Grafikprogrammen können Sie beispielsweise identifizierte Teile des Moleküls selektiv einfärben - zum Beispiel alle Kohlenstoffatome heraussuchen und grün färben oder eine bestimmte Aminosäure auswählen und hervorheben.

Das linke Bild zeigt Myoglobin (PDB-Eintrag 1mbo) unter Verwendung eines Banddiagramms für das Protein und einer Kugel-und-Stab-Darstellung für die kleinen Moleküle. Im rechten Bild sind alle Atome dargestellt und die Hämgruppe ist in leuchtendem Rot und das gebundene Sauerstoffmolekül in Türkis hervorgehoben.

Tipp: Viele molekulare Grafikprogramme zeigen standardmäßig nicht die möglicherweise vorhandenen Wassermoleküle an, obwohl sie oft für die Funktion und Interaktion biologischer Moleküle wichtig sind. Die meisten dieser Programme haben eine Möglichkeit, sie anzuzeigen, wenn Sie ihre Methoden zur Atomauswahl verwenden.

Ketten und Modelle

Biologische Moleküle sind hierarchisch aufgebaut und bauen von Atomen über Reste bis hin zu Ketten und Baugruppen. Koordinatendateien enthalten Möglichkeiten zum Organisieren und Spezifizieren von Molekülen auf all diesen Ebenen. Wie oben beschrieben, sind die Atomnamen und Restinformationen in jedem Atomdatensatz enthalten.

In PDBx/mmCIF-Format, macht es die Schleifennatur der Datensätze einfach, verschiedene Ketten und mehrere Moleküle darzustellen.

Unten ist ein Segment von Eintrag 4hhb gezeigt, das den Übergang von Kette A zu Kette B zeigt, wobei die Kette im Datensatz _atom_site.label_asym_id bezeichnet und im Datensatz _atom_site.label_entity_id weiter identifiziert wird. Eine Einführung in Entitäten finden Sie im Anfängerleitfaden für PDB-Strukturen und das PDBx/mmCIF-Format.

Schleife_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.belegung
_atom_site.B_iso_or_equiv
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
ATOM 1 N N . WERT A 1 1 ? 6,204 16,869 4,854 1,00 49,05 ? 1 WERT A N 1
ATOM 2 C CA . WERT A 1 1 ? 6,913 17,759 4,607 1,00 43,14 ? 1 WERT A CA 1
ATOM 3 C C . WERT A 1 1 ? 8,504 17,378 4,797 1,00 24,80 ? 1 WERT A C 1
<snip>
ATOM 1067 N NH1 . ARG A 1 141 ? -10,147 7,455 -6,079 1,00 23,24 ? 141 ARG A NH1 1
ATOM 1068 N NH2 . ARG A 1 141 ? -8.672 8.328 -4.506 1.00 33.34 ? 141 ARG A NH2 1
ATOM 1069 O OXT . ARG A 1 141 ? -9.474 13.682 -9.742 1.00 31.52 ? 141 ARG A OXT 1
ATOM 1070 N N . WERT B 2 1 ? 9,223 -20,614 1,365 1,00 46,08 ? 1 WERT B N 1
ATOM 1071 C CA . WERT B 2 1 ? 8,694 -20,026 -0,123 1,00 70,96 ? 1 WERT B CA 1
ATOM 1072 C C . WERT B 2 1 ? 9,668 -21.068 -1,645 1,00 69,74 ? 1 WERT B C 1
ATOM 1073 O O . WERT B 2 1 ? 9,370 -22,612 -0,994 1,00 71,82 ? 1 WERT B O 1
<snip>

Hier wird für den Lösungs-NMR-Ensemble-Struktureintrag 1vre der Datensatz _atom_site.pdbx_PDB_model_num verwendet, um die 29 verschiedenen Modelle anzugeben, die in der Datei dargestellt sind:

Schleife_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.belegung
_atom_site.B_iso_or_equiv
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
ATOM 1 N N . GLYA 1 1 ? 13.878 9.721 9.134 1,00 0,00 ? 1 GLY A N 1
ATOM 2 C CA . GLYA 1 1 ? 12,761 8,747 8,973 1,00 0,00 ? 1 GLY A CA 1
Atom 3 C C . GLYA 1 1 ? 13,273 7,506 8,239 1,00 0,00 ? 1 GLY A C 1
<snip>
HETATM 2175 H HBD2 . HEM B 2 . ? -8.871 3.884 -8.248 1.00 0.00 ? 148 HEM A HBD2 1
HETATM 2176 C C . GMO C3 . ? -7,184 0,894 -1,865 1,00 0,00 ? 149 CMO A C 1
HETATM 2177 O O . GMO C3. ? -7,008 -0,217 -1,956 1,00 0,00 ? 149 CMO A O 1
ATOM 2178 N N . GLYA 1 1 ? 11,063 9,378 8,937 1,00 0,00 ? 1 GLY A N 2
ATOM 2179 C CA . GLYA 1 1 ? 10,504 8,078 8,473 1,00 0,00 ? 1 GLY A CA 2
ATOM 2180 C C . GLYA 1 1 ? 11,648 7,196 7,970 1,00 0,00 ? 1 GLY A C 2
<snip>
HETATM 63131 H HBD2 . HEM B 2 . ? -8.603 4.604 -7.315 1.00 0.00 ? 148 HEM A HBD2 29
HETATM 63132 C C . GMO C3. ? -7,211 0,912 -1,966 1,00 0,00 ? 149 CMO A C 29
HETATM 63133 O O . GMO C3 . ? -7.058 -0.203 -2.022 1,00 0,00 ? 149 CMO A O 29
#

In PDB-Dateiformat, TER-Datensätze werden verwendet, um Protein- und Nukleinsäureketten zu trennen. Die Ketten werden nacheinander in die Datei aufgenommen, getrennt durch einen TER-Record, um anzuzeigen, dass die Ketten nicht physisch miteinander verbunden sind. Die meisten molekularen Grafikprogramme suchen nach diesem TER-Datensatz, damit sie keine Verbindung herstellen, um verschiedene Ketten zu verbinden. Unten ist der Teil von Eintrag 4HHB dargestellt, in dem ein TER-Eintrag verwendet wird, um die erste Kopie der Alpha-Kette (Kette A) von der ersten Kopie der Beta-Kette (Kette B) zu trennen:

ATOM 1067 NH1 ARG A 141 -10,147 7,455 -6,079 1,00 23,24 N
ATOM 1068 NH2 ARG A 141 -8.672 8.328 -4.506 1.00 33.34 N
ATOM 1069 OXT ARG A 141 -9.474 13.682 -9.742 1.00 31.52 O
TER 1070 ARG A 141
ATOM 1071 N WERT B 1 9,223 -20,614 1,365 1,00 46,08 N
ATOM 1072 CA WERT B 1 8.694 -20.026 -0.123 1.00 70.96 C
ATOM 1073 C WERT B 1 9,668 -21.068 -1,645 1,00 69,74 C
ATOM 1074 O WERT B 1 9,370 -22,612 -0,994 1,00 71,82 O
ATOM 1075 CB WERT B 1 9,283 -18,281 -0,381 1,00 59,18 C
ATOM 1076 CG1 WERT B 1 7,449 -17,518 -0,791 1,00 57,89 C

Die Ketten B und C werden auf ähnliche Weise getrennt, ebenso wie die Ketten C und D.

Dateien im PDB-Format verwenden die Schlüsselwörter MODEL/ENDMDL, um mehrere Moleküle in einer einzigen Datei anzugeben. Diese wurde ursprünglich erstellt, um Koordinatensätze zu archivieren, die mehrere verschiedene Modelle derselben Struktur enthalten, wie die bei der NMR-Analyse erhaltenen Strukturensembles. Wenn Sie diese Dateien anzeigen, sehen Sie Dutzende ähnlicher Moleküle, die alle übereinander liegen. Das Schlüsselwort MODEL wird jetzt auch in biologischen Baugruppendateien verwendet, um die vielen symmetrischen Kopien des Moleküls zu trennen, die von der asymmetrischen Einheit erzeugt werden (Weitere Informationen finden Sie im Tutorial zu biologischen Baugruppen).

Unten ist ein Abschnitt aus der Datei der biologischen Anordnung von Eintrag 1out gezeigt, der die Hälfte (Ketten A und B) des Hämoglobinmodells in der asymmetrischen Einheit enthält. Das vollständige 4-Ketten-Molekül befindet sich in der biologischen Assembly-Datei, in der die beiden Sätze von zwei Ketten durch MODEL-Datensätze getrennt sind:

<snip>
MODELL 1
HETATM 1 C ACE A 0 40.573 27.347 55.464 1.00 42.49 C
HETATM 2 O ACE A 0 41,130 27,445 56,567 1,00 50,27 O
HETATM 3 CH3 ACE A 0 39,709 28,526 55,115 1,00 49,32 C
<snip>
HETATM 2475 O HOH B 238 8,440 58,387 54,230 1,00 67,86 O
HETATM 2476 O HOH B 239 23,699 54,828 72,752 1,00 71,63 O
HETATM 2477 O HOH B 240 30,823 46,229 47,604 1,00 71,95 O
ENDMDL
MODELL 2
HETATM 1 C ACE A 0 50,950 33,338 48,783 1,00 42,49 C
HETATM 2 O ACE A 0 50,587 32,905 47,680 1,00 50,27 O
HETATM 3 CH3 ACE A 0 50,361 34,676 49,132 1,00 49,32 C
<snip>
HETATM 2475 O HOH B 238 40,135 76,686 50,017 1,00 67,86 O
HETATM 2476 O HOH B 239 35,588 61,692 31,495 1,00 71,63 O
HETATM 2477 O HOH B 240 39,473 51,223 56,643 1,00 71,95 O
ENDMDL
MEISTER 0 0 0 16 0 0 8 6 2475 2 0 23
ENDE

Zwei nützliche Farbschemata ermöglichen es Ihnen, die verschiedenen Ketten in jeder gegebenen PDB-Datei zu erkunden. Zuerst können Sie jede Kette anders einfärben, um die Packung der verschiedenen Ketten im Molekül zu zeigen, wie im unteren Bild gezeigt. Dann können Sie jede Kette mit einem Regenbogen von Farben von einem Ende der Kette zum anderen färben, um ihre Falteigenschaften wie oben gezeigt hervorzuheben. Beide Methoden sind in den meisten Molekulargrafikprogrammen verfügbar. Das hier gezeigte Molekül ist Hämolysin aus der PDB-Struktur 7ahl.

Temperaturfaktoren

Wenn wir ein Atom starr an einer Stelle festhalten könnten, könnten wir im Idealfall seine Elektronenverteilung beobachten. Das Bild wäre zur Mitte hin dicht, wobei die Dichte weiter vom Kern weg abfallen würde. Betrachtet man jedoch experimentelle Elektronendichteverteilungen, so haben die Elektronen in der Regel eine breitere Verteilung als dieses Ideal. Dies kann an der Schwingung der Atome oder an Unterschieden zwischen den vielen verschiedenen Molekülen im Kristallgitter liegen. Die beobachtete Elektronendichte enthält einen Durchschnitt all dieser kleinen Bewegungen, was ein leicht verschmiertes Bild des Moleküls ergibt.

Diese Bewegungen und die daraus resultierende Verschmierung der Elektronendichte werden durch einen B-Wert oder Temperaturfaktor in das Atommodell aufgenommen. Das Ausmaß des Verschmierens ist proportional zur Größe des B-Wertes. Werte unter 10 erzeugen ein sehr scharfes Atommodell, das darauf hinweist, dass sich das Atom nicht viel bewegt und sich in allen Molekülen im Kristall an derselben Position befindet. Werte über 50 oder so weisen darauf hin, dass sich das Atom so stark bewegt, dass es kaum zu sehen ist. Dies ist häufig bei Atomen an der Oberfläche von Proteinen der Fall, wo lange Seitenketten frei im umgebenden Wasser herumwedeln können.

Im PDBx/mmCIF-Format wird der Datensatz _atom_site.B_iso_or_equiv verwendet, um Temperaturfaktorwerte zu speichern. Nochmal aus Eintrag 4hhb:

<snip>
Schleife_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.belegung
_atom_site.B_iso_or_equiv
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
ATOM 1 N N . WERT A 1 1 ? 6,204 16,869 4,854 1,00 49,05 ? 1 WERT A N 1
ATOM 2 C CA . WERT A 1 1 ? 6,913 17,759 4,607 1,00 43,14 ? 1 WERT A CA 1
ATOM 3 C C . WERT A 1 1 ? 8,504 17,378 4,797 1,00 24,80 ? 1 WERT A C 1
<snip>

Im PDB-Dateiformat wird der Temperaturfaktor in den Spalten 61 - 66 angegeben. Ab Eintrag 4hhb:

<snip>
ATOM 1 N WERT A 1 6,204 16,869 4,854 1,00 49,05 N
ATOM 2 CA VAL A 1 6,913 17,759 4,607 1,00 43,14 C
ATOM 3 C VAL A 1 8,504 17,378 4,797 1,00 24,80 C
<snip>

Das gezeigte Beispiel stammt von einer Myoglobinstruktur, die mit einer Auflösung von 2,0 Å gelöst wurde (PDB-Eintrag 1mbi). Zwei Histidin-Aminosäuren sind gezeigt. Auf der linken Seite befindet sich HIS93, das mit dem Eisenatom koordiniert und somit fest in Position gehalten wird. Es hat B-Werte im Bereich von 15-20 - beachten Sie, wie die Konturen die gesamte Aminosäure schön umgeben und eine scharfe Elektronendichte zeigen. Rechts ist HIS81, das an der Oberfläche des Proteins exponiert ist und höhere B-Werte im Bereich von 22-74 aufweist. Beachten Sie auch, wie die Konturen einen kleineren Raum einschließen, was einen kleineren Bereich mit hoher Elektronendichte für diese Aminosäure zeigt, da die Gesamtelektronendichte im Raum um die Konturen schwach verschmiert ist.

Das Bild zeigt das gesamte Molekül, wobei die Atome durch die Temperaturfaktoren gefärbt sind. Hohe Werte, die auf viel Bewegung hinweisen, sind rot und gelb, niedrige Werte blau. Beachten Sie, dass das Innere des Proteins niedrige B-Werte hat und die Aminosäuren an der Oberfläche höhere Werte haben.

Klicken Sie auf die Registerkarte Jmol, um ein interaktives Jmol anzuzeigen.

Das Jmol zeigt das gesamte Molekül, wobei die Atome durch die Temperaturfaktoren gefärbt sind. Hohe Werte, die auf viel Bewegung hinweisen, sind rot und gelb, niedrige Werte blau. Beachten Sie, dass das Innere des Proteins niedrige B-Werte hat und die Aminosäuren an der Oberfläche höhere Werte haben.

Tipp: Temperaturfaktoren sind ein Maß für unser Vertrauen in die Position jedes Atoms. Wenn Sie ein Atom auf der Oberfläche eines Proteins mit einem hohen Temperaturfaktor finden, denken Sie daran, dass sich dieses Atom wahrscheinlich viel bewegt und dass die in der PDB-Datei angegebenen Koordinaten nur eine mögliche Momentaufnahme seiner Position sind.

Belegung und multiple Konformationen

Makromolekulare Kristalle bestehen aus vielen einzelnen Molekülen, die in eine symmetrische Anordnung gepackt sind. In einigen Kristallen gibt es leichte Unterschiede zwischen jedem dieser Moleküle. Zum Beispiel kann eine Seitenkette auf der Oberfläche zwischen mehreren Konformationen hin und her wackeln, oder ein Substrat kann in zwei Orientierungen in einem aktiven Zentrum binden oder ein Metallion kann nur an wenige der Moleküle gebunden sein. Wenn Forscher das Atommodell dieser Teile erstellen, können sie die Belegung verwenden, um die Menge jeder im Kristall beobachteten Konformation abzuschätzen. Für die meisten Atome wird der Besetzung ein Wert von 1 zugewiesen, was bedeutet, dass das Atom in allen Molekülen an derselben Stelle im Kristall zu finden ist. Bindet ein Metallion jedoch nur an die Hälfte der Moleküle im Kristall, sieht der Forscher ein schwaches Bild des Ions in der Elektronendichtekarte und kann diesem Atom eine Besetzung von 0,5 in der PDB-Strukturdatei zuordnen. Besetzungen werden auch häufig verwendet, um Seitenketten oder Liganden zu identifizieren, die in mehreren Konformationen beobachtet werden. Der Besetzungswert wird verwendet, um den Anteil der Moleküle anzugeben, die jede der Konformationen aufweisen. Für jedes Atom sind zwei (oder mehr) Atomdatensätze enthalten, mit Belegungen wie 0,5 und 0,5 oder 0,4 und 0,6 oder anderen Teilbelegungen, die sich insgesamt auf 1 summieren.

Alternative Konformationen in Myoglobin: Die beiden gezeigten Bilder stammen aus der hochauflösenden Struktur von Myoglobin in Eintrag 1a6m: Glutamin 8 ist links und Tyrosin 151 rechts. In beiden Fällen interpretierten die Einleger die experimentellen Daten so, dass sie zwei Konformationen der Aminosäure zeigten, mit Besetzungen von 0,57 und 0,43 für das Glutamin und 0,5 für jede der Tyrosin-Konformationen. Die blauen Konturen umgeben die Regionen mit hoher Elektronendichte, und das Atommodell ist in Stäbchen dargestellt.

Das Bild unten zeigt das gesamte Myoglobin-Molekül mit allen Aminosäuren, die zwei Konformationen in der Datei haben.

Klicken Sie auf die Registerkarte Jmol, um ein interaktives Jmol anzuzeigen.

Alternative Konformationen in Myoglobin (PDB-Eintrag 1a6m)

Tipp: Beim Umgang mit PDB-Einträgen mit mehreren Koordinaten müssen Sie oft genau aufpassen. Es ist nicht immer möglich, nur die "A"-Konformationen auszuwählen und die "B"-Konformationen wegzuwerfen. Sie müssen in jedem Fall genau hinschauen und sicherstellen, dass es keine schlechten Kontakte zwischen den mobilen Sidechains gibt.

Im PDBx/mmCIF-Format werden alternative Konformationen in der Kategorie _atom_site.label_alt_id und die Belegung in der Kategorie _atom_site.occupancy angegeben. Unten gezeigt ist Rest 8 aus Eintrag 1a6m.

Schleife_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.belegung
_atom_site.B_iso_or_equiv
_atom_site.pdbx_formal_charge
_atom_site.auth_seq_id
_atom_site.auth_comp_id
_atom_site.auth_asym_id
_atom_site.auth_atom_id
_atom_site.pdbx_PDB_model_num
<snip>
ATOM 63 N N . GLN A 1 8 ? 5,404 13,203 22,532 1,00 8,42 ? 8 GLN A N 1
ATOM 64 C CA . GLN A 1 8 ? 6,475 12,812 23,418 1,00 8,84 ? 8 GLN A CA 1
ATOM 65 C C . GLN A 1 8 ? 7,602 12,149 22,631 1,00 8,08 ? 8 GLN A C 1
ATOM 66 O O . GLN A 1 8 ? 8,769 12,399 22,918 1,00 8,39 ? 8 GLN A O 1
ATOM 67 C CB A GLN A 1 8 ? 5,987 11,822 24,520 0,57 13,03 ? 8 GLN A CB 1
ATOM 68 C CB B GLN A 1 8 ? 5,948 11,968 24,580 0,43 9,68 ? 8 GLN A CB 1
ATOM 69 C CG A GLN A 1 8 ? 7.030 11.303 25.506 0.57 16.30 ? 8 GLN A CG 1
ATOM 70 C CG B GLN A 1 8 ? 6,967 12,094 25,688 0,43 12,07 ? 8 GLN A CG 1
ATOM 71 C CD A GLN A 1 8 ? 7,981 10,227 25,063 0,57 15,61 ? 8 GLN A CD 1
ATOM 72 C CD B GLN A 1 8 ? 6,439 11,470 26,952 0,43 14,43 ? 8 GLN A CD 1
ATOM 73 O OE1 A GLN A 1 8 ? 7,688 9,392 24,214 0,57 19,54 ? 8 GLN A OE1 1
ATOM 74 O OE1 B GLN A 1 8 ? 5,419 10,767 26,918 0,43 17,46 ? 8 GLN A OE1 1
ATOM 75 N NE2 A GLN A 1 8 ? 9,219 10,114 25,607 0,57 21,38 ? 8 GLN A NE2 1
ATOM 76 N NE2 B GLN A 1 8 ? 7,067 11,762 28,084 0,43 14,03 ? 8 GLN A NE2 1

Im PDB-Dateiformat werden in Spalte 17 alternative Konformationen unter Verwendung eines alternativen Positionsindikators angegeben und die Belegung wird in den Spalten 55 - 60 angegeben. Unten ab Eintrag 1a6m ist der Glutaminrest 8 in zwei verschiedenen Konformationen modelliert, A und B, wobei die Konformation A wird zu 57% belegt und Konformation B zu 43% belegt:

ATOM 63 N GLN A 8 5,404 13,203 22,532 1,00 8,42 N
ATOM 64 CA GLN A 8 6,475 12,812 23,418 1,00 8,84 C
ATOM 65 C GLN A 8 7,602 12,149 22,631 1,00 8,08 C
ATOM 66 O GLN A 8 8,769 12,399 22,918 1,00 8,39 O
ATOM 67 CB A GLN A 8 5,987 11,822 24,520 0,57 13,03 C
ATOM 68 CB B GLN A 8 5,948 11,968 24,580 0,43 9,68 C
ATOM 69 CG A GLN A 8 7.030 11.303 25.506 0.57 16.30 C
ATOM 70 CG B GLN A 8 6,967 12,094 25,688 0,43 12,07 C
ATOM 71 CD A GLN A 8 7,981 10,227 25,063 0,57 15,61 C
ATOM 72 CD B GLN A 8 6,439 11,470 26,952 0,43 14,43 C
ATOM 73 OE1 A GLN A 8 7,688 9,392 24,214 0,57 19,54 O
ATOM 74 OE1 B GLN A 8 5,419 10,767 26,918 0,43 17,46 O
ATOM 75 NE2 A GLN A 8 9,219 10,114 25,607 0,57 21,38 N
ATOM 76 NE2 B GLN A 8 7,067 11,762 28,084 0,43 14,03 N
<snip>

Autoren

2019-Update von Rachel Green und Christine Zardecki

Über PDB-101

PDB-101 hilft Lehrern, Schülern und der breiten Öffentlichkeit, die 3D-Welt der Proteine ​​und Nukleinsäuren zu erkunden. Das Kennenlernen ihrer vielfältigen Formen und Funktionen hilft, alle Aspekte der Biomedizin und Landwirtschaft zu verstehen, von der Proteinsynthese über Gesundheit und Krankheit bis hin zu biologischer Energie.

Warum PDB-101? Forscher rund um den Globus stellen diese 3D-Strukturen im Archiv der Protein Data Bank (PDB) frei zur Verfügung. PDB-101 erstellt einführende Materialien, um Anfängern den Einstieg in das Thema zu erleichtern ("101", wie in einem Einsteigerkurs) sowie Ressourcen für erweitertes Lernen.


Gesunde Proteinquellen

Die meisten Leute hören das Wort Protein und denken sofort an Fleisch. Während Produkte wie Rind, Lamm, Schwein und Huhn gute Proteinquellen sein können, sind sie nicht Ihre einzigen Alternativen. Fisch und Schalentiere sind ebenfalls gute Quellen. Diese Meeresbewohner enthalten auch Omega-3-Fettsäuren, die gut für Herz, Gehirn und Immunsystem sind.

Vegetarians have access to a wide range of protein sources as well. Many vegetarians consume eggs and milk products, like yogurt and milk, which are rich in protein. Other common sources of vegetarian-friendly protein are beans, legumes, nuts, seeds, tofu and seitan. These plant-based proteins are all good choices for vegans too.

Certain fruits and vegetables, like avocado, spinach, corn and brussel sprouts, are also valuable sources of protein. Even fruits like lucuma, which can be processed into lucuma powder and used as a natural sweetener, can help provide you with protein. Lucuma has also been shown to help promote lactation in women after giving birth. This makes it a particularly beneficial food for pregnant women or nursing mothers who prefer plant-based sources of protein.


Protein Modification by SUMO

AbstraktSmall ubiquitin-related modifier (SUMO) family proteins function by becoming covalently attached to other proteins as post-translational modifications. SUMO modifies many proteins that participate in diverse cellular processes, including transcriptional regulation, nuclear transport, maintenance of genome integrity, and signal transduction. Reversible attachment of SUMO is controlled by an enzyme pathway that is analogous to the ubiquitin pathway. The functional consequences of SUMO attachment vary greatly from substrate to substrate, and in many cases are not understood at the molecular level. Frequently SUMO alters interactions of substrates with other proteins or with DNA, but SUMO can also act by blocking ubiquitin attachment sites. An unusual feature of SUMO modification is that, for most substrates, only a small fraction of the substrate is sumoylated at any given time. This review discusses our current understanding of how SUMO conjugation is controlled, as well as the roles of SUMO in a number of biological processes.


Downloads

Use the "Explore" option to open a dataset in Tableau where you can interactively browse through the peptides, proteins and cell types right in your browser!

Annotation of cell types

Description and origin of all cell types and tissues used for the CSPA.

Matrix of all proteins and their detection in the different cell types.

Excel file containing 6 tables organized in different sheets:

  1. List of all proteins identified within the different cell types
  2. Matrix of 1492 human proteins against 47 human cell types
  3. Matrix of 1296 mouse proteins against 31 mouse cell types
  4. Table containing the number of identified proteins of each cell type
  5. Matrix with human surfaceome proteins and cells and their estimated relative quantities in log2 scale
  6. Matrix with mouse surfaceome proteins and cells and their estimated relative quantities in log2 scale

Sisyphus CSPA

Filemaker based database containing the easy-to-navigate Sisyphus database executable.

CSPA validated surfaceome proteins

Excel file containing all human and mouse surfaceome proteins in two tables and an additional table with all identified N-glycopeptides:

  1. List of 1492 human surfaceome proteins and their annotation.
  2. List of 1296 mouse surfaceome proteins and their annotation.
  3. List of 13942 mouse and human derived N-glycopeptides, including identified modified form.

Corrected topologies

PDF files with original and based on N-glycopeptide identification corrected topology pictures of 51 human proteins and 39 mouse proteins. The pictures were created with PROTTER and identified N-glycopeptides were marked yellow.

CSPA based spectral libraries for human proteins

ZIP file, containing a README.txt file and two subfolders with the respective spectral libraries:

  1. The .pepidx, .spidx and .splib file of the human spectral library for proteins within the CSPA. The sequence motiv N-X-S/T has been modified to D-X-S/T, which corresponds to a deamidated asparagine (N). Methionines are variable modified by oxidation and a decoy spectral library is appended.
  2. The .pepidx, .spidx and .splib file of the human spectral library for proteins within the CSPA. Asparagines and methionines can be searched with variable modifications of deamiation and oxidation, respectively and a decoy spectral library is appended.

CSPA based spectral libraries for mouse proteins

ZIP file, containing a README.txt file and two subfolders with the respective spectral libraries:

  1. The .pepidx, .spidx and .splib file of the mouse spectral library for proteins within the CSPA. The sequence motiv N-X-S/T has been modified to D-X-S/T, which corresponds to a deamidated asparagine (N). Methionines are variable modified by oxidation and a decoy spectral library is appended.
  2. The .pepidx, .spidx and .splib file of the mouse spectral library for proteins within the CSPA. Asparagines and methionines can be searched with variable modifications of deamiation and oxidation, respectively and a decoy spectral library is appended.

CSPA toolbox

Excel file containing tables for generating inclusion lists and transition list of surfaceome proteins within the CSPA:


Principles of Flowcytometry Data Analysis (With Diagram)

An important principle of flow cytometry data analysis is to selectively visualize the cells of interest while eliminating results from unwanted particles, e.g., dead cells and debris.

This procedure is called gating. Cells have traditionally been gated according to physical characteristics. For instance, subcellular debris and clumps can be distinguished from single cells by size, estimated by forward scatter.

Also, dead cells have lower forward scatter and higher side scatter than living cells. Lysed whole blood cell analysis is the most common application of gating, and Fig. 15.10 depicts typical graphs for SSC versus FSC when using large cell numbers. The different physical properties of granulocytes, monocytes and lymphocytes allow them to be distinguished from each other and from cellular contaminants.

On the density plot, each dot or point represents an individual cell that has passed through the instrument. Yellow/green hotspots indicate large numbers of events resulting from discrete populations of cells. The colours give the graph a three-dimensional feel. After a little experience, discerning the various subtypes of blood cells is relatively straightforward.

Contour diagrams are an alternative way to demonstrate the same data. Joined lines represent similar numbers of cells. The graph takes on the appearance of a geographical survey map, which, in principle, closely resembles the density plot. It is a matter of preference but sometimes discrete populations of cells are easier to visualize on contour diagrams, e.g., compare monocytes in Fig.15.10.

Newer gating strategies utilize fluorescence parameters along with scatter parameters. Once again, blood can be used to demonstrate this principle.

Above on the left is a FSC/SSC plot for human lysed whole blood using smaller numbers of cells than in Figure 15.10. The lymphocytes, monocytes and granulocytes have been gated as region 1 (Rl), region 2 (R2) and region 3 (R3), respectively. ‘Region’ simply refers to an area drawn on a plot displaying flow cytometry data.

On the right the same cells are now plotted as SSC on the y-axis versus CD45 fluorescence on the x-axis. CD45 is a marker expressed on all white blood cells at varying intensities but is absent on red blood cells. In relative terms, lymphocytes have a low SSC and high CD45 count (R4), granulocytes have a high SSC and low CD45 count (R6), while monocytes are somewhere in between the other two (R5).

The major difference between the lymphocytes gated in R1 and those gated in R4 is the absence of red blood cells in the latter, making it a much purer preparation. This highlights the usefulness of gating strategies that combine a scatter parameter with a fluorescence parameter.

Single-Parameter Histograms:

These are graphs that display a single measurement parameter (relative fluorescence or light scatter intensity) on the x-axis and the number of events (cell count) on the у-axis. The histogram in Fig.15.12 looks very basic but is useful for evaluating the total number of cells in a sample that possess the physical properties selected for or which express the marker of interest. Cells with the desired characteristics are known as the positive data set.

Ideally, flow cytometry will produce a single distinct peak that can be interpreted as the positive data set. However, in many situations, flow analysis is performed on a mixed population of cells resulting in several peaks on the histogram. In order to identify the positive data set, flow cytometry should be repeated in the presence of an appropriate negative iso-type control (see Fig. 15.13).

Analytical software packages that accompany flow cytometry instruments make measuring the % of positive-staining cells in histograms easy. For example, the F4/80 histogram is shown again below with statistics for R2 and R3 (known on this type of graph as ‘bar regions’).

In Fig. 15.14, 99.83% of the negative control (blue outline) is in R2. 28.14% of cells (red shade) ‘stain negative’ for F4/80 (R2) compared to 71.86% in the positive data set (R3). Additional statistics about the peaks (median and standard deviation) is also provided automatically here but this will vary with the software. A similar type of analysis will be generated for two parameter histograms.

Two-Parameter Histograms:

These are graphs that display two measurement parameters, one on the x-axis and one on the y-axis, and the cell count as a density (dot) plot or contour map. The parameters could be SSC, FSC or fluorescence. Another example is the dual-colour fluorescence histogram presented below. Lymphocytes were stained with anti-CD3 in the FITC channel (x-axis) and anti-HLA-DR in the PE channel (y-axis). CD3 and HLA-DR are markers for T cells and B cells, respectively.

In Fig. 15.15, R2 encompasses the PE-labelled B cells note their positive shift along the PE axis. R5 contains the FITC-labelled T cells (positively shifted along the FITC axis). The top right quadrant contains a few activated T cells (about 4% in this sample) that possess some 11 LA DR expression also.

As these stain with both antibody markers they are grouped in their own region (R3). R4 contains cells negative for both FITC and PE no shift). Currently, flow cytometry can be performed on samples labelled with up to 17 fluorescence markers simultaneously. Therefore, a single experiment can yield a large set of data for analysis using various two- parameter histograms.


Like the individual organism, the population is a real and functional unit in biology. Defined as groups of organisms that are genetically and spatially distinct from other such groups, the population is the fundamental unit of evolution. Populations are dynamic, they grow, decline, colonize new populations, and go extinct. Understanding how and why populations change over time is critical to such wide-ranging practical issues as pest control, endangered species protection, and even human population growth. In this section there are models exploring population growth and how to estimate population sizes.

Models are best viewed on large screens and landscape modes.

Model 1 – Logistic Growth

This model illustrates resource-limited population growth. Populations have a per-capita growth rate and carrying capacity. Two populations are compared on three graphs: N vs time, dN/dt vs N, and dN/Ndt vs N. Individuals in the populations are viewed in windows, illustrating that even at carrying capacity, there are still births and deaths in the population.

Share this model with others.

Model 2 – Estimating Population Size

Knowing how many individuals are in a population can be critical. How can you tell how many there are when there are too many to count? This model simulates a pond of tadpoles. The population size can be estimated in three ways: direct sampling, sampling with removal, and mark/recapture.

Share this model with others.

Model 3 – Mark/Recapture

The number of individuals in a population, or population size, is perhaps the most important thing to know about a population. This model is an in-depth exploration of the mark-recapture method of estimating population size by simulation of a meadow vole population. The individuals can be trapped, marked, released, and re-trapped. This advanced model assumes familiarity with the Lincoln-Peterson estimate of population size. It is designed to be used in exploring how factors such as population distribution, trap experience (learning to avoid or seek out traps), population size, and sampling effort can affect the precision and accuracy of the estimate.


Schau das Video: Wie brennt man eine CD? (Kann 2022).