Information

26.4: Charakterbasierte Methoden - Biologie

26.4: Charakterbasierte Methoden - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Bei zeichenbasierten Verfahren besteht das Ziel darin, zunächst einen gültigen Algorithmus zum Bewerten der Wahrscheinlichkeit zu erstellen, dass ein gegebener Baum die beobachteten Sequenzen an seinen Blättern produzieren würde, und dann den Raum möglicher Bäume nach einem Baum zu durchsuchen, der diese Wahrscheinlichkeit maximiert. Wir werden zuerst Baumbewertungsalgorithmen besprechen, dann Suchtechniken.

Wertung

Es gibt zwei Hauptalgorithmen für die Baumbewertung. Der erste Ansatz, den wir als Parsimony-Rekonstruktion bezeichnen werden, basiert auf dem Rasiermesser von Occam und bewertet eine Topologie basierend auf der minimalen Anzahl von Mutationen, die sie angesichts der (bekannten) Sequenzen an den Blättern impliziert. Diese Methode ist einfach, intuitiv und schnell. Der zweite Ansatz ist ein Maximum-Likelihood-Verfahren, das Bäume bewertet, indem die Wahrscheinlichkeit des Beobachtens der Sequenzen an den Blättern bei einer gegebenen Baumtopologie explizit modelliert wird.

Sparsamkeit

Vom Konzept her ist diese Methode einfach. Es weist einfach jedem Basenpaar an jedem Vorfahrenknoten einen Wert von zu, so dass die Anzahl der Substitutionen minimiert wird. Der Score ist dann nur die Summe über alle Basenpaare dieser minimalen Anzahl von Mutationen an jedem Basenpaar. (Denken Sie daran, dass das letztendliche Ziel darin besteht, einen Baum zu finden, der diese Punktzahl minimiert.)

Um die Ahnensequenzen an internen Knoten des Baums zu rekonstruieren, scannt der Algorithmus zuerst von den (bekannten) Blattsequenzen nach oben und weist jedem internen Knoten basierend auf seinen Kindern einen Satz von Basen zu. Als nächstes durchläuft es den Baum und wählt Basen aus den zulässigen Mengen an jedem Knoten aus, diesmal basierend auf den Eltern des Knotens. Im Folgenden wird dieser Algorithmus im Detail veranschaulicht (beachten Sie, dass es insgesamt 2N-1 Knoten gibt, die von der Wurzel aus indiziert sind, sodass die bekannten Blattknoten Indizes N-1 bis 2N-1 haben):

Wie bereits erwähnt, ist diese Methode einfach und schnell. Diese Einfachheit kann jedoch die von ihr zugewiesenen Scores verzerren. Zum einen geht der hier vorgestellte Algorithmus davon aus, dass ein gegebenes Basenpaar eine Substitution entlang höchstens einer Verzweigung von einem gegebenen Knoten erfährt, was dazu führen kann, dass er mit hoher Wahrscheinlichkeit interne Sequenzen ignoriert, die diese Annahme verletzen. Darüber hinaus modelliert dieses Verfahren nicht explizit die entlang jeder Kante dargestellte Zeit und kann somit die erhöhte Wahrscheinlichkeit einer Substitution entlang von Kanten, die eine lange Zeitdauer darstellen, oder die Möglichkeit unterschiedlicher Mutationsraten über den Baum hinweg nicht berücksichtigen. Maximum-Likelihood-Verfahren beheben diese Mängel weitgehend und werden daher häufiger für die Baumbewertung verwendet.

Maximale Wahrscheinlichkeit - Peeling-Algorithmus

Wie bei den allgemeinen Maximum-Likelihood-Methoden bewertet dieser Algorithmus einen Baum gemäß der (log) gemeinsamen Wahrscheinlichkeit der Beobachtung der Daten und des gegebenen Baums, d. h. P(D,T). Der Peeling-Algorithmus berücksichtigt wiederum einzelne Basenpaare und geht davon aus, dass sich alle Stellen unabhängig voneinander entwickeln. Wie bei der Parsimony-Methode betrachtet dieser Algorithmus alle Basenpaare unabhängig: Er berechnet die Wahrscheinlichkeit, die gegebenen Zeichen an jedem Basenpaar in den Blattknoten zu beobachten, unter gegebenem Baum, einer Reihe von Zweiglängen und der maximalen Wahrscheinlichkeitszuordnung der internen Sequenz und multipliziert dann einfach diese Wahrscheinlichkeiten mit allen Basenpaaren, um die Gesamtwahrscheinlichkeit für die Beobachtung des Baums zu erhalten. Beachten Sie, dass die explizite Modellierung von Zweiglängen ein Unterschied zum vorherigen Ansatz ist.

Hier hat jeder Knoten ein Zeichen xi und ti ist die entsprechende Zweiglänge von seinem Elternteil. Beachten Sie, dass wir die Werte x . bereits kennen1, x2···xn, also sind sie Konstanten, aber xn+1,···x2n-1 sind unbekannte Zeichen an angestammten Knoten, die Variablen sind, denen wir maximale Wahrscheinlichkeitswerte zuweisen. (Beachten Sie auch, dass wir für die Knoten ein Leave-to-Root-Indizierungsschema gewählt haben, das Gegenteil des zuvor verwendeten Schemas.) Wir wollen P (x1x2 · · · xn|T). Dazu summieren wir alle möglichen Kombinationen von Werten an den Ahnenknoten. das nennt man Marginalisierung. In diesem speziellen Beispiel

[Pleft(x_{1} x_{2} x_{3} x_{4} mid T ight)=sum_{x_{5}} sum_{x_{6}} sum_{x_{ 7}} Pleft(x_{1} x_{2} cdots x_{7} mid T ight) onumber]

Es gibt 4n-1 Begriffe hier, aber wir können den folgenden Faktorisierungstrick verwenden:

[=sum_{x_{7}}left[Pleft(x_{7} ight)left(sum_{x_{5}} Pleft(x_{5} mid x_{7} , t_{5} ight) Pleft(x_{1}mid x_{5}, t_{1} ight) Pleft(x_{2} mid x_{5}, t_{2} rechts) echts)left(sum_{x_{6}} Pleft(x_{6} mid x_{7}, t_{6} ight) Pleft(x_{3} mid x_{ 6}, t_{3} ight) Pleft(x_{4} mid x_{6}, t_{4} ight) ight) ight] onumber]

Hier gehen wir davon aus, dass sich jeder Zweig unabhängig entwickelt. Und die Wahrscheinlichkeit P(b|c,t) bezeichnet die Wahrscheinlichkeit, dass die Basis c zu einer gegebenen Zeit t zur Basis b mutiert, die im Wesentlichen aus dem Jukes-Cantor-Modell oder einem weiter oben diskutierten fortgeschritteneren Modell erhalten wird. Als nächstes können wir die Faktoren, die von der Summenvariablen unabhängig sind, außerhalb der Summe verschieben. Das gibt:

[=sum_{x_{7}}left[Pleft(x_{7} ight)left(sum_{x_{5}} Pleft(x_{5} mid x_{7} , t_{5} ight) Pleft(x_{1}mid x_{5}, t_{1} ight) Pleft(x_{2} mid x_{5}, t_{2} rechts) echts)left(sum_{x_{6}} Pleft(x_{6} mid x_{7}, t_{6} ight) Pleft(x_{3} mid x_{ 6}, t_{3} ight) Pleft(x_{4} mid x_{6}, t_{4} ight) ight) ight] onumber]

Lass Tich sei der Unterbaum darunter i. In diesem Fall berechnet unser 2n-1( imes)4 dynamisches Programmierarray L[i,b], die Wahrscheinlichkeit P(Tich|xich = b) der Beobachtung von Tich, wenn Knoten i die Basis b enthält. Dann wollen wir die Beobachtungswahrscheinlichkeit von T = T . berechnen2n-1, welches ist

[sum_{b} Pleft(x_{2 n-1}=b ight) L[2 n-1, b] onumber]

Beachten Sie, dass für jeden Vorfahrenknoten i und seine Kinder j, k gilt:

[L[i, b]=left(sum_{c} Pleft(cmid b, t_{j} ight) L[j, c] ight)left(sum_{c} Pleft(cmid b, t_{k} ight) L[k,c] ight) onumber]

Vorbehaltlich der Anfangsbedingungen für die Blattknoten, d. h. für i (leq) n:

L[i, b] = 1, wenn xich = b und 0 sonst

Beachten Sie, dass wir immer noch nicht die Werte P (x2n-1 =b). Es wird normalerweise gleich oder aus einer früheren Verteilung zugewiesen, hat jedoch keinen großen Einfluss auf die Ergebnisse. Der letzte Schritt besteht natürlich darin, alle Wahrscheinlichkeiten für einzelne Orte zu multiplizieren, um die Wahrscheinlichkeit des Beobachtens des Satzes ganzer Sequenzen zu erhalten. Sobald wir jedem internen Knoten die maximalen Likelihood-Werte unter Berücksichtigung der Baumstruktur und des Satzes von Zweiglängen zugewiesen haben, können wir außerdem die resultierende Punktzahl mit einigen A-priori-Wahrscheinlichkeiten der Baumstruktur und dem Satz von Zweiglängen multiplizieren, die oft generiert durch explizite Modellierung evolutionärer Prozesse wie dem Yule-Prozess oder Geburts-Tod-Modellen wie dem Moran-Prozess. Das Ergebnis dieser endgültigen Multiplikation wird in der Sprache der Bayesschen Inferenz als A-posteriori-Wahrscheinlichkeit bezeichnet. Die Gesamtkomplexität dieses Algorithmus ist O(nmk2) wobei n die Anzahl der Blätter (Taxa), m die Sequenzlänge und k die Anzahl der Zeichen ist.

Dieser Algorithmus hat Vor- und Nachteile. Wie zum Beispiel

Vorteile:

1. Inhärent statistisch und evolutionär modellbasiert.
2. Normalerweise die konsistenteste der verfügbaren Methoden.
3. Wird sowohl für Charakter- als auch für Ratenanalysen verwendet
4. Kann verwendet werden, um die Sequenzen der ausgestorbenen Vorfahren abzuleiten.

5. Berücksichtigen Sie Astlängeneffekte in unausgeglichenen Bäumen.
6. Nukleotid- oder Aminosäuresequenzen, andere Arten von Daten.

Nachteile:

1. Nicht so einfach und intuitiv wie viele andere Methoden.
2. Rechenintensiv Begrenzt durch, Anzahl der Taxa und Sequenzlänge).

3. Kann wie Sparsamkeit durch ein hohes Maß an Homoplasie getäuscht werden.
4. Verletzungen von Modellannahmen können zu falschen Bäumen führen.

Suche

Eine flächendeckende Suche über alle Bäume hinweg wäre extrem kostspielig. Die Anzahl der voll durchwurzelten Bäume mit n + 1 Blättern ist die n-te katalanische Zahl

[C_{n}=frac{1}{n+1}left(egin{array}{c}
2 n
n
end{array} ight) approx frac{4^{n}}{n^{3 / 2} sqrt{pi}} onumber]

Darüber hinaus müssen wir für jeden dieser Bäume die maximale Wahrscheinlichkeitsmenge der Zweiglängen berechnen. Somit ist es ein NP-schweres Problem, den Score absolut für alle Bäume zu maximieren. Glücklicherweise können heuristische Suchalgorithmen im Allgemeinen gute Lösungen im Baumraum identifizieren. Der allgemeine Rahmen für solche Suchalgorithmen ist wie folgt:

Initialisierung: Nehmen Sie einen Baum als Basis der Iteration (zufällig oder gemäß einer anderen vorherigen oder von den entfernungsbasierten direkten Algorithmen).

Vorschlag: Schlagen Sie einen neuen Baum vor, indem Sie den aktuellen Baum zufällig leicht ändern.

Punktzahl: Bewerten Sie den neuen Vorschlag nach den oben beschriebenen Methoden.

Auswählen: Wählen Sie zufällig den neuen Baum oder den alten Baum (entsprechende Wahrscheinlichkeiten gemäß dem Score (Likelihood)-Verhältnis.

Iterieren: Bis zum Angebotsschritt wiederholen, es sei denn, einige Abbruchkriterien sind erfüllt (ein gewisser Schwellenwert oder eine Anzahl von Schritten erreicht.

Die Grundidee hier ist die heuristische Annahme, dass die Scores von eng verwandten Bäumen ähnlich sind, so dass gute Lösungen durch sukzessive lokale Optimierung erhalten werden können, von der erwartet wird, dass sie in Richtung einer insgesamt guten Lösung konvergiert.

Baumvorschlag

Ein Verfahren zum Modifizieren von Bäumen ist der Nearest Neighbor Exchange (NNI), der unten dargestellt ist.

Abbildung 27.20: Ein Einheitsschritt unter Verwendung des Nearest Neighbor Interchange-Schemas

Eine weitere gängige Methode, die hier nicht beschrieben wird, ist Tree Bisection and Join (TBJ). Die wichtigen Kriterien für solche Vorschlagsregeln sind:

  1. (a) Der Baumraum sollte verbunden sein, d. h. jedes Paar von Bäumen sollte durch aufeinanderfolgende Vorschläge voneinander erhalten werden können.
  2. (b) Ein individueller neuer Vorschlag sollte dem Original hinreichend nahe kommen. Damit ist es aufgrund der Nähe zu einer bereits entdeckten guten Lösung eher eine gute Lösung. Bei zu großen Einzelschritten kann sich der Algorithmus von einer bereits gefundenen Lösung entfernen (hängt auch vom Auswahlschritt ab). Beachten Sie insbesondere, dass das Ähnlichkeitsmaß, mit dem diese Schrittweiten gemessen werden, genau die Differenz in den Wahrscheinlichkeitswerten ist, die den beiden Bäumen zugeordnet sind.

Auswahl

Die Entscheidung, ob ein bestimmter Vorschlag angenommen werden soll oder nicht, ist ebenso wie der Prozess der Erstellung des Vorschlags selbst von Natur aus heuristisch und variiert. Als allgemeine Faustregel gilt:

  1. Wenn der neue eine bessere Punktzahl hat, akzeptieren Sie ihn immer.
  2. Wenn es eine schlechtere Punktzahl hat, sollte es eine gewisse Wahrscheinlichkeit geben, es auszuwählen, sonst wird sich der Algorithmus bald auf ein lokales Minima fixieren und bessere Alternativen aus der Ferne ignorieren.
  3. Die Wahrscheinlichkeit, einen schlechteren neuen Vorschlag auszuwählen, sollte nicht zu groß sein, da sonst die Gefahr besteht, eine bekannte gute Lösung abzulehnen.

Es ist der Kompromiss zwischen den Schritten 2 und 3, der eine gute Auswahlregel bestimmt. Metropolis Hastings ist eine Markov-Chain-Monte-Carlo-Methode (MCMC), die spezifische Regeln für die Untersuchung des Zustandsraums auf eine Weise definiert, die ihn zu einer Stichprobe aus der Posterior-Verteilung macht. Diese Algorithmen funktionieren in der Praxis einigermaßen gut, aber es gibt keine Garantie, den passenden Baum zu finden. Daher wird ein als Bootstrapping bekanntes Verfahren verwendet, bei dem der Algorithmus im Grunde immer und immer wieder unter Verwendung von Teilmengen der Basenpaare in den Blattsequenzen ausgeführt wird. dann Bevorzugung globaler Bäume, die den Topologien entsprechen, die nur durch die Verwendung dieser Teilsequenzen erzeugt werden.


26.4: Charakterbasierte Methoden - Biologie

Alle von MDPI veröffentlichten Artikel werden sofort weltweit unter einer Open-Access-Lizenz verfügbar gemacht. Für die Wiederverwendung des gesamten oder eines Teils des von MDPI veröffentlichten Artikels, einschließlich Abbildungen und Tabellen, ist keine besondere Genehmigung erforderlich. Bei Artikeln, die unter einer Open-Access-Creative Common CC BY-Lizenz veröffentlicht wurden, darf jeder Teil des Artikels ohne Genehmigung wiederverwendet werden, sofern der Originalartikel eindeutig zitiert wird.

Feature Papers stellen die fortschrittlichste Forschung mit erheblichem Potenzial für eine große Wirkung auf diesem Gebiet dar. Feature Papers werden auf individuelle Einladung oder Empfehlung der wissenschaftlichen Herausgeber eingereicht und vor der Veröffentlichung einem Peer Review unterzogen.

Das Feature Paper kann entweder ein origineller Forschungsartikel, eine umfangreiche neue Forschungsstudie sein, die oft mehrere Techniken oder Ansätze umfasst, oder ein umfassendes Übersichtspapier mit prägnanten und präzisen Updates zu den neuesten Fortschritten auf diesem Gebiet, das die aufregendsten Fortschritte in der Wissenschaft systematisch überprüft Literatur. Diese Art von Papier gibt einen Ausblick auf zukünftige Forschungsrichtungen oder mögliche Anwendungen.

Editor’s Choice-Artikel basieren auf Empfehlungen der wissenschaftlichen Herausgeber von MDPI-Zeitschriften aus der ganzen Welt. Die Herausgeber wählen eine kleine Anzahl von kürzlich in der Zeitschrift veröffentlichten Artikeln aus, die ihrer Meinung nach für Autoren besonders interessant oder in diesem Bereich wichtig sind. Ziel ist es, eine Momentaufnahme einiger der spannendsten Arbeiten zu geben, die in den verschiedenen Forschungsbereichen der Zeitschrift veröffentlicht wurden.


Filamin A reguliert die neuronale Migration durch Brefeldin A-inhibierte Guaninaustauschfaktor 2-abhängige Arf1-Aktivierung.
Glanz V
The Journal of Neuroscience : das offizielle Journal der Society for Neuroscience 33,40 (2013 Okt 2): 15735-46.

CRTAM: Ein Molekül, das an der Adhäsion von Epithelzellen beteiligt ist.
González-Mariscal L
Zeitschrift für zelluläre Biochemie 111.1 (1. September 2010): 111-22.

Ischämisches akutes Nierenversagen induziert die Expression einer Vielzahl von nephrogenen Proteinen.
Vio CP
Amerikanische Zeitschrift für Physiologie. Regulatorische, integrative und vergleichende Physiologie 290.4 (April 2006): R861-70.

Ischämisches akutes Nierenversagen induziert die Expression einer Vielzahl von nephrogenen Proteinen.
Vio CP
Amerikanische Zeitschrift für Physiologie. Regulatorische, integrative und vergleichende Physiologie 290.4 (April 2006): R861-70.

Filamin A reguliert die neuronale Migration durch Brefeldin A-inhibierte Guaninaustauschfaktor 2-abhängige Arf1-Aktivierung.
Glanz V
The Journal of Neuroscience : das offizielle Journal der Society for Neuroscience 33,40 (2013 Okt 2): 15735-46.

CRTAM: Ein Molekül, das an der Adhäsion von Epithelzellen beteiligt ist.
González-Mariscal L
Zeitschrift für zelluläre Biochemie 111.1 (1. September 2010): 111-22.

Ischämisches akutes Nierenversagen induziert die Expression einer Vielzahl von nephrogenen Proteinen.
Vio CP
Amerikanische Zeitschrift für Physiologie. Regulatorische, integrative und vergleichende Physiologie 290.4 (April 2006): R861-70.


Alle Sequenzierungsdaten sind über den Gene Expression Omnibus (GEO) unter der Hinterlegung GSE117840 erhältlich. icSHAPE-Reaktivitätswerte und Lin28A CLIP-Peaks finden Sie im UCSC Genome Browser auf den folgenden Seiten: human, http://genome-asia.ucsc.edu/cgi-bin/hgTracks?hgS_doOtherUser=submit&hgS_otherUserName=lipan&hgS_otherUserSessionName=hg38_dynamics ://genome-asia.ucsc.edu/cgi-bin/hgTracks?hgS_doOtherUser=submit&hgS_otherUserName=lipan&hgS_otherUserSessionName=mm10_dynamics. Quelldaten für Abb. 4d und 5a sind mit dem Papier versehen.

Sharp, P. A. Die Zentralität der RNA. Zelle 136, 577–580 (2009).

Pan, T. & Sosnick, T. RNA-Faltung während der Transkription. Annu. Rev. Biophys. Biomol. Struktur. 35, 161–175 (2006).

Warf, M. B. & Berglund, J. A. Role of RNA Structure in Regulation des Prä-mRNA-Spleißens. Trends Biochem. Wissenschaft 35, 169–178 (2010).

Martin, K. C. & Ephrussi, A. mRNA-Lokalisierung: Genexpression in der räumlichen Dimension. Zelle 136, 719–730 (2009).

Kozak, M. Regulation der Translation über die mRNA-Struktur in Prokaryoten und Eukaryoten. Gen 361, 13–37 (2005).

Garneau, N. L., Wilusz, J. &. Wilusz, C. J. Die Highways und Byways des mRNA-Zerfalls. Nat. Pfr. Mol. Zellbiol. 8, 113–126 (2007).

Ramakrishnan, V. Ribosomenstruktur und der Mechanismus der Translation. Zelle 108, 557–572 (2002).

Yan, C. et al. Struktur eines Hefespleißosoms bei einer Auflösung von 3,6 . Wissenschaft 349, 1182–1191 (2015).

Wan, Y. et al. Landschaft und Variation der RNA-Sekundärstruktur im menschlichen Transkriptom. Natur 505, 706–709 (2014).

Ding, Y. et al. In-vivo-Genom-weites Profiling der RNA-Sekundärstruktur zeigt neue regulatorische Merkmale. Natur 505, 696–700 (2014).

Rouskin, S., Zubradt, M., Washietl, S., Kellis, M. & Weissman, J.S. Genomweites Sondieren der RNA-Struktur zeigt die aktive Entfaltung von mRNA-Strukturen in vivo. Natur 505, 701–705 (2014).

Spital, R.C. et al. Strukturelle Prägungen in vivo entschlüsseln RNA-Regulationsmechanismen. Natur 519, 486–490 (2015).

Lu, Z. et al. Die RNA-Duplex-Karte in lebenden Zellen zeigt eine Transkriptomstruktur höherer Ordnung. Zelle 165, 1267–1279 (2016).

Zubradt, M. et al. DMS-MaPseq für genomweite oder gezielte RNA-Struktursondierung in vivo. Nat. Methoden 14, 75–82 (2017).

Mustoe, A.M.et al. Tiefgreifende regulatorische Funktionen der mRNA-Struktur durch hochauflösende SHAPE-Sondierung aufgedeckt. Zelle 173, 181–195 e118 (2018).

Strobel, E.J., Yu, A.M. & Lucks, J.B. Hochdurchsatzbestimmung von RNA-Strukturen. Nat. Rev. Genet. 19, 615–634 (2018).

Mortimer, S. A., Kidwell, M. A. & Doudna, J. A. Einblicke in die RNA-Struktur und -Funktion aus genomweiten Studien. Nat. Rev. Genet. 15, 469–479 (2014).

Bevilacqua, P.C., Ritchey, L.E., Su, Z. & Assmann, S.M. Genomweite Analyse der RNA-Sekundärstruktur. Annu. Rev. Genet. 50, 235–266 (2016).

Piao, M., Sun, L. &. Zhang, Q.C. RNA-Regulationen und -Funktionen dekodiert durch transkriptomweite RNA-Struktursondierung. Genomik Proteomik Bioinformatik 15, 267–278 (2017).

Wan, Y., Kertesz, M., Spitale, R.C., Segal, E. & Chang, H.Y. Verständnis des Transkriptoms durch RNA-Struktur. Nat. Rev. Genet. 12, 641–655 (2011).

Buxbaum, A. R., Haimovich, G. & Singer, R. H. Zur richtigen Zeit am richtigen Ort: mRNA-Lokalisierung visualisieren und verstehen. Nat. Pfr. Mol. Zellbiol. 16, 95–109 (2015).

Gosai, S.J. et al. Globale Analyse der RNA-Protein-Interaktion und der RNA-Sekundärstrukturlandschaften der Arabidopsis Kern. Mol.-Nr. Zelle 57, 376–388 (2015).

Roundtree, I. A., Evans, M. E., Pan, T. &. He, C. Dynamische RNA-Modifikationen in der Genexpressionsregulation. Zelle 169, 1187–1200 (2017).

Zhao, B. S., Roundtree, I. A. &. He, C. Post-transkriptionale Genregulation durch mRNA-Modifikationen. Nat. Pfr. Mol. Zellbiol. 18, 31–42 (2017).

Kierzek, E. & Kierzek, R. Die thermodynamische Stabilität von RNA-Duplexen und Haarnadeln, die N6-Alkyladenosine und 2-Methylthio-N6-alkyladenosine enthalten. Nukleinsäuren Res. 31, 4472–4480 (2003).

Roost, C. et al. Struktur und Thermodynamik von N6-Methyladenosin in RNA: eine federbelastete Basenmodifikation. Marmelade. Chem.-Nr. Soz. 137, 2107–2115 (2015).

König, J. et al. iCLIP zeigt die Funktion von hnRNP-Partikeln beim Spleißen bei individueller Nukleotidauflösung. Nat. Struktur. Mol.-Nr. Biol. 17, 909–915 (2010).

Liu, N. et al. n 6 -Methyladenosin-abhängige RNA-Strukturschalter regulieren RNA-Protein-Wechselwirkungen. Natur 518, 560–564 (2015).

Alarcon, C. R., Lee, H., Goodarzi, H., Halberg, N. & Tavazoie, S. F. N6-Methyladenosin markiert primäre microRNAs für die Verarbeitung. Natur 519, 482–485 (2015).

Gagnon, K.T., Li, L., Janowski, B.A. & Corey, D.R. Analyse der nuklearen RNA-Interferenz in menschlichen Zellen durch subzelluläre Fraktionierung und Argonaute-Beladung. Nat. Protokoll 9, 2045–2060 (2014).

Bhatt, D.M.et al. Transkriptdynamik proinflammatorischer Gene durch Sequenzanalyse subzellulärer RNA-Fraktionen. Zelle 150, 279–290 (2012).

Flynn, R. A. et al. Transkriptomweite Abfrage der RNA-Sekundärstruktur in lebenden Zellen mit icSHAPE. Nat. Protokoll 11, 273–290 (2016).

Kino, T., Hurt, D.E., Ichijo, T., Nader, N. &. Chrousos, G.P. Nichtkodierende RNA gas5 ist ein Wachstumsarrest- und Hunger-assoziierter Repressor des Glucocorticoid-Rezeptors. Wissenschaft Signal. 3, ra8 (2010).

Schueler, M. et al. Differentielles Proteinbelegungsprofil des mRNA-Transkriptoms. Genom Biol. 15, R15 (2014).

Jonkers, I., Kwak, H. &. Lis, J.T. Genomweite Dynamik der Pol-II-Elongation und ihr Zusammenspiel mit proximaler Promotorpause, Chromatin und Exons. Elife 3, e02407 (2014).

Ingolia, N. T., Lareau, L. F. & Weissman, J. S. Ribosomen-Profiling von embryonalen Stammzellen von Mäusen zeigt die Komplexität und Dynamik von Säugetier-Proteomen. Zelle 147, 789–802 (2011).

Zhang, J. W. & Landick, R. Eine Einbahnstraße: regulatorisches Zusammenspiel zwischen RNA-Polymerase und entstehender RNA-Struktur. Trends Biochem. Wissenschaft 41, 293–310 (2016).

Houseley, J. & Tollervey, D. Die vielen Wege des RNA-Abbaus. Zelle 136, 763–776 (2009).

Harel-Sharvit, L. et al. RNA-Polymerase-II-Untereinheiten verknüpfen Transkription und mRNA-Zerfall mit der Translation. Zelle 143, 552–563 (2010).

Zid, B. M. & O’Shea, E. K. Promotorsequenzen steuern die zytoplasmatische Lokalisierung und Translation von mRNAs während des Hungers in Hefe. Natur 514, 117–121 (2014).

Slobodin, B. et al. Die Transkription beeinflusst die Effizienz der mRNA-Translation über die co-transkriptionelle N6-Adenosin-Methylierung. Zelle 169, 326–337 e312 (2017).

Roundtree, I. A. &. He, C. RNA-Epigenetik – chemische Botschaften für die posttranskriptionelle Genregulation. Curr. Meinung. Chem.-Nr. Biol. 30, 46–51 (2016).

Yang, Y.C. et al. CLIPdb: eine CLIP-seq-Datenbank für Protein-RNA-Interaktionen. BMC Genomics 16, 51 (2015).

Huang, H. et al. Die Erkennung von RNA-N(6)-Methyladenosin durch IGF2BP-Proteine ​​verbessert die mRNA-Stabilität und -Translation. Nat. Zellbiol. 20, 285–295 (2018).

Edupuganti, R.R. et al. N 6 -Methyladenosin (m 6 A) rekrutiert Proteine ​​und stößt sie ab, um die mRNA-Homöostase zu regulieren. Nat. Struktur. Mol.-Nr. Biol. 24, 870–878 (2017).

Batista, P.J. et al. m 6 Eine RNA-Modifikation steuert den Zellschicksalübergang in embryonalen Stammzellen von Säugetieren. Zellstammzelle 15, 707–719 (2014).

Yu, J.et al. Induzierte pluripotente Stammzelllinien aus menschlichen Körperzellen. Wissenschaft 318, 1917–1920 (2007).

Viswanathan, S. R. & Daley, G. Q. Lin28: ein microRNA-Regulator mit einer Makrorolle. Zelle 140, 445–449 (2010).

Beaudoin, J. D. et al. Analysen der mRNA-Strukturdynamik identifizieren embryonale Genregulationsprogramme. Nat. Struktur. Mol.-Nr. Biol. 25, 677–686 (2018).

Shyh-Chang, N. & Daley, G. Q. Lin28: primärer Regulator von Wachstum und Stoffwechsel in Stammzellen. Zellstammzelle 12, 395–406 (2013).

Zarnegar, B.J. et al. irCLIP-Plattform zur effizienten Charakterisierung von Protein-RNA-Interaktionen. Nat. Methoden 13, 489–492 (2016).

Smith, T., Heger, A. &. Sudbery, I. UMI-Tools: Modellierung von Sequenzierungsfehlern in Unique Molecular Identifiers zur Verbesserung der Quantifizierungsgenauigkeit. Genom-Res. 27, 491–499 (2017).

Flynn, R. A. et al. Sezieren von nichtkodierenden und pathogenen RNA-Protein-Interaktomen. RNA 21, 135–143 (2015).

Murakami, Y., Spriggs, R. V., Nakamura, H. & Jones, S. PiRaNhA: ein Server für die rechnerische Vorhersage von RNA-bindenden Resten in Proteinsequenzen. Nukleinsäuren Res. 38, W412-W416 (2010).

Trapnell, C. et al. Differentielle Gen- und Transkriptexpressionsanalyse von RNA-seq-Experimenten mit TopHat und Cufflinks. Nat. Protokoll 7, 562–578 (2012).

Langmead, B. & Salzberg, S. L. Schnelle Ausrichtung mit Lücken beim Lesen mit Bowtie 2. Nat. Methoden 9, 357–359 (2012).

Yoshikawa, H. et al. Effiziente Analyse von Säugetier-Polysomen in Zellen und Geweben mit Ribo Mega-SEC. Elife 7, e36560 (2018).

Min, I. M. et al. Regulierung der RNA-Polymerase-Pausierung und Transkriptionsverlängerung in embryonalen Stammzellen. Gene Dev. 25, 742–754 (2011).

Tastemel, M. et al. Transkriptionspausen regulieren die Differenzierung von embryonalen Stammzellen der Maus. Stammzellres. 25, 250–255 (2017).

MacKinnon, D.P., Fairchild, A.J. & Fritz, M.S. Mediation analysis. Annu. Rev. Psychol. 58, 593–614 (2007).

MacKinnon, D.P., Lockwood, C.M., Hoffman, J.M., West, S.G. & Sheets, V. Ein Vergleich von Methoden zum Testen der Mediation und anderer intervenierender variabler Effekte. Psychol. Methoden 7, 83–104 (2002).

Linder, B. et al. Einzelnukleotid-Auflösung Kartierung von m6A und m6Am im gesamten Transkriptom. Nat. Getroffen. 12, 767–772 (2015).

Dominissini, D. et al. Das dynamische N 1 -Methyladenosin-Methylom in eukaryotischer Boten-RNA. Natur 530, 441–446 (2016).

Stelzer, G. et al. Die GeneCards-Suite: vom Gen-Data-Mining bis zur Genomsequenzanalyse von Krankheiten. Curr. Protokoll Bioinformatik 54, 1.30.1–1.30.33 (2016).


Inhalt

BLAST, die Die New York Times namens das Google der biologischen Forschung, [2] ist eines der am häufigsten verwendeten Bioinformatikprogramme für die Sequenzsuche. [3] Es adressiert ein grundlegendes Problem der bioinformatischen Forschung. Der verwendete heuristische Algorithmus ist viel schneller als andere Ansätze, wie zum Beispiel die Berechnung eines optimalen Alignments. Diese Betonung der Geschwindigkeit ist entscheidend, um den Algorithmus in den derzeit verfügbaren riesigen Genomdatenbanken praktikabel zu machen, obwohl nachfolgende Algorithmen noch schneller sein können.

Vor BLAST wurde FASTA 1985 von David J. Lipman und William R. Pearson entwickelt. [4]

Bevor schnelle Algorithmen wie BLAST und FASTA entwickelt wurden, war das Durchsuchen von Datenbanken nach Protein- oder Nukleinsequenzen sehr zeitaufwendig, da ein vollständiges Alignment-Verfahren (z. B. der Smith-Waterman-Algorithmus) verwendet wurde.

BLAST stammt aus dem stochastischen Modell von Samuel Karlin und Stephen Altschul von 1990 [5] statistische Grundlage für BLAST." [6] Anschließend entwarf Altschul zusammen mit Warren Gish, Webb Miller, Eugene Myers und David J. Lipman von den National Institutes of Health den BLAST-Algorithmus, der in der Zeitschrift für Molekularbiologie im Jahr 1990 und über 75.000 Mal zitiert. [7]

Obwohl BLAST in den meisten Fällen schneller ist als jede Smith-Waterman-Implementierung, kann es nicht "die optimale Ausrichtung der Abfrage- und Datenbanksequenzen garantieren", wie es der Smith-Waterman-Algorithmus tut. Die Optimalität von Smith-Waterman "gewährleistete die beste Leistung in Bezug auf Genauigkeit und die genauesten Ergebnisse" auf Kosten von Zeit und Computerleistung.

BLAST ist zeiteffizienter als FASTA, indem es nur nach den signifikanteren Mustern in den Sequenzen sucht, jedoch mit vergleichbarer Empfindlichkeit. Dies könnte weiter realisiert werden, indem man den unten eingeführten Algorithmus von BLAST versteht.

Beispiele für andere Fragen, die Forscher mit BLAST beantworten, sind:

  • Welche Bakterienart hat ein Protein, das mit einem bestimmten Protein mit bekannter Aminosäuresequenz verwandt ist?
  • Welche anderen Gene kodieren für Proteine, die Strukturen oder Motive aufweisen, wie sie gerade erst bestimmt wurden

BLAST wird auch häufig als Teil anderer Algorithmen verwendet, die einen ungefähren Sequenzabgleich erfordern.

BLAST ist im Internet auf der NCBI-Website verfügbar. Je nach Abfragesequenzen und Zieldatenbanken stehen verschiedene Arten von BLASTs zur Verfügung. Alternative Implementierungen umfassen AB-BLAST (früher bekannt als WU-BLAST), FSA-BLAST (zuletzt aktualisiert im Jahr 2006) und ScalaBLAST. [8] [9]

Das Originalpapier von Altschul, et al. [7] war die meistzitierte Veröffentlichung der 1990er Jahre. [10]

Eingabe bearbeiten

Eingabesequenzen (im FASTA- oder Genbank-Format), Datenbank für die Suche und andere optionale Parameter wie Scoring-Matrix.

Ausgabe bearbeiten

Die BLAST-Ausgabe kann in einer Vielzahl von Formaten geliefert werden. Diese Formate umfassen HTML-, Nur-Text- und XML-Formatierung. Für die NCBI-Webseite ist das Standardformat für die Ausgabe HTML. Wenn ein BLAST auf NCBI durchgeführt wird, werden die Ergebnisse in einem grafischen Format mit den gefundenen Treffern, einer Tabelle mit Sequenzkennungen für die Treffer mit bewertungsbezogenen Daten sowie Ausrichtungen für die interessierende Sequenz und die empfangenen Treffer mit entsprechenden BLAST-Bewertungen angezeigt für diese. Die am einfachsten zu lesende und informativste davon ist wahrscheinlich die Tabelle.

Wenn man versucht, nach einer proprietären Sequenz zu suchen oder einfach nach einer, die in Datenbanken, die der Öffentlichkeit über Quellen wie NCBI zur Verfügung stehen, nicht verfügbar ist, steht ein BLAST-Programm zum kostenlosen Download auf jeden Computer zur Verfügung. Diese finden Sie unter ausführbare BLAST+-Dateien. Es gibt auch kommerzielle Programme zum Kauf. Datenbanken finden Sie auf der NCBI-Site sowie im Index of BLAST-Datenbanken (FTP).

Unter Verwendung eines heuristischen Verfahrens findet BLAST ähnliche Sequenzen, indem kurze Übereinstimmungen zwischen den beiden Sequenzen lokalisiert werden. Dieser Vorgang des Auffindens ähnlicher Sequenzen wird als Seeding bezeichnet. Nach dieser ersten Übereinstimmung beginnt BLAST mit der lokalen Ausrichtung. Beim Versuch, Ähnlichkeiten in Sequenzen zu finden, sind Sätze von gemeinsamen Buchstaben, die als Wörter bekannt sind, sehr wichtig. Angenommen, die Sequenz enthält die folgende Buchstabenfolge, GLKFA. Wenn ein BLAST unter normalen Bedingungen durchgeführt würde, würde die Wortgröße 3 Buchstaben betragen. In diesem Fall wären die gesuchten Wörter unter Verwendung der gegebenen Buchstabenfolge GLK, LKF, KFA. Der heuristische Algorithmus von BLAST lokalisiert alle üblichen Drei-Buchstaben-Wörter zwischen der interessierenden Sequenz und der Treffersequenz oder -sequenzen aus der Datenbank. Dieses Ergebnis wird dann verwendet, um eine Ausrichtung zu erstellen. Nachdem Wörter für die interessierende Sequenz gebildet wurden, werden auch die restlichen Wörter zusammengestellt. Diese Wörter müssen eine Punktzahl von mindestens dem Schwellenwert erfüllen T, wenn sie mit einer Scoring-Matrix verglichen werden.

Eine häufig verwendete Bewertungsmatrix für BLAST-Suchen ist BLOSUM62, [11] obwohl die optimale Bewertungsmatrix von der Sequenzähnlichkeit abhängt. Sobald sowohl Wörter als auch Nachbarschaftswörter zusammengestellt und kompiliert sind, werden sie mit den Sequenzen in der Datenbank verglichen, um Übereinstimmungen zu finden. Der Schwellenwert T bestimmt, ob ein bestimmtes Wort in das Alignment aufgenommen wird oder nicht. Nach erfolgtem Seeding wird das nur 3 Reste lange Alignment durch den von BLAST verwendeten Algorithmus in beide Richtungen erweitert. Jede Erweiterung wirkt sich auf die Bewertung der Ausrichtung aus, indem sie entweder erhöht oder verringert wird. Wenn diese Punktzahl höher ist als eine vorgegebene T, wird das Alignment in die Ergebnisse von BLAST einbezogen. Wenn dieser Wert jedoch niedriger ist als dieser vorgegebene T, wird die Ausrichtung aufhören, sich auszudehnen, wodurch verhindert wird, dass die Bereiche mit schlechter Ausrichtung in die BLAST-Ergebnisse aufgenommen werden. Beachten Sie, dass das Erhöhen der T Score begrenzt den für die Suche verfügbaren Platz, verringert die Anzahl der Nachbarschaftswörter und beschleunigt gleichzeitig den Prozess von BLAST

Um die Software auszuführen, benötigt BLAST eine Abfragesequenz zum Suchen und eine Sequenz zum Durchsuchen (auch Zielsequenz genannt) oder eine Sequenzdatenbank, die mehrere solcher Sequenzen enthält. BLAST findet Untersequenzen in der Datenbank, die den Untersequenzen in der Abfrage ähnlich sind. Bei typischer Verwendung ist die Abfragesequenz viel kleiner als die Datenbank, z. B. kann die Abfrage tausend Nukleotide umfassen, während die Datenbank mehrere Milliarden Nukleotide umfasst.

Die Grundidee von BLAST besteht darin, dass in einem statistisch signifikanten Alignment oft High-scoring Segment Pairs (HSP) enthalten sind. BLAST sucht nach Sequenz-Alignments mit hoher Bewertung zwischen der Abfragesequenz und den vorhandenen Sequenzen in der Datenbank unter Verwendung eines heuristischen Ansatzes, der sich dem Smith-Waterman-Algorithmus annähert. Der erschöpfende Smith-Waterman-Ansatz ist jedoch zu langsam, um große genomische Datenbanken wie die GenBank zu durchsuchen. Daher verwendet der BLAST-Algorithmus einen heuristischen Ansatz, der weniger genau ist als der Smith-Waterman-Algorithmus, aber über 50-mal schneller. [8] Die Geschwindigkeit und die relativ gute Genauigkeit von BLAST gehören zu den wichtigsten technischen Neuerungen der BLAST-Programme.

Ein Überblick über den BLAST-Algorithmus (eine Protein-zu-Protein-Suche) ist wie folgt: [12]

  1. Entfernen Sie Regionen mit niedriger Komplexität oder Sequenzwiederholungen in der Abfragesequenz. "Region niedriger Komplexität" bedeutet eine Region einer Sequenz, die aus wenigen Arten von Elementen besteht. Diese Regionen können hohe Werte liefern, die das Programm verwirren, um die tatsächlichen signifikanten Sequenzen in der Datenbank zu finden, daher sollten sie herausgefiltert werden. Die Regionen werden mit einem X (Proteinsequenzen) oder N (Nukleinsäuresequenzen) markiert und dann vom BLAST-Programm ignoriert. Um die Bereiche mit geringer Komplexität herauszufiltern, wird für Proteinsequenzen das Programm SEG und für DNA-Sequenzen das Programm DUST verwendet. Andererseits wird das Programm XNU verwendet, um die Tandem-Repeats in Proteinsequenzen zu maskieren.
  2. Mach ein k-Buchstabenwortliste der Abfragesequenz. Nehmen k=3 zum Beispiel listen wir die Wörter der Länge 3 in der Abfrageproteinsequenz auf (k ist normalerweise 11 für eine DNA-Sequenz) "sequentiell", bis der letzte Buchstabe der Abfragesequenz enthalten ist. Die Methode ist in Abbildung 1 dargestellt.

    Die ursprüngliche Version von BLAST streckt eine längere Ausrichtung zwischen der Abfrage und der Datenbanksequenz in die linke und rechte Richtung, ausgehend von der Position, an der die genaue Übereinstimmung aufgetreten ist. Die Verlängerung hört nicht auf, bis die akkumulierte Gesamtpunktzahl des HSP zu sinken beginnt. Ein vereinfachtes Beispiel ist in Abbildung 2 dargestellt.
  • Der ursprüngliche BLAST erzeugt nur Alignments ohne Lücken einschließlich der anfänglich gefundenen HSPs einzeln, selbst wenn mehr als ein HSP in einer Datenbanksequenz gefunden wird.
  • BLAST2 erzeugt ein einzelnes Alignment mit Lücken, das alle anfänglich gefundenen HSP-Regionen umfassen kann. Beachten Sie, dass die Berechnung des Scores und seiner entsprechenden E-Wert beinhaltet die Anwendung angemessener Gap-Strafen.

Parallel BLAST Bearbeiten

Parallele BLAST-Versionen von geteilten Datenbanken werden unter Verwendung von MPI und Pthreads implementiert und auf verschiedene Plattformen einschließlich Windows, Linux, Solaris, Mac OS X und AIX portiert. Beliebte Ansätze zur Parallelisierung von BLAST umfassen Abfrageverteilung, Hash-Tabellensegmentierung, Berechnungsparallelisierung und Datenbanksegmentierung (Partition). Datenbanken werden in gleich große Teile aufgeteilt und lokal auf jedem Knoten gespeichert. Jede Abfrage wird auf allen Knoten parallel ausgeführt und die resultierenden BLAST-Ausgabedateien aller Knoten zusammengeführt, um die endgültige Ausgabe zu erhalten. Spezifische Implementierungen umfassen MPIblast, ScalaBLAST, DCBLAST und so weiter. [14]

Das BLAST-Programm kann entweder heruntergeladen und als Befehlszeilen-Dienstprogramm "blastall" ausgeführt oder kostenlos über das Internet aufgerufen werden. Der BLAST-Webserver, der vom NCBI gehostet wird, ermöglicht es jedem, der einen Webbrowser besitzt, Ähnlichkeitssuchen in ständig aktualisierten Datenbanken von Proteinen und DNA durchzuführen, die die meisten der neu sequenzierten Organismen enthalten.

Das BLAST-Programm basiert auf einem Open-Source-Format, wodurch jeder darauf zugreifen und den Programmcode ändern kann. Dies hat zur Gründung mehrerer BLAST-„Spin-offs“ geführt.

Mittlerweile gibt es eine Handvoll verschiedener BLAST-Programme, die je nach Vorhaben und Einsatzzweck verwendet werden können. Diese verschiedenen Programme unterscheiden sich in der Eingabe der Abfragesequenz, der durchsuchten Datenbank und dem, was verglichen wird. Diese Programme und ihre Details sind unten aufgeführt:

BLAST ist eigentlich eine Familie von Programmen (alle sind in der ausführbaren Datei von blastall enthalten). Dazu gehören: [15]

Nukleotid-Nukleotid-BLAST (blastn) Dieses Programm gibt bei einer DNA-Abfrage die ähnlichsten DNA-Sequenzen aus der vom Benutzer angegebenen DNA-Datenbank zurück. Protein-Protein BLAST (blastp) Dieses Programm gibt bei einer Proteinanfrage die ähnlichsten Proteinsequenzen aus der vom Benutzer angegebenen Proteindatenbank zurück. Position-Specific Iterative BLAST (PSI-BLAST) (blastpgp) This program is used to find distant relatives of a protein. First, a list of all closely related proteins is created. These proteins are combined into a general "profile" sequence, which summarises significant features present in these sequences. A query against the protein database is then run using this profile, and a larger group of proteins is found. This larger group is used to construct another profile, and the process is repeated. By including related proteins in the search, PSI-BLAST is much more sensitive in picking up distant evolutionary relationships than a standard protein-protein BLAST. Nucleotide 6-frame translation-protein (blastx) This program compares the six-frame conceptual translation products of a nucleotide query sequence (both strands) against a protein sequence database. Nucleotide 6-frame translation-nucleotide 6-frame translation (tblastx) This program is the slowest of the BLAST family. It translates the query nucleotide sequence in all six possible frames and compares it against the six-frame translations of a nucleotide sequence database. The purpose of tblastx is to find very distant relationships between nucleotide sequences. Protein-nucleotide 6-frame translation (tblastn) This program compares a protein query against the all six reading frames of a nucleotide sequence database. Large numbers of query sequences (megablast) When comparing large numbers of input sequences via the command-line BLAST, "megablast" is much faster than running BLAST multiple times. It concatenates many input sequences together to form a large sequence before searching the BLAST database, then post-analyzes the search results to glean individual alignments and statistical values.

Of these programs, BLASTn and BLASTp are the most commonly used [ Zitat benötigt ] because they use direct comparisons, and do not require translations. However, since protein sequences are better conserved evolutionarily than nucleotide sequences, tBLASTn, tBLASTx, and BLASTx, produce more reliable and accurate results when dealing with coding DNA. They also enable one to be able to directly see the function of the protein sequence, since by translating the sequence of interest before searching often gives you annotated protein hits.

Alternative versions Edit

A version designed for comparing large genomes or DNA is BLASTZ.

CS-BLAST (Context-Specific BLAST) is an extended version of BLAST for searching protein sequences that finds twice as many remotely related sequences as BLAST at the same speed and error rate. In CS-BLAST, the mutation probabilities between amino acids depend not only on the single amino acid, as in BLAST, but also on its local sequence context. Washington University produced an alternative version of NCBI BLAST, called WU-BLAST. The rights have since been acquired to Advanced Biocomputing, LLC.

In 2009, NCBI has released a new set of BLAST executables, the C++ based BLAST+, and has released C versions until 2.2.26. [16] Starting with version 2.2.27 (April 2013), only BLAST+ executables are available. Among the changes is the replacement of the blastall executable with separate executables for the different BLAST programs, and changes in option handling. The formatdb utility (C based) has been replaced by makeblastdb (C++ based) and databases formatted by either one should be compatible for identical blast releases. The algorithms remain similar, however, the number of hits found and their order can vary significantly between the older and the newer version. BLAST+ since

Accelerated versions Edit

TimeLogic offers an FPGA-accelerated implementation of the BLAST algorithm called Tera-BLAST that is hundreds of times faster.

Other formerly supported versions include:

  • FPGA-accelerated
    • Prior to their acquisition by Qiagen, CLC bio collaborated with SciEngines GmbH on an FPGA accelerator they claimed will give 188x acceleration of BLAST.
    • The Mitrion-C Open Bio Project was an effort to port BLAST to run on Mitrion FPGAs.
    • MPIBlast is a parallel implementation of NCBI BLAST using Message Passing Interface. By efficiently utilizing distributed computational resources through database fragmentation, query segmentation, intelligent scheduling, and parallel I/O, mpiBLAST improves NCBI BLAST performance by several orders of magnitude while scaling to hundreds of processors.
    • CaBLAST [20] makes search on large databases orders of magnitude faster by exploiting redundancy in data.
    • Paracel BLAST was a commercial parallel implementation of NCBI BLAST, supporting hundreds of processors.
    • QuickBLAST (kblastp) from NCBI is an implementation accelerated by prefiltering based on Jaccard index estimates with hashed pentameric fragments. The filtering slightly reduces sensitivity, but increases performance by an order of magnitude. [21] NCBI only makes the search available on their non-redundant (nr) protein collection, and does not offer downloads.

    The predecessor to BLAST, FASTA, can also be used for protein and DNA similarity searching. FASTA provides a similar set of programs for comparing proteins to protein and DNA databases, DNA to DNA and protein databases, and includes additional programs for working with unordered short peptides and DNA sequences. In addition, the FASTA package provides SSEARCH, a vectorized implementation of the rigorous Smith-Waterman algorithm. FASTA is slower than BLAST, but provides a much wider range of scoring matrices, making it easier to tailor a search to a specific evolutionary distance.

    An extremely fast but considerably less sensitive alternative to BLAST is BLAT (Bletzte Like EINAusrichtung Tool). While BLAST does a linear search, BLAT relies on k-mer indexing the database, and can thus often find seeds faster. [22] Another software alternative similar to BLAT is PatternHunter.

    Advances in sequencing technology in the late 2000s has made searching for very similar nucleotide matches an important problem. New alignment programs tailored for this use typically use BWT-indexing of the target database (typically a genome). Input sequences can then be mapped very quickly, and output is typically in the form of a BAM file. Example alignment programs are BWA, SOAP, and Bowtie.

    For protein identification, searching for known domains (for instance from Pfam) by matching with Hidden Markov Models is a popular alternative, such as HMMER.

    An alternative to BLAST for comparing two banks of sequences is PLAST. PLAST provides a high-performance general purpose bank to bank sequence similarity search tool relying on the PLAST [23] and ORIS [24] algorithms. Results of PLAST are very similar to BLAST, but PLAST is significantly faster and capable of comparing large sets of sequences with a small memory (i.e. RAM) footprint.

    For applications in metagenomics, where the task is to compare billions of short DNA reads against tens of millions of protein references, DIAMOND [25] runs at up to 20,000 times as fast as BLASTX, while maintaining a high level of sensitivity.

    The open-source software MMseqs is an alternative to BLAST/PSI-BLAST, which improves on current search tools over the full range of speed-sensitivity trade-off, achieving sensitivities better than PSI-BLAST at more than 400 times its speed. [26]

    Optical computing approaches have been suggested as promising alternatives to the current electrical implementations. OptCAM is an example of such approaches and is shown to be faster than BLAST. [27]

    Comparing BLAST and the Smith-Waterman Process Edit

    While both Smith-Waterman and BLAST are used to find homologous sequences by searching and comparing a query sequence with those in the databases, they do have their differences.

    Due to the fact that BLAST is based on a heuristic algorithm, the results received through BLAST, in terms of the hits found, may not be the best possible results, as it will not provide you with all the hits within the database. BLAST misses hard to find matches.

    A better alternative in order to find the best possible results would be to use the Smith-Waterman algorithm. This method varies from the BLAST method in two areas, accuracy and speed. The Smith-Waterman option provides better accuracy, in that it finds matches that BLAST cannot, because it does not miss any information. Therefore, it is necessary for remote homology. However, when compared to BLAST, it is more time consuming, not to mention that it requires large amounts of computer usage and space. However, technologies to speed up the Smith-Waterman process have been found to improve the time necessary to perform a search dramatically. These technologies include FPGA chips and SIMD technology.

    In order to receive better results from BLAST, the settings can be changed from their default settings. However, there is no given or set way of changing these settings in order to receive the best results for a given sequence. The settings available for change are E-Value, gap costs, filters, word size, and substitution matrix. Note, that the algorithm used for BLAST was developed from the algorithm used for Smith-Waterman. BLAST employs an alignment which finds "local alignments between sequences by finding short matches and from these initial matches (local) alignments are created". [28]

    To help users interpreting BLAST results, different software is available. According to installation and use, analysis features and technology, here are some available tools: [29]


    Makromolekulare Architekturen und weiche Nanoobjekte

    6.04.2.4.7 Polylysine dendrimers

    Polylysine dendrons were first developed by Denkewalter et al. 100 in the beginning of the 1980s, employing solid-phase synthesis to generate a 10th-generation polypeptide dendron. These structures were revisited by Tam et al., who reported the divergent construction of a third-generation unsymmetrical polylysine dendron, using conventional solid-phase peptide synthesis (SPPS). 101 The dendrons were accomplished using a phenylacetamidomethyl-functional PS support with a β-Ala spacer. Prior to cleavage, the dendrons were end-capped with a peptide sequence derived from the human T-cell antigen receptor. 101 Polylysine dendrons have also been achieved on PEGA 102,103 as well as Tentagel resins. 104,105 The convergent solid-phase synthesis of polylysine dendrons on silica support has been reported in order to evaluate the product as a chiral stationary phase in chromatography. 106 The results indicate higher surface coverage with increasing generation. The straightforward and easily adapted solid-phase synthesis of polylysine dendrimers makes solution-based construction unnecessary. Nonetheless, the divergent growth of fourth-generation polylysine dendron was accomplished using PEG as a hydrophilic tail, which facilitates simple purification and isolation of the product. 107 The convergent growth approach has also been employed to construct third-generation polylysine dendrons decorated with eight mannose or galactose groups and a single fluorescein isothiocyanate (FITC) dye. 108 Supramolecular structures based on polylysine dendron were first reported by Hirst et al., 109 who described a unique gelation effect based on hydrogen bonding between the carboxylic group at the focal point and diaminododecane used as a gelator. The ratio between the two components, the chirality of the dendrons, 110 and the length of the diamine spacer 111 were found to significantly influence the structure on a microscopic and macroscopic level. Supramolecular chemistry was also successfully employed to render polylysine dendrimers from dendron derivatives. The dendrimers were assembled using the covalently attached crown ether and ammonium cationic guests and disassembled using potassium cations ( Abbildung 22 ). 24

    Figure 22 . Supramolecular chemistry of polylysine dendrimers as described by Hirst et al. 109


    Current Utilization of Biologicals, An Issue of Facial Plastic Surgery Clinics of North America, Volume 26-4

    This issue of Facial Plastic Surgery Clinics, guest edited by Greg Keller, MD, is devoted to Current Utilization of Biologicals. Articles in this issue include: Biologicals: Where are we today?Where are we headed? Skin Biology: Healing Inflammation and Repair Hair Biology: Growth and Pigmentation Platelet Rich Plasma: Growth factors and Office Instrumentation Mesothelial Stem Cells and Stromal Vascular Fraction: Biology and Office Instrumentation Skin Rejuvenation Cosmecueticals: Current Products Platelet Rich Plasma for Skin Rejuvenation and Tissue Fill Microneedling with RF and Lasers: Biologicals for Skin Rejuvenation and Repair Microneedling and PRP for Moh’s and Acne Scars Platelet Rich Plasma for Hair Loss: Review of Methods and Results Mesothelial Stem Cells and Stromal Vascular Fraction for Wound Healing and Fat Transplantation: My Results in China Lasers, Microneedling and PRP for Skin Rejuvenation and Repair Mesothelial Stem Cells and Stromal Vascular Fraction for Hair Loss and Mesothelial Stem Cells and Stromal Vascular Fraction for Skin Rejuvenation.


    Humoral Stimuli

    The term “humoral” is derived from the term “humor,” which refers to bodily fluids such as blood. EIN humoral stimulus refers to the control of hormone release in response to changes in extracellular fluids such as blood or the ion concentration in the blood. For example, a rise in blood glucose levels triggers the pancreatic release of insulin. Insulin causes blood glucose levels to drop, which signals the pancreas to stop producing insulin in a negative feedback loop.


    Abstrakt

    The threatened northern brush-tailed phascogale (Phascogale pirata) is one of the most poorly known mammals in Australia. While the few available records indicate a decline in its distribution and abundance, it has not previously been subject to intensive targeted survey. Here, we trialled a specifically tailored methodology for detection of P. pirata, with the aim of informing ongoing survey and monitoring of this species. We deployed 50 motion-sensor cameras (spaced closely together in a grid 500 × 1000 m) on Melville Island (Northern Territory, Australia), between June 2018 and May 2019. Cameras were baited and secured to trees

    3 m above the ground on a bracket facing the trunk. We selected for large (>30 cm diameter at breast height [DBH]) trunks of the dominant tree species (Eucalyptus miniata, E. tetrodonta und Corymbia nesophila). We detected P. pirata 16 times on eight cameras over the duration of the study, finding that detection was most likely on large (DBH >41.5 cm) E. tetrodonta trees during the wet season. Our results indicate that survey effort for this species should be seasonally targeted and focussed on large trees. However, the efficacy of additional methods (nest boxes, Elliott traps) and a comparison between detections on arboreal versus ground-based cameras requires further investigation. We highlight the importance of conducting additional work on this species, as little is known about its ecology, population trends and threats, making it difficult to assess its conservation status. Without more targeted work, P. pirata is at risk of slipping into extinction unnoticed.

    Zusätzliche Stichworte: motion-sensor cameras, northern brush-tailed phascogale, rare and cryptic species, targeting monitoring, Tiwi Islands, tree-traps.


    Verweise

    Akin, D., and Gillogly-Akin, K. (1981 ). Traditional arts of East Kwaio, Malaita. Pacific Arts Newsletter 13, 31&ndash34.

    Alabai, M., Esau, T., Kekeubata, E., Waneagea, J., MacLaren, D., Major, R., and Callaghan, C. (2019 ). First record of Solomons nightjar Eurostopodus nigripennis for Malaita, with a description of its nest site. Bulletin of the British Ornithologists’ Club 139, 325&ndash327.
    | First record of Solomons nightjar Eurostopodus nigripennis for Malaita, with a description of its nest site. Querverweis | GoogleScholar Google Scholar |

    Banack, S. A. (1998 ). Diet selection and resource use by flying foxes (genus Pteropus). Ökologie 79, 1949&ndash1967.
    | Diet selection and resource use by flying foxes (genus Pteropus). Querverweis | GoogleScholar Google Scholar |

    Callaghan, C., Kekeubata, E., Waneagea, J., Alabai, M., Esau, T., MacLaren, D., and Major, R. (2019 ). A collaborative bird survey of East Kwaio, Malaita, Solomon Islands. Check List 15, 1119&ndash1136.
    | A collaborative bird survey of East Kwaio, Malaita, Solomon Islands. Querverweis | GoogleScholar Google Scholar |

    Flannery, T. (1991 ). Emporer, king and little pig: three rats of Guadacanal. Australian Natural History 23, 634&ndash641.

    Flannery, T. (1995). ‘Mammals of the South-west Pacific and Moluccan Islands.’ (Reed Books: Sydney.)

    Flannery, T. F. (2012). ‘Among the Islands.’ (Text Publishing: Melbourne.)

    Global Witness (2018). ‘Paradise Lost: How China Can Help the Solomon Islands Protect its Forests.’ (Global Witness: London.)

    Helgen, K. (2005 ). Systematics of the Pacific monkey-faced bats (Chiroptera: Pteropodidae), with a new species of Pteralopex and a new Fijian genus. Systematics and Biodiversity 3, 433&ndash453.
    | Systematics of the Pacific monkey-faced bats (Chiroptera: Pteropodidae), with a new species of Pteralopex and a new Fijian genus. Querverweis | GoogleScholar Google Scholar |

    Hendry, H., and Mann, C. (2018 ). Camelot – intuitive software for camera-trap data management. Oryx 52, 15.
    | Camelot – intuitive software for camera-trap data management. Querverweis | GoogleScholar Google Scholar |

    Ivens, W. (1927). ‘Melanesians of the South-east Solomon Islands.’ (Kegan Paul, Trench, Trubner & Co., Ltd.: London.)

    Keesing, R. M. (1992). ‘Custom and Confrontation the Kwaio Struggle for Cultural Autonomy.’ (University of Chicago Press: Chicago.)

    Lavery, T. H., and Judge, H. (2017 ). A new species of giant rat (Muridae, Uromys) from Vangunu, Solomon Islands. Zeitschrift für Mammalogie 98, 1518&ndash1530.
    | A new species of giant rat (Muridae, Uromys) from Vangunu, Solomon Islands. Querverweis | GoogleScholar Google Scholar |

    Lavery, T. H., Olds, A. D., Seddon, J. M., and Leung, L. K. P. (2016 ). The mammals of northern Melanesia: speciation, ecology, and biogeography. Säugetier Bewertung 46, 60&ndash76.
    | The mammals of northern Melanesia: speciation, ecology, and biogeography. Querverweis | GoogleScholar Google Scholar |

    Lavery, T. H., Kekeubata, E., Esau, T., Flannery, T. F., MacLaren, D., and Waneagea, J. (2018 ). Rat and bat hunt helped heal rift from colonial cruelty. Natur 563, 626.
    | Rat and bat hunt helped heal rift from colonial cruelty. Querverweis | GoogleScholar Google Scholar |

    Lavery, T. H., Alabai, M., Holland, P., Qaqara, C., and Vatohi, N. (2020a ). Feral cat abundance, density and activity in tropical island rainforests. Wildlife Research , .
    | Feral cat abundance, density and activity in tropical island rainforests. Querverweis | GoogleScholar Google Scholar |

    Lavery, T. H., Posala, C. K., Tasker, E. M., and Fisher, D. O. (2020b ). Resilience of tropical island endemic mammals to logging: a 25-year test. Biologie des globalen Wandels , .
    | Resilience of tropical island endemic mammals to logging: a 25-year test. Querverweis | GoogleScholar Google Scholar | 32239613 PubMed |

    Mayr, E., and Diamond, J. (2001). ‘The Birds of Northern Melanesia: Speciation, Ecology & Biogeography.’ (Oxford University Press: New York.)

    Medina, F. M., Bonnaud, E., Vidal, E., Tershy, B. R., Zavaleta, E. S., Josh Donlan, C., Keitt, B. S., Corre, M., Horwath, S. V., and Nogales, M. (2011 ). A global review of the impacts of invasive cats on island endangered vertebrates. Biologie des globalen Wandels 17, 3503&ndash3510.
    | A global review of the impacts of invasive cats on island endangered vertebrates. Querverweis | GoogleScholar Google Scholar |

    Nakashima, D., and Roué, M. (2002). Indigenous knowledge, peoples and sustainable practice. In ‘Encyclopedia of Global Environmental Change. 5: Social and Economic Dimensions of Global Environmental Change’. (Ed. P. Timmerman.) pp. 314–324. (John Wiley & Sons, Ltd: Chichester, UK.)

    Palmas, P., Jourdan, H., Rigault, F., Debar, L., De Meringo, H., Bourguet, E., Mathivet, M., Lee, M., Adjouhgniope, R., Papillon, Y., Bonnaud, E., and Vidal, E. (2017 ). Feral cats threaten the outstanding endemic fauna of the New Caledonia biodiversity hotspot. Biologische Konservierung 214, 250&ndash259.
    | Feral cats threaten the outstanding endemic fauna of the New Caledonia biodiversity hotspot. Querverweis | GoogleScholar Google Scholar |

    Pennay, M., and Lavery, T. (2017). ‘Identification Guide to Bat Echolocation Calls of Solomon Islands & Bougainville.’ Available at: http://ausbats.org.au/bat-calls-of-solomon-islands/4593992119 (accessed 10 September 2019).

    Schmitt, L., Hisheh, S., Suyanto, A., Maharadatunkamsi, N., Newbound, C., Kitchener, D., and How, R. (2009). Crossing the line: the impact of contemporary and historical sea-barriers on the population structure of bats in southern Wallacea. In ‘Island Bats: Evolution, Ecology and Conservation’. (Eds T. Fleming, and P. Racey.) pp. 59–95. (University of Chicago Press: Chicago.)

    Solomon Islands Government (2009). Report on 2009 population & housing census: basic tables and census description. vol. 1. Solomon Islands National Statistical Office, Honiara, Solomon Islands.

    Vincenot, C. E., Vincent Florens, F. B., and Kingston, T. (2017 ). Can we protect island flying foxes? Wissenschaft 355, 1368&ndash1370.
    | Can we protect island flying foxes? Querverweis | GoogleScholar Google Scholar | 28360279 PubMed |


    Schau das Video: pembantu montok bersihin toilet (Kann 2022).