Information

Was ist der Unterschied zwischen nicht-kodierenden und intergenen Regionen?

Was ist der Unterschied zwischen nicht-kodierenden und intergenen Regionen?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Die ursprüngliche Frage war, zu verstehen, was sich in einem eukaryotischen Organismus stromabwärts eines Gens befindet. Ich verstehe, dass sich diese Region 3' eines Gens befindet, und daher würde ich erwarten, nicht kodierende Regionen zu finden, aber gibt es einen Unterschied zwischen nicht kodierenden Regionen und einer intergenischen Region?

Ein kleiner Hintergrund meiner Arbeit: Ich untersuche die Wirkung von Retrotransposons in S. cerevisiae-Populationen und habe bereits die möglichen Auswirkungen dieser Retrotransposons identifiziert und dies waren die Konsequenzen:

Upstream-Genvariante 49 Downstream-Genvariante 42 Intergene Variante 4 Transkriptablation 3 Kodierungssequenz Variante 1 Feature Elongation 1 3' UTR Variante 1

Ist es also klug zu sagen, dass hinter einem Gen nicht-kodierende Gene liegen?


"Intergenic" ist, nun ja, eine Peinlichkeit, obwohl es schwer zu vermeiden sein kann. Intergenisch bedeutet wörtlich: zwischen den Genen. Gene sind, wie zu erwarten, genetisch definiert als Bereiche des Chromosoms mit einer bestimmten genetischen Rolle. Zwischen den Genen haben wir Junk, Spam, ohne Bedeutung oder Bedeutung, da es sonst ein Gen wäre. In den 1990er Jahren wusste jeder, dass der Großteil des Genoms „Junk-DNA“ war und es war ziemlich einfach. Und das zentrale Dogma war, dass DNA macht, dass mRNA Proteine ​​​​macht und wenn es keine mRNA gibt, die Proteine ​​​​produziert, oder sogar keine lang Protein, dann nahmen sie an, dass es kein Gen gibt.

Nun, das Problem bei der Verwendung dieser Begriffe ist heutzutage erstens, dass es sehr schwer ist, ein bestimmtes Stück DNA zu zeigen noch nie hat eine Rolle. Schließlich kann man oft ein ganzes Gen ohne sichtbare Auswirkungen auf einen Organismus entfernen. Wie kann also eine nicht kodierende Sequenz "zwischen Genen" schlüssig bewiesen werden, dass sie bedeutungslos und für einen ihrer Nachbarn ohne Bedeutung ist? Und zweitens definitiv DNA tut eine Rolle spielen, selbst wenn es lediglich nicht-kodierende RNA produziert oder als regulatorische Sequenz agiert, die dies tut. So können Sie beispielsweise auf OMIM viele Datensätze für "intergenic" nachschlagen, mit Ergebnissen wie H19, für die ein Begriff "LONG INTERGENIC NONCODING RNA H19" ist. Beachten Sie auch, dass H19 als HGNC-zugelassenes Gensymbol aufgeführt ist, daher ist es ein intergenes Gen. Schwierig, nicht wahr? (Ich habe großen Respekt vor OMIM - das ist nicht ihre Schuld) Außerdem können Enhancer ziemlich weit von einem Gen entfernt sein, sogar über das Ende eines anderen Gens hinaus oder mehrere Gene betreffen, also auch wenn eine Mutation im Enhancer dies tun könnte genetisch als Allel eines spezifischen Gens fungieren, könnte es sequenziell als in einer intergenischen Region lokalisiert beschrieben werden.

Fazit: Die intergenischen Regionen, über die Sie lesen, werden zwischen Dingen liegen, die als Gene erkannt werden und von denen bekannt sein kann, dass sie einen Einfluss auf das eine oder andere (oder auf beide) haben oder nicht. Sie enthalten weder CDS, das immer als Gen betrachtet wird, noch 5'UTR oder 3'UTR, da diese vor oder nach einem CDS transkribiert werden. Darüber hinaus, wie sie von "Upstream-Sequenz" und "Downstream-Sequenz" unterschieden werden, kann das völlig willkürlich sein. Sie sind vielleicht zu WormBase gegangen und haben kuratierte Genaufzeichnungen herausgezogen und einige Basenpaare vor der Startstelle als Promotor hinzugefügt - aber das weiß ich nicht. Sie müssen nur versuchen, die jeweilige Referenz für das von Ihnen verwendete Tool zu finden.


Eine intergene Region ist nur eine von vielen Arten nicht-kodierender Sequenzen.

Andere sind:

  • Promoter
  • regulatorische Bindungsstellen
  • Terminatoren
  • Introns
  • Aptamere
  • Ribosomeneintrittsstellen

Da ist ein Menge von Dingen, die neben der Proteincodierungssequenz Teil von Genen sind.

Eine gute Möglichkeit, sich ein Bild davon zu machen, was es neben Coding-Regionen noch gibt, ist das Durchsuchen der Sequence Ontology. Wenn Sie zur Codierungssequenz navigieren und anfangen, Eltern- und Cousin-Begriffe zu durchsuchen, werden Sie eine große Anzahl finden, einschließlich all der Dinge, die ich oben erwähnt habe, sowie der intergenischen Region mit Definitionen, die mit Ohr verbunden sind.


Was ist der Unterschied zwischen nicht-kodierenden und intergenen Regionen? - Biologie

Ein Intergene Region ist ein Abschnitt von DNA-Sequenzen, der sich zwischen Genclustern befindet, die wenige oder keine Gene enthalten. Gelegentlich einige intergen Die DNA steuert Gene in der Nähe, aber das meiste davon hat derzeit keine bekannte Funktion. Es ist eine der DNA-Sequenzen, die kollektiv als Junk-DNA bezeichnet wird, obwohl es nur ein Phänomen ist, das als solches und in der Wissenschaft bezeichnet wird.
Ganzer Artikel >>>

Intergene Regionszusammenfassung mit 2 Seiten Enzyklopädieeinträgen, Aufsätzen, Zusammenfassungen, . Analyse von 16S-23S intergen Spacer-Regionen der rRNA-Operone.
Ganzer Artikel >>>

Das deutet darauf hin intergen Transkripte unterliegen funktionalen Einschränkungen. Im Allgemeinen, intergen Transkripte neigen dazu, manchmal in geringen Mengen exprimiert zu werden.
Ganzer Artikel >>>

20% von intergen Regionen, treten oft in Klumpen auf und sind selten. Um orthologe zu finden intergen Regionen suchten wir nach Paaren von .
Ganzer Artikel >>>

Die 16S-23S rDNA intergen Abstandshalter variiert stärker in der Größe und . Heterogenität zwischen 16S-23S rRNA intergen Abstandshalter von Arten innerhalb der ` .
Ganzer Artikel >>>

Enzyklopädie Informationen zu Intergene DNA. Name impliziert, intergen DNA bezieht sich auf . Muster evolutionärer Beschränkungen in Intronic und Intergene DNA.
Ganzer Artikel >>>

Upstream intergen Regionen wurden aus den Genomsequenzen unter Verwendung eines PERL abgebaut. Intergene Sequenzen können dann durch Kopieren und Einfügen von COGSearch abgerufen werden.
Ganzer Artikel >>>

Zoologische Informationen, Geschichte, Artikel und Forschung aus akademischen Zeitschriften, Zeitungen und Zeitschriften auf HighBeam.com. Kostenlose Testversion, Kreditkarte erforderlich.
Ganzer Artikel >>>

Im Vergleich zum intergen Spacer-Locus und zur Beurteilung der Verknüpfung. Zwei der verlinkten intergen spacer - und p66 - Genotypen waren speziesspezifisch .
Ganzer Artikel >>>

Wir haben einen Satz von 66 . generiert intergen Sequenzen in Arabidopsis lyrata, eine nahe . Die intergen Regionen umfassten Reste von transponierbaren Elementen (TE) und Regionen.
Ganzer Artikel >>>

problematischer für intergen Regionen von Pflanzenkerngenomen, weil Pflanze . Theoretisch ortholog intergen Daten sind für das Studium wertvoll.
Ganzer Artikel >>>

Details zu Genmutation, Intragen, Intergene, Punktmutationen, enzymatische Kapazitäten, normale Basensequenz, DNA-Molekül . kann intragen sein oder intergen. .
Ganzer Artikel >>>

Pfeile unterstreichen die drei sich wiederholenden Sequenzen in diesem intergen Region. . ( B) Schematische Darstellung der intergen Region. .
Ganzer Artikel >>>

Der Schlüssel zu E. coli. Dr. Sophie Bachellier hat eine Webseite für die IRUs (Intergene Einheiten wiederholen). liegt in den intergen Regionen bakteriell.
Ganzer Artikel >>>

PLoS ONE: eine integrative, von Experten begutachtete Open-Access-Ressource von PUBLIC . Konserviert intergen Sequenzen werden durch Vergleich der IGRs der .
Ganzer Artikel >>>

. Suche im Genom von E. coli nach intergen Regionen mit hoher Sequenzidentität. Roman intergen Wiederholungen von Escherichia coli K-12". Res. Microbiol. .
Ganzer Artikel >>>

viele intergen Regionen wäre zu hoch. konserviert unter den sensu stricto Arten zu . von S. cerevisiae, dass ihre intergen Sequenzen.
Ganzer Artikel >>>

Intergene Sequenzen wurden zufällig aus allen 24 Chromosomen des Menschen herausgeschnitten. Trainingsset inklusive 12 000 intergen Fragmente und 12 000 PET-Fragmente. .
Ganzer Artikel >>>

BioInfoBank-Bibliothek :: DNA, Intergene :: Physiologie :: [Nichtkodierende Sequenzen des eukaryontischen Genoms als zusätzlicher Schutz von Genen vor chemischen Mutagenen] .
Ganzer Artikel >>>

Charakterisierung der intergen RNA-Profil bei Abdominal-A und Abdominal-B in . Diese Beobachtungen legen nahe, dass die intergen RNAs können dabei eine Rolle spielen.
Ganzer Artikel >>>


Unterschiede zwischen kodierenden und nicht-kodierenden Regionen in der Trichomonas vaginalis Genom: ein Aktin-Gen als Lokusmodell 1

Die Sequenz eines klonierten genomischen Fragments von Trichomonas vaginalis mit einem vollständigen Actin-Gen wurde bestimmt. Es wurde ein ununterbrochener offener Leserahmen von 1128 Nukleotiden gefunden, der für ein Actin-Gen kodiert. Zwei überlappende Konsensus-Promotorsequenzen für T. vaginalis wurden 12 Nukleotide stromaufwärts des Aktin-Initiationscodons gefunden. Neben Aktin wurden am 5'- und 3'-Ende des Klons zwei unvollständige offene Leseraster gefunden. Diese beiden Sequenzen werden exprimiert und zeigten Ähnlichkeit mit Adenylatcyclase-Genen und einem hypothetischen Hefeprotein. Die Gesamtsequenz zeigte einen höheren G+C-Gehalt und eine geringere Häufigkeit wiederholter Sequenzen in den kodierenden Regionen im Vergleich zu den nicht-kodierenden Regionen. Eine ähnliche ungleiche Nukleotidverteilung wurde in verschiedenen T. vaginalis Gene, die aus Datenbanken abgerufen werden.


Funktionelle mikrobielle Diversität in kontaminierter Umgebung und Anwendung in der Bioremediation

Satyanarayan Panigrahi , . Toleti Subba Rao , in Mikrobielle Vielfalt in der genomischen Ära , 2019

21.2.2.7 Ribosomale intergene Spacer-Analyse (RISA)

Die rRNA Intergenic Spacer Analysis (RISA) ist eine mikrobielle Gemeinschaftsanalysemethode, die eine PCR-Amplifikation einer Region des rRNA-Genoperons zwischen der kleinen (16S) und der großen (23S) Untereinheit (Fischer und Triplett, 1999) umfasst, die als intergene Spacerregion bezeichnet wird ( ESR) ( Abb. 21.8 ).

Abbildung 21.8. Ribosomale intergene Spacer-Analyse ein typischer Überblick.

Durch die Verwendung von Oligonukleotid-Primern, die auf konservierte Regionen in den 16S- und 23S-Genen abzielen, können RISA-Fragmente aus den meisten der dominanten Bakterien in einer Umweltprobe erzeugt werden. Die Mehrheit des rRNA-Operons dient einer strukturellen Funktion Teile der intergenischen 16S-23S-Region können je nach Bakterienart tRNAs kodieren. Der taxonomische Wert der ISR liegt jedoch in der signifikanten Heterogenität sowohl in der Länge als auch in der Nukleotidsequenz. Die ISR liegt zwischen 150 und 1500 bp, wobei die meisten ISR-Längen zwischen 150 und 500 bp liegen. Die automatisierte Version von RISA ist als ARISA bekannt und beinhaltet die Verwendung eines fluoreszenzmarkierten Vorwärtsprimers, und ISR-Fragmente werden automatisch von einem Laserdetektor nachgewiesen. ARISA ermöglicht die gleichzeitige Analyse vieler Proben, jedoch hat sich gezeigt, dass die Technik den mikrobiellen Reichtum und die Vielfalt überschätzt (Fisher und Triplett, 1999). RISA wurde verwendet, um mikrobielle Populationen nachzuweisen, die am Abbau polyaromatischer Kohlenwasserstoffe bei niedrigen Temperaturen unter aeroben und nitratreduzierenden angereicherten Bodenbedingungen beteiligt sind (Eriksson et al., 2003). Es wurde beobachtet, dass die Dominanz von Bakterien, die zu Alpha-, Beta- und Gamma-Proteobakterien gehören, die in den Anreicherungen vorhanden waren, erfolgreich in Kultur gebracht wurde. Eine kürzlich durchgeführte Studie nutzte ARISA, um die Vielfalt der kohlenwasserstoffabbauenden Bakterien und die Reaktion der Bakteriengemeinschaft in durch Ölverschmutzungen kontaminierten Strandsanden im Golf von Mexiko zu untersuchen (Kostka et al., 2011). Die Autoren beobachteten eine erhöhte Häufigkeit von Alcanivorax-Sequenzen im ölverseuchten Sand. Ranjardet al. (2001) verwendeten ARISA, um die Bakteriengemeinschaften von vier verschiedenen Bodentypen zu charakterisieren. Ihre Ergebnisse zeigten, dass ARISA eine sehr effektive und empfindliche Methode ist, um Unterschiede zwischen komplexen Bakteriengemeinschaften auf verschiedenen räumlichen Skalen (Variabilität zwischen und innerhalb des Standorts) zu erkennen.


Definition

Kodierende DNA bezieht sich auf die DNA im Genom, die für Protein kodierende Gene enthält, während sich nicht kodierende DNA auf die andere Art von DNA bezieht, die nicht für Proteine ​​kodiert.

Prozentsatz im Genom

Kodierende DNA macht nur 1% des menschlichen Genoms aus, während nicht kodierende DNA 99% des menschlichen Genoms ausmacht.

Komponenten

Kodierende DNA besteht aus Exons, während nichtkodierende DNA aus regulatorischen Elementen, nichtkodierenden RNA-Genen, Introns, Pseudogenen, sich wiederholenden Sequenzen und Telomeren besteht.

Kodierung für Proteine

Kodierende DNA kodiert für Proteine, während nichtkodierende DNA nicht für Proteine ​​kodiert.

Ergebnisse der Transkription

Kodierende DNA wird einer Transkription unterzogen, um mRNAs zu synthetisieren, während nichtkodierende DNA einer Transkription unterzogen wird, um tRNAs, rRNAs und andere regulatorische RNAs zu synthetisieren.

Die Funktion der Genprodukte

Proteine, die durch kodierende DNA kodiert werden, haben strukturelle, funktionelle und regulatorische Bedeutung in der Zelle, während nichtkodierende DNA für die Kontrolle der Genaktivität wichtig ist.

Abschluss

Kodierende DNA ist der DNA-Typ im Genom, der für proteinkodierende Gene kodiert. Im Allgemeinen durchlaufen diese Gene eine Transkription, um mRNA zu synthetisieren. Bei Eukaryoten wird die kodierende Region proteinkodierender Gene durch Introns unterbrochen, die nach der Transkription entfernt werden. mRNAs unterliegen jedoch einer Translation, um Proteine ​​zu produzieren. Bezeichnenderweise spielen Proteine ​​eine Schlüsselrolle in der Zelle, indem sie als strukturelle, funktionelle und regulatorische Komponenten der Zelle dienen. Im Gegensatz dazu ist nichtkodierende DNA eine andere Art von DNA, die etwa 99% des Genoms ausmacht. Es enthält jedoch Gene für nichtkodierende RNAs, einschließlich tRNAs, rRNAs und andere regulatorische RNAs, die bei der Translation von mRNA wichtig sind. Außerdem umfasst nicht-kodierende DNA regulatorische Elemente, Introns, Pseudogene, sich wiederholende Sequenzen und Telomere. Daher besteht der Hauptunterschied zwischen kodierender DNA und nicht-kodierender DNA in der Art der vorhandenen Gene und ihrer Genprodukte.

Verweise:

1. „Was ist nichtkodierende DNA? – Genetics Home Reference – NIH.“ US-amerikanische Nationalbibliothek für Medizin, National Institutes of Health, hier verfügbar.

Bild mit freundlicher Genehmigung:

1. “Gene Struktur Eukaryote 2 kommentiert” von Thomas Shafee – Shafee T, Lowe R (2017). “Eukaryotische und prokaryotische Genstruktur”. WikiJournal of Medicine 4 (1). DOI:10.15347/wjm/2017.002. ISSN 20024436. (CC BY 4.0) über Commons Wikimedia
2. “TATA-Box-Mechanismus” Von Luttysar – Eigene Arbeit (CC BY-SA 4.0) über Commons Wikimedia
3. “DNA zu Protein oder ncRNA” Von Thomas Shafee – Eigene Arbeit (CC BY 4.0) über Commons Wikimedia

Über den Autor: Lakna

Lakna, Absolventin der Molekularbiologie und Biochemie, ist Molekularbiologin und hat ein breites und starkes Interesse an der Entdeckung naturbezogener Dinge


Inhalt

Die Menge der gesamten genomischen DNA variiert stark zwischen den Organismen, und auch das Verhältnis von kodierender und nicht-kodierender DNA innerhalb dieser Genome variiert stark. Zum Beispiel wurde ursprünglich vorgeschlagen, dass über 98% des menschlichen Genoms keine Proteinsequenzen kodieren, einschließlich der meisten Sequenzen innerhalb von Introns und der meisten intergenen DNA, [16] während 20% eines typischen prokaryontischen Genoms nicht kodieren. [3]

Bei Eukaryoten korreliert die Genomgröße und damit auch die Menge an nicht-kodierender DNA nicht mit der Komplexität des Organismus, eine Beobachtung, die als C-Wert-Rätsel bekannt ist. [17] Zum Beispiel das Genom des einzelligen Polychaos dubium (früher bekannt als Amöbe Dubai) enthält Berichten zufolge mehr als die 200-fache Menge an DNA beim Menschen. [18] Der Kugelfisch Takifugu rubripes Genom ist nur etwa ein Achtel so groß wie das menschliche Genom, scheint aber eine vergleichbare Anzahl von Genen zu haben, etwa 90 % der Takifugu Genom ist nicht-kodierende DNA. [16] Daher ist der größte Unterschied in der Genomgröße nicht auf eine Variation der Menge an kodierender DNA zurückzuführen, sondern auf einen Unterschied in der Menge an nicht-kodierender DNA. [19]

2013 wurde ein neuer „Rekord“ für das effizienteste eukaryotische Genom entdeckt mit Utricularia gibba, eine Wasserschlauchpflanze, die nur 3% nicht-kodierende DNA und 97% kodierende DNA enthält. Teile der nicht-kodierenden DNA wurden von der Pflanze deletiert, und dies deutete darauf hin, dass nicht-kodierende DNA für Pflanzen möglicherweise nicht so kritisch ist, obwohl nicht-kodierende DNA für den Menschen nützlich ist. [15] Andere Studien an Pflanzen haben entscheidende Funktionen in Teilen der nicht-kodierenden DNA entdeckt, die zuvor als vernachlässigbar galten, und haben dem Verständnis der Genregulation eine neue Ebene hinzugefügt. [20]

Cis- und trans-regulatorische Elemente Bearbeiten

Cis-regulatorische Elemente sind Sequenzen, die die Transkription eines nahegelegenen Gens steuern. Viele dieser Elemente sind an der Evolution und Kontrolle der Entwicklung beteiligt. [21] Cis-Elemente können in 5'- oder 3'-untranslatierten Regionen oder innerhalb von Introns lokalisiert sein. Transregulatorische Elemente kontrollieren die Transkription eines entfernten Gens.

Promotoren erleichtern die Transkription eines bestimmten Gens und befinden sich typischerweise stromaufwärts der kodierenden Region. Enhancer-Sequenzen können auch sehr weit entfernte Wirkungen auf die Transkriptionsniveaus von Genen ausüben. [22]

Introns Bearbeiten

Introns sind nicht-kodierende Abschnitte eines Gens, die in die Vorläufer-mRNA-Sequenz transkribiert, aber letztendlich durch RNA-Spleißen während der Verarbeitung zu reifen Boten-RNA entfernt werden. Viele Introns scheinen mobile genetische Elemente zu sein. [23]

Studien zu Introns der Gruppe I aus Tetrahymena Protozoen weisen darauf hin, dass einige Introns egoistische genetische Elemente zu sein scheinen, neutral für den Wirt, da sie sich während der RNA-Prozessierung von flankierenden Exons entfernen und keinen Expressionsbias zwischen Allelen mit und ohne Intron erzeugen. [23] Einige Introns scheinen eine signifikante biologische Funktion zu haben, möglicherweise durch Ribozym-Funktionalität, die die tRNA- und rRNA-Aktivität sowie die Protein-kodierende Genexpression regulieren kann, was bei Wirten offensichtlich ist, die über lange Zeiträume von solchen Introns abhängig geworden sind, z. das trnL-Intron kommt in allen grünen Pflanzen vor und scheint seit mehreren Milliarden Jahren vertikal vererbt worden zu sein, darunter mehr als eine Milliarde Jahre in Chloroplasten und weitere 2–3 Milliarden Jahre zuvor in den cyanobakteriellen Vorfahren der Chloroplasten. [23]

Pseudogene Bearbeiten

Pseudogene sind DNA-Sequenzen, die mit bekannten Genen verwandt sind, die ihre Fähigkeit zur Proteincodierung verloren haben oder auf andere Weise in der Zelle nicht mehr exprimiert werden. Pseudogene entstehen durch Retrotransposition oder genomische Duplikation von funktionellen Genen und werden zu "genomischen Fossilien", die aufgrund von Mutationen, die die Transkription des Gens verhindern, z vorzeitige Stoppcodons oder Frameshifts. [24] Pseudogene, die aus der Retrotransposition eines RNA-Zwischenprodukts resultieren, werden als prozessierte Pseudogene bezeichnet, Pseudogene, die aus den genomischen Überresten duplizierter Gene entstehen, oder Reste inaktivierter Gene sind nicht prozessierte Pseudogene. [24] Transpositionen von einst funktionsfähigen mitochondrialen Genen aus dem Zytoplasma in den Zellkern, auch als NUMTs bekannt, gelten ebenfalls als eine Art häufiger Pseudogene. [25] Numts kommen in vielen eukaryotischen Taxa vor.

Während das Dollosche Gesetz nahelegt, dass der Funktionsverlust bei Pseudogenen wahrscheinlich dauerhaft ist, können stillgelegte Gene tatsächlich mehrere Millionen Jahre lang ihre Funktion behalten und in proteinkodierende Sequenzen "reaktiviert" werden [26] und eine beträchtliche Anzahl von Pseudogenen wird aktiv transkribiert. [24] [27] Da angenommen wird, dass sich Pseudogene ohne evolutionäre Zwänge verändern, können sie als nützliches Modell für die Art und Häufigkeit verschiedener spontaner genetischer Mutationen dienen. [28]

Wiederholen Sie Sequenzen, Transposons und virale Elemente Bearbeiten

Transposons und Retrotransposons sind mobile genetische Elemente. Wiederholte Retrotransposon-Sequenzen, die Long Interspersed Nuclear Elements (LINEs) und Short Interspersed Nuclear Elements (SINEs) umfassen, machen bei vielen Arten einen großen Anteil der genomischen Sequenzen aus. Alu-Sequenzen, die als kurzes eingestreutes Kernelement klassifiziert werden, sind die am häufigsten vorkommenden mobilen Elemente im menschlichen Genom. Es wurden einige Beispiele dafür gefunden, dass SINEs die Transkriptionskontrolle einiger Protein-kodierender Gene ausüben. [29] [30] [31]

Endogene Retrovirussequenzen sind das Produkt der reversen Transkription von Retrovirusgenomen in die Genome von Keimzellen. Mutationen innerhalb dieser retro-transkribierten Sequenzen können das virale Genom inaktivieren. [32]

Über 8% des menschlichen Genoms bestehen aus (meist zerfallenen) endogenen Retrovirussequenzen, als Teil der über 42%igen Fraktion, die erkennbar von Retrotransposons abgeleitet ist, während weitere 3% als Überreste von DNA-Transposons identifiziert werden können. Es wird erwartet, dass ein Großteil der verbleibenden Hälfte des Genoms, die derzeit ohne erklärten Ursprung ist, ihren Ursprung in transponierbaren Elementen gefunden hat, die vor so langer Zeit (> 200 Millionen Jahren) aktiv waren, dass zufällige Mutationen sie unkenntlich gemacht haben. [33] Die Variation der Genomgröße in mindestens zwei Pflanzenarten ist hauptsächlich das Ergebnis von Retrotransposon-Sequenzen. [34] [35]

Telomere Bearbeiten

Telomere sind Regionen repetitiver DNA am Ende eines Chromosoms, die während der DNA-Replikation Schutz vor chromosomaler Verschlechterung bieten. Jüngste Studien haben gezeigt, dass Telomere ihre eigene Stabilität unterstützen. Telomere Repeat-enthaltende RNA (TERRA) sind Transkripte, die von Telomeren abgeleitet sind. Es wurde gezeigt, dass TERRA die Telomerase-Aktivität aufrechterhält und die Enden der Chromosomen verlängert. [36]

Der Begriff „Junk-DNA“ wurde in den 1960er Jahren populär. [37] [38] Laut T. Ryan Gregory wurde die Natur der Junk-DNA erstmals 1972 von einem Genombiologen, David Comings, explizit diskutiert, der den Begriff auf alle nicht-kodierenden DNAs anwandte. [39] Der Begriff wurde im selben Jahr von Susumu Ohno [19] formalisiert, der feststellte, dass die Mutationslast durch schädliche Mutationen eine Obergrenze für die Anzahl der funktionellen Loci darstellt, die bei einer typischen Mutationsrate erwartet werden kann. Ohno stellte die Hypothese auf, dass Säugetiergenome nicht mehr als 30.000 selektierte Loci haben könnten, bevor die "Kosten" der Mutationslast einen unvermeidlichen Rückgang der Fitness und schließlich das Aussterben verursachen würden. Diese Vorhersage bleibt robust, da das menschliche Genom ungefähr 20.000 (proteinkodierende) Gene enthält. Eine weitere Quelle für Ohnos Theorie war die Beobachtung, dass selbst eng verwandte Arten sehr unterschiedliche Genomgrößen (Größenordnungen) haben können, was 1971 als C-Wert-Paradox bezeichnet wurde. [6]

Der Begriff "Junk-DNA" wurde mit der Begründung in Frage gestellt, dass er eine starke a priori Annahme einer völligen Nichtfunktionalität und einige haben empfohlen, stattdessen eine neutralere Terminologie wie "nicht kodierende DNA" zu verwenden. [39] Dennoch bleibt „Junk-DNA“ eine Markierung für die Teile einer Genomsequenz, für die keine erkennbare Funktion identifiziert wurde und die durch vergleichende Genomanalysen ohne funktionelle Einschränkungen erscheinen, was darauf hindeutet, dass die Sequenz selbst keinen adaptiven Vorteil bietet.

Seit den späten 70er Jahren hat sich herausgestellt, dass die Mehrheit der nicht-kodierenden DNA in großen Genomen ihren Ursprung in der eigennützigen Amplifikation transponierbarer Elemente findet, über die W. Ford Doolittle und Carmen Sapienza 1980 in der Zeitschrift schrieben Natur: "Wenn gezeigt werden kann, dass eine bestimmte DNA oder Klasse von DNAs mit unbewiesener phänotypischer Funktion eine Strategie (wie Transposition) entwickelt hat, die ihr genomisches Überleben sichert, dann ist keine andere Erklärung für ihre Existenz notwendig." [40] Es ist zu erwarten, dass die Menge an Junk-DNA von der Amplifikationsrate dieser Elemente und der Rate, mit der nicht-funktionelle DNA verloren geht, abhängt. [41] In derselben Ausgabe von Natur, Leslie Orgel und Francis Crick schrieben, dass Junk-DNA "wenig Spezifität hat und dem Organismus wenig oder keinen selektiven Vorteil vermittelt". [42] Der Begriff kommt hauptsächlich in der Populärwissenschaft und umgangssprachlich in wissenschaftlichen Publikationen vor, und es wurde vermutet, dass seine Konnotationen das Interesse an den biologischen Funktionen nicht-kodierender DNA verzögert haben könnten. [43]

Einige Hinweise deuten darauf hin, dass einige "Junk-DNA"-Sequenzen Quellen für (zukünftige) funktionelle Aktivität in der Evolution durch Exaptation ursprünglich egoistischer oder nicht-funktionaler DNA sind. [44]

ENCODE Projekt bearbeiten

Im Jahr 2012 berichtete das ENCODE-Projekt, ein vom National Human Genome Research Institute unterstütztes Forschungsprogramm, dass 76 % der nicht-kodierenden DNA-Sequenzen des menschlichen Genoms transkribiert wurden und dass fast die Hälfte des Genoms in irgendeiner Weise für genetisch regulierende Proteine ​​zugänglich war wie Transkriptionsfaktoren. [1] Der Vorschlag von ENCODE, dass über 80 % des menschlichen Genoms biochemisch funktionsfähig sind, wurde jedoch von anderen Wissenschaftlern kritisiert, [5] die argumentieren, dass weder die Zugänglichkeit von Abschnitten des Genoms für Transkriptionsfaktoren noch deren Transkription garantieren, dass diese Abschnitte biochemische Funktion haben und ihre Transkription selektiv vorteilhaft ist. Schließlich können nicht funktionelle Abschnitte des Genoms transkribiert werden, da Transkriptionsfaktoren typischerweise an kurze Sequenzen binden, die (zufällig) im gesamten Genom gefunden werden. [45]

Darüber hinaus basierten die viel niedrigeren Schätzungen der Funktionalität vor ENCODE auf genomische Erhaltung Schätzungen über Säugetierlinien hinweg. [6] [7] [8] [9] Die weit verbreitete Transkription und das Spleißen im menschlichen Genom wurden neben der genomischen Konservierung, die schlecht konservierte funktionelle Sequenzen übersehen kann, als ein weiterer Indikator für die genetische Funktion diskutiert. [11] Darüber hinaus ist ein Großteil der scheinbaren Junk-DNA an der epigenetischen Regulation beteiligt und scheint für die Entwicklung komplexer Organismen notwendig zu sein. [4] [13] [14] Genetische Ansätze können funktionelle Elemente übersehen, die sich nicht physisch im Organismus manifestieren, evolutionäre Ansätze Schwierigkeiten haben, genaue Sequenz-Alignments für mehrere Arten zu verwenden, da die Genome selbst eng verwandter Arten erheblich variieren und mit biochemische Ansätze, obwohl sie eine hohe Reproduzierbarkeit aufweisen, bedeuten die biochemischen Signaturen nicht immer automatisch eine Funktion. [11] Kellis et al. stellten fest, dass 70% der Transkriptionsabdeckung weniger als 1 Transkript pro Zelle betrug (und somit auf einer falschen Hintergrundtranskription basieren kann). Auf der anderen Seite argumentierten sie, dass 12-15% der menschlichen DNA unter funktionellen Einschränkungen stehen könnten und immer noch eine Unterschätzung sein könnten, wenn linienspezifische Einschränkungen berücksichtigt werden. Letztendlich können genetische, evolutionäre und biochemische Ansätze alle auf komplementäre Weise verwendet werden, um Regionen zu identifizieren, die in der menschlichen Biologie und bei Krankheiten funktionsfähig sein könnten. [11] Einige Kritiker haben argumentiert, dass die Funktionalität nur in Bezug auf eine geeignete Nullhypothese bewertet werden kann. In diesem Fall wäre die Nullhypothese, dass diese Teile des Genoms nicht funktionsfähig sind und Eigenschaften haben, sei es aufgrund von Konservierung oder biochemischer Aktivität, die nach unserem allgemeinen Verständnis der molekularen Evolution von solchen Regionen erwartet würden und Biochemie. Diesen Kritikern zufolge sollte eine fragliche Region, bis gezeigt wurde, dass sie zusätzliche Merkmale aufweist, die über die Erwartungen der Nullhypothese hinausgehen, vorläufig als nicht funktional gekennzeichnet werden. [46]

Einige nicht-kodierende DNA-Sequenzen müssen eine wichtige biologische Funktion haben. Dies wird durch vergleichende Genomikstudien belegt, die hoch konservierte Regionen nicht-kodierender DNA berichten, manchmal auf Zeitskalen von Hunderten von Millionen Jahren. Dies impliziert, dass diese nicht-kodierenden Regionen unter starkem evolutionärem Druck und positiver Selektion stehen. [47] Beispielsweise machen in den Genomen von Mensch und Maus, die vor 65–75 Millionen Jahren von einem gemeinsamen Vorfahren abwichen, proteinkodierende DNA-Sequenzen nur etwa 20 % der konservierten DNA aus, die restlichen 80 % der konservierten DNA in nicht kodierenden Regionen vertreten. [48] ​​Die Kopplungskartierung identifiziert häufig chromosomale Regionen, die mit einer Krankheit assoziiert sind, ohne Hinweise auf funktionelle kodierende Varianten von Genen innerhalb der Region, was darauf hindeutet, dass krankheitsverursachende genetische Varianten in der nicht-kodierenden DNA liegen. [48] ​​Die Bedeutung von nicht-kodierenden DNA-Mutationen bei Krebs wurde im April 2013 untersucht. [49]

Nicht-kodierende genetische Polymorphismen spielen eine Rolle bei der Anfälligkeit für Infektionskrankheiten wie Hepatitis C. [50] Darüber hinaus tragen nicht-kodierende genetische Polymorphismen zur Anfälligkeit für das Ewing-Sarkom, einen aggressiven pädiatrischen Knochenkrebs, bei. [51]

Einige spezifische Sequenzen nicht-kodierender DNA können Merkmale sein, die für die Chromosomenstruktur, die Zentromerfunktion und die Erkennung homologer Chromosomen während der Meiose wesentlich sind. [52]

Laut einer vergleichenden Studie von über 300 prokaryotischen und über 30 eukaryotischen Genomen [53] scheinen Eukaryoten eine minimale Menge an nicht-kodierender DNA zu benötigen. Die Menge kann mithilfe eines Wachstumsmodells für regulatorische genetische Netzwerke vorhergesagt werden, was bedeutet, dass sie für regulatorische Zwecke erforderlich ist. Beim Menschen beträgt das vorhergesagte Minimum etwa 5 % des Gesamtgenoms.

Über 10 % von 32 Säugetiergenomen können durch die Bildung spezifischer RNA-Sekundärstrukturen funktionieren. [54] Die Studie verwendete vergleichende Genomik, um kompensatorische DNA-Mutationen zu identifizieren, die RNA-Basenpaarungen aufrechterhalten, ein charakteristisches Merkmal von RNA-Molekülen. Über 80% der genomischen Regionen, die evolutionäre Beweise für die Konservierung der RNA-Struktur aufweisen, weisen keine starke Konservierung der DNA-Sequenz auf.

Nicht-kodierende DNA kann möglicherweise dazu dienen, die Wahrscheinlichkeit einer Genunterbrechung während des chromosomalen Crossovers zu verringern. [55]

Beweise aus Polygenic Scores und GWAS Edit

Genomweite Assoziationsstudien (GWAS) und maschinelle Lernanalysen großer genomischer Datensätze haben zur Konstruktion polygener Prädiktoren für menschliche Merkmale wie Größe, Knochendichte und viele Krankheitsrisiken geführt. Ähnliche Prädiktoren existieren für Pflanzen- und Tierarten und werden in der landwirtschaftlichen Züchtung verwendet. [57] Die detaillierte genetische Architektur menschlicher Prädiktoren wurde analysiert, und signifikante Effekte, die bei der Vorhersage verwendet wurden, sind mit DNA-Regionen weit außerhalb der kodierenden Regionen assoziiert. Der Anteil der Varianz, der in kodierenden gegenüber nicht kodierenden Regionen berücksichtigt wird (d. h. Bruchteil der vom Prädiktor erfassten Vorhersagekraft), variiert stark für verschiedene komplexe Merkmale. Vorhofflimmern und das Risiko für koronare Herzkrankheiten werden beispielsweise meist durch Varianten in nicht kodierenden Regionen kontrolliert (nicht kodierende Varianzanteil über 70 Prozent), während Diabetes und hohe Cholesterinwerte das gegenteilige Muster aufweisen (nicht kodierende Varianz etwa 20-30 Prozent) ). [56] Individuelle Unterschiede zwischen Menschen werden eindeutig in signifikanter Weise durch nicht-kodierende genetische Loci beeinflusst, was ein starker Beweis für funktionelle Effekte ist. Ganze Exom-Genotypen (d. h. die nur auf kodierende Regionen beschränkte Informationen enthalten) enthalten nicht genügend Informationen, um polygene Prädiktoren für viele gut untersuchte komplexe Merkmale und Krankheitsrisiken zu erstellen oder sogar zu bewerten.

Im Jahr 2013 wurde geschätzt, dass im Allgemeinen bis zu 85 % der GWAS-Loci nicht-kodierende Varianten als wahrscheinlichen kausalen Zusammenhang aufweisen. Die Varianten sind in Populationen häufig verbreitet und es wurde vorhergesagt, dass sie das Krankheitsrisiko durch kleine phänotypische Effekte beeinflussen, im Gegensatz zu den großen Effekten der mendelschen Varianten. [58]

Einige nicht-kodierende DNA-Sequenzen bestimmen die Expressionsniveaus verschiedener Gene, sowohl derjenigen, die in Proteine ​​transkribiert werden, als auch derjenigen, die selbst an der Genregulation beteiligt sind. [59] [60] [61]

Transkriptionsfaktoren Bearbeiten

Einige nicht-kodierende DNA-Sequenzen bestimmen, wo Transkriptionsfaktoren anlagern. [59] Ein Transkriptionsfaktor ist ein Protein, das an spezifische nicht-kodierende DNA-Sequenzen bindet und dadurch den Fluss (oder die Transkription) genetischer Information von DNA zu mRNA steuert. [62] [63]

Operatoren Bearbeiten

Ein Operator ist ein DNA-Segment, an das ein Repressor bindet. Ein Repressor ist ein DNA-bindendes Protein, das die Expression eines oder mehrerer Gene reguliert, indem es an den Operator bindet und die Anheftung der RNA-Polymerase an den Promotor blockiert, wodurch die Transkription der Gene verhindert wird. Diese Blockierung des Ausdrucks wird Repression genannt. [64]

Verstärker Bearbeiten

Ein Enhancer ist eine kurze DNA-Region, die an Proteine ​​(trans-wirkende Faktoren) gebunden werden kann, ähnlich wie eine Reihe von Transkriptionsfaktoren, um die Transkriptionsniveaus von Genen in einem Gencluster zu erhöhen. [65]

Schalldämpfer Bearbeiten

Ein Silencer ist eine DNA-Region, die die Genexpression inaktiviert, wenn sie von einem regulatorischen Protein gebunden wird. Es funktioniert sehr ähnlich wie Enhancer, unterscheidet sich nur in der Inaktivierung von Genen. [66]

Promoter Bearbeiten

Ein Promotor ist eine DNA-Region, die die Transkription eines bestimmten Gens erleichtert, wenn ein Transkriptionsfaktor daran bindet. Promotoren befinden sich typischerweise in der Nähe der Gene, die sie regulieren, und stromaufwärts von ihnen. [67]

Isolatoren Bearbeiten

Ein genetischer Isolator ist ein Grenzelement, das zwei verschiedene Rollen bei der Genexpression spielt, entweder als Enhancer-Blockierungscode oder selten als Barriere gegen kondensiertes Chromatin. An insulator in a DNA sequence is comparable to a linguistic word divider such as a comma in a sentence, because the insulator indicates where an enhanced or repressed sequence ends. [68]

Evolution Bearbeiten

Shared sequences of apparently non-functional DNA are a major line of evidence of common descent. [69]

Pseudogene sequences appear to accumulate mutations more rapidly than coding sequences due to a loss of selective pressure. [28] This allows for the creation of mutant alleles that incorporate new functions that may be favored by natural selection thus, pseudogenes can serve as raw material for evolution and can be considered "protogenes". [70]

A study published in 2019 shows that new genes (termed de novo gene birth) can be fashioned from non-coding regions. [71] Some studies suggest at least one-tenth of genes could be made in this way. [71]

Long range correlations Edit

A statistical distinction between coding and non-coding DNA sequences has been found. It has been observed that nucleotides in non-coding DNA sequences display long range power law correlations while coding sequences do not. [72] [73] [74]

Forensic anthropology Edit

Police sometimes gather DNA as evidence for purposes of forensic identification. As described in Maryland v. King, a 2013 U.S. Supreme Court decision: [75]

The current standard for forensic DNA testing relies on an analysis of the chromosomes located within the nucleus of all human cells. 'The DNA material in chromosomes is composed of "coding" and "non-coding" regions. The coding regions are known as genes and contain the information necessary for a cell to make proteins. . . . Non-protein coding regions . . . are not related directly to making proteins, [and] have been referred to as "junk" DNA.' The adjective "junk" may mislead the lay person, for in fact this is the DNA region used with near certainty to identify a person. [75]


More Clues that Intergenic DNA Is Functional

You&rsquore an enzyme of RNA polymerase floating in the nucleus of a cell. Your job is to transcribe a gene, but you are blind and it&rsquos dark. Other machines guide you to a promoter, where your work begins, but how do you know which direction to read?

Two recent papers add more insight to the wondrous design of DNA transcription. Both papers recognize that protein-coding genes represent only a tiny part, about 3%, of the DNA in a cell. The looming question that the ENCODE project began to answer last year is, how much of that intergenic DNA is functional? Since most of it is transcribed (a process that requires the expenditure of energy), the cell presumably performs all that work for a reason.

The first paper, published in Natur, examined how RNA polymerase (RNAP) knows which way to begin transcription. Gene starts are designated by &ldquopromoter&rdquo regions, but from that point, RNAP can read either direction on either fork, once the double helix is unwound. The authors found that two DNA segments, working against each other, regulate the reading of genes and non-genes.

One, named PAS, controls whether a polyadenylation tail (a series of adenines, or &ldquoA&rdquo letters in the code), is added to the growing messenger RNA (mRNA). For genes, that tail prepares the mRNA for export from the nucleus. For intergenic transcripts, though, polyadenylation signals other enzymes to cleave it into small transcripts.

The other sequence, named U1 snRNP, controls whether the mRNA is cleaved after transcription by suppressing polyadenylation. When present, it allows RNAP to proceed uninterrupted.

Gene regions are rich in U1 snRNP but low in PAS. The reverse is true for intergenic regions. The authors believe this is how RNAP avoids excessive transcribing of non-coding DNA. The shortened, cleaved transcripts, like lincRNAs, stay in the nucleus to perform other functions. A report from MIT explains how these sequences offset each other:

The work demonstrates the important role of U1 snRNP in protecting mRNA as it is transcribed from genes and in preventing the cell from unnecessary copying of non-protein-coding DNA, says Gideon Dreyfuss, a professor of biochemistry and biophysics at the University of Pennsylvania School of Medicine.

&ldquoThey&rsquove identified a very likely mechanism for early termination of these upstream RNAs by depriving them of U1 snRNP suppression of polyadenylation and cleavage,&rdquo says Dreyfuss, who was not part of the research team.

The authors of the Natur paper, though, remained undecided about the roles of these upstream, intergenic transcripts:

Die Funktion of all of this upstream noncoding RNA is still a subject of much investigation. &ldquoThat transcriptional process could produce an RNA that has some function, or it could be a product of the nature of the biochemical reaction. This will be debated for a long time,&rdquo Sharp says.

His lab is now exploring the relationship between this transcription process and the observation of large numbers of so-called long noncoding RNAs (lncRNAs). He plans to investigate the mechanisms that control the synthesis of such RNAs and try to determine their functions. (Emphasis added.)

In their paper, the authors toss in a Darwinian speculation. They proposed that upstream antisense RNAs (uaRNA), or RNAs transcribed in the &ldquowrong&rdquo direction, might represent ancestors of protein-coding genes, and that lncRNAs are intermediate forms that gained or lost U1 snRNP and polyadenylation sequences. They found some differences in U1 snRNP counts between orthologous regions in human and mouse genomes as support for the idea.

This hypothesis, though, seems absurd for several reasons. For one, how or why would a non-functional transcript acquire a function? Before it had a function, why would it be transcribed and conserved? Natural selection cannot act to &ldquostore up&rdquo variations in hopes of finding a future function. Functional protein sequences, as William Dembski and Robert Marks have shown, represent a tiny fraction of sequence space. Imagining that a blind, unguided process would find one of them seems optimistic to the point of being ridiculous. The authors did not pursue their wishful thinking in detail, but rather dropped the subject after a brief mention, focusing primarily on the &ldquoU1-PAS axis&rdquo as having &ldquowide use as a general mechanism zu regulate transcription elongation in mammals.&rdquo Regulation durch eine mechanism is the language of design.

A second paper, in PLoS-Genetik, is more confident that the intergenic transcripts are functional. Confirming what ENCODE found last year (that at least 85% of intergenic regions are transcribed and regulated), these authors believe functions are soon to be discovered in the forest of intergenic DNA. The Abstract says:

Known protein coding gene exons compose less than 3% of the human genome. Die remaining 97% is largely uncharted territory, with only a small fraction characterized. The recent observation of transcription in this intergenic territory has stimulated debate about the extent of intergenic transcription and whether these intergenic RNAs are functional. Hier wir directly observed with a large set of RNA-seq data covering a wide array of human tissue types that the majority of the genome is indeed transcribed, corroborating recent observations by the ENCODE project. Furthermore, using de novo transcriptome assembly of this RNA-seq data, we found that intergenic regions encode far more long intergenic noncoding RNAs (lincRNAs) than previously described, helping to resolve the discrepancy between the vast amount of observed intergenic transcription and the limited number of previously known lincRNAs. In total, we identified tens of thousands of putative lincRNAs expressed at a minimum of one copy per cell, significantly expanding upon prior lincRNA annotation sets. These lincRNAs are specifically regulated and conserved rather than being the product of transcriptional noise. In addition, lincRNAs are strongly enriched for trait-associated SNPs suggesting a new mechanism by which intergenic trait-associated regions may function. These findings will enable the discovery and interrogation of novel intergenic functional elements.

The clear implication is that lincRNAs are functional, else why would the cell regulate them and ensure their conservation? The authors&rsquo optimism continues in their Introduction:

A large fraction of the human genome consists of intergenic sequence. Once referred to as &ldquojunk DNA&rdquo, it is now clear that functional elements exist in intergenic regions. In fact, genome wide association studies have revealed that approximately half of all disease and trait-associated genomic regions are intergenic. While some of these regions may Funktion solely as DNA elements, it is now known that intergenic regions can be transcribed, und ein growing list of functional noncoding RNA genes within intergenic regions has emerged.

What do we know about lincRNA functions at this time?

Long intergenic noncoding RNAs (lincRNAs) are defined as intergenic (relative to current gene annotations) transcripts longer than 200 nucleotides in length that lack protein coding capacity. LincRNAs are known to perform myriad functions through diverse mechanisms ranging from the regulation of epigenetic modifications and gene expression to acting as scaffolds zum protein signaling Komplexe.

Since these authors found significantly more lincRNAs in their survey than previously known, the implication is that more of those &ldquomyriad functions&rdquo are waiting to be found. (For more functions already discovered, see the lncRNA blog.) Here&rsquos their concluding statement:

Owing to the extended breadth of tissues sampled and relaxed constraints on transcript structure, we find significantly more lincRNAs than all previous lincRNA annotation sets combined. Our analyses revealed that these lincRNAs display many features consistent with functionality, contrasting prior claims that intergenic transcription is primarily the product of transcriptional noise. In sum, our findings corroborate recent reports of pervasive transcription across the human genome and demonstrate that intergenic transcription results in the production of a large number of previously unknown lincRNAs. We provide this vastly expanded lincRNA annotation set as an important resource for the study of intergenic functional elements in human health and disease.

It&rsquos clear that the search for function is driving this cutting-edge research. Search for function is exactly what intelligent-design science would recommend. Darwinians describe natural selection as a tinkerer, generating useless parts as well as structures cobbled together that might do something by chance, since there is no supervising designer to guide the process in a particular way. By contrast, intelligent design expects that what exists, as the product of mind, is there for a reason.

Remember how Darwinists call ID a &ldquoscience stopper,&rdquo since it supposedly counsels just giving up and saying, &ldquoGod did it&rdquo? The real science stopper is Darwinism. It focused only on protein-coding genes and dismissed everything else as &ldquotranscriptional noise&rdquo or &ldquojunk DNA&rdquo left behind by the blind tinkerer. Why waste time studying junk? Were it not for that attitude, our understanding of intergenic DNA function might have been much farther along by now.


Abstrakt

Long intergenic non-coding RNA (lincRNA) genes have diverse features that distinguish them from mRNA-encoding genes and exercise functions such as remodelling chromatin and genome architecture, RNA stabilization and transcription regulation, including enhancer-associated activity. Some genes currently annotated as encoding lincRNAs include small open reading frames (smORFs) and encode functional peptides and thus may be more properly classified as coding RNAs. lincRNAs may broadly serve to fine-tune the expression of neighbouring genes with remarkable tissue specificity through a diversity of mechanisms, highlighting our rapidly evolving understanding of the non-coding genome.


Which are found in non coding sections of DNA?

Nicht-coding DNA sequences are Komponenten of an organism's DNA that do not encode protein sequences. Etwas nicht-coding DNA is transcribed into functional nicht-Codierung RNA molecules (e.g. transfer RNA, ribosomal RNA, and regulatory RNAs).

One may also ask, what are the coding regions of DNA called? Coding DNA sequences are separated by long regions of DNA called introns that have no apparent function. Coding DNA ist auch bekannt als an exon.

Likewise, people ask, why do you have non coding areas of DNA?

Some introns kann regulate transfer RNA and ribosomal RNA activity and protein-coding gene Ausdruck. A very important nicht-Codierung eine Reihe von DNA is called a telomere, which ist ein Region of repetitive DNA at the end of a chromosome and protects coding DNA from being lost during cell division.


Genomic Variation between Organisms

The amount of total genomic DNA varies widely between organisms, and the proportion of coding and noncoding DNA within these genomes varies greatly as well. More than 98% of the human genome does not encode protein sequences, including most sequences within introns and most intergenic DNA. While overall genome size, and by extension the amount of noncoding DNA, are correlated to organism complexity, there are many exceptions. For example, the genome of the unicellular Polychaos dubium (formerly known as Amoeba dubia) has been reported to contain more than 200 times the amount of DNA in humans. The pufferfish Takifugu rubripes genome is only about one eighth the size of the human genome, yet seems to have a comparable number of genes approximately 90% of the Takifugu genome is noncoding DNA.

In 2013, a new &ldquorecord&rdquo for most efficient genome was discovered. Utricularia gibba, a bladderwort plant, has only 3% noncoding DNA. The extensive variation in nuclear genome size among eukaryotic species is known as the C-value enigma or C-value paradox. Most of the genome size difference appears to lie in the noncoding DNA. About 80 percent of the nucleotide bases in the human genome may be transcribed, but transcription does not necessarily imply function.

Abbildung (PageIndex<1>): Utricularia gibba flower: Utricularia gibba has 3% noncoding DNA, which is low for flowering plants. This 3% has given this plant the title the &lsquomost efficient&rsquo genome.