Leta i den här bloggen


söndag 23 januari 2011

Yleistietoa globaalista genomista ja RNA:n sievistyksestä

GLOBAL GENOME, perimäaines , käsittää kahden luokan geenejä:

  • proteiinia koodaavia geenejä ( protein coding genes) ja
  • sellaisia transkriptejä, jotka eivät koodaa proteiinia ( non-coding RNA, ncRNA)
Kaikista geenisekvensseistä on alle 1.5% tällaisia proteiinia koodaavia geenejä.
Suurin osa ihmisen genomin transkripteistä on koodaamatonta ncRNA.

Geeniennuste, geeniprediction

Tyypillinen eukaryoottinen proteiinia koodaava geeni omaa sääteleviä kohtia (regulatory regions) , jotka määräävät, mitkä osat DNA:ta tulee transkriptoitaviksi ( transcripted), spliceosomikäsittelyyn jossa irrotetaan introni ( spliced) tai translatoiduksi( translated) käännetyksi proteiinimuotoon.

Näillä säätelyalueilla tapaa olla consensusjaksoja, joita on hyvä käyttää sellaisia tutkimusmenetelmissä, missä identifioidaan tietokoneen avulla geeniä( Gen Scan).
  • Koodamattomat RNA geenit (ncRNA) ovat primäärisiltä jaksoilta vähemmän konservoituja. Niissä ei ole statistista signaalia, mikä liittyy proteiinigeeneihin liittyvään koodaavaan alueeseen kuten esim pilkkoutumissignaalia tai nukleotidirakenteen biasta.
  • Niinpä ncRNA ennuste on paljon vaikeampi kuin proteiiniennuste.
Kuitenkin on suhteellisen yleistä havaita esimerkkejä, joissa homologiset ncRN:ta ovat pitämässä yllä consensus-sekundäärirakennetta kompensatoristen emäsmutaatioitten avulla.
On kuitenkin niin, että ncRNA geenit esiintyvät enemmässä kuin yhdessä aromissaan, mikä tekee vaikeaksi yhden ja ainoan metodin käytön ncRNA rakenteitten genominlaajaksi luotettavaksi identifioimiseksi.
  • Esimerkkejä proteiinin ja ncRNA geenin identifioimisesta.
  • PROTEIN
GenScan (non-homologinen metodi)
Sekvenssien samankaltaisuuden perustuvat homologiset metodit (BLAST, FASTA)
Profiiliin perustuvat (HMMER, PSI BLAST)

  • RNA
EvoFold, sequence evolution (phylo-SCFG)
QRNA
RNAZ
Sekvenssien samankaltaisuuteen perustuvat (BLAST, FASTA)
pattern/motif (RNABOB)
stochastic context free grammars (CMSEARCA)
custom designed (miR seeker, SRPscan, fRNAscan)

Algoritmi, jotka kohdistuvat erityiseen RNA-luokkaan homologioitten etsinnässä, kuten miR etsijä mikroRNA: ta varten, tRNA-scan-SE tRNA:ta varten, snoSCAN boxC/Dsnor NAS varten ja SPRscan SPRRNA:ta varten.

ESIMERKKEJÄ eräistä koodaamattomista RNA rakenteista ja niitten funktioista
  • PROSESSI, ncRNA ja FUNKTIO
Taulukko: ncRNA geenit kuten tästä näkyy omaavat useita erilaisia aromejaan;
  • Genominen stabiilisuus,
telomeraasi RNA , telomeerisynteesi
  • RNA prosessointi ja modifikaatio
snRNA, splicing, yhteen punoutumisia ja muita funktioita
U7 snRNA, histoni pre-mRNA 3´prim päädyn muokkaus
RNaasi P, tRNA kypsyminen
RNaasiMRP , rRNA kypsyminen
SmYmRNA, trans-punoutumisia trans-splicing) ja intronin irrotuksia
snoRNA, RNA:n nukleotidin modifioiminen
gRNA, RNA:n nukleotidin modifioiminen
Y RNA, RNA prosessoiminen, DNA:n replikaatio
  • Geeniexpression säätely
miRNA, geenisäätö
piRNA, transposonipuolustus
siRNA, geenisäätö
tasiRNA, geenisäätö
rasiRNA, transposonipuolustus
  • Transkriptio
7SK RNA, negatiivisessa säädössä osuutta
6S RNA, bakteerin transkription säätäjä
  • Translaatio
rRNA, translaatio
tmRNA, rescue stalled ribosome
tRNA, translaatio
  • Proteiinin liikkumiset
SRP RNA, membraanin integroituminen

GEENIN EXPRESSIO ei ole aivan yhtä yksinkertainen asia kuin tämä selitys :DNA tekee RNA:n. RNA tekee proteiinin.
Asia on monimutkaisempaa:
RNA synteesi tapahtuu TRANSKRIPTIOLLA.
RNA prosessoituu: primääristä transkriptistä tulee kypsää funktionaalista RNA:ta. Se modifioidaan päädystään, yhteenliittymistä intronin irrottamiseksi ja pilkkoutumista tapahtuu, prosessoitumisia ja kemiallisia modifioimisia tapahtuu.

Proteiinien ja ncRNA:n evoluutio

Theses:
Evolution of proteins and non-coding RNAs genes studied with comparative genomics
Marcela Davila 18.1. 2011.
https://gupea.ub.gu.se/bitstream/2077/23816/2/gupea_2077_23816_2.pdf


Tämän väitöskirjan osia on V ja ne ovat seuraavat:

I inventory and analysis of the protein subunits of the ribonucleases P and MRP provides furthes evidence of homology between the yeast and human enzyme. Rosenblad M A, lopez M D, piccinelli P, Samuelsson T. Nucleic Acid Res 2006 34, 5145- 5156.

II Computational screen for spliceosomal RNA genes aids in defining the phylogenetic distribution of major and minor spliceosomal components.
Davila lopez M, Alm Rosenblad, M, and Samuelsson T. Nucleic Acids Res. 2008 36, 3001-3010.
  • Spliceosome
Each spliceosome is composed of five small nuclear RNA proteins, called snRNPs, (pronounced "snurps") and a range of non-snRNP associated protein factors.
The snRNPs that make up the nuclear spliceosome are named U1, U2, U4, U5, and U6, and participate in several RNA-RNA and RNA-protein interactions. The RNA component of the snRNP is rich in uridine (the nucleoside analog of the uracil nucleotide).

III Early evolution of histone mRNA 3´end processing. Davila Lopez M and Samuelsson T. RNA 2008 14, 1-10.

IV Analysis of gene order conservation in eukaryocytes identifies transciptionally and functionally linked genes. Davila Lopez M and Samuelsson T. PLoS One. 2010 5(5):e10654.

V eGOB: Eukaryotic Gene Order Browser. Davila Lopez, M and Samuelsson T.

ABSTRAKTIN SUOMENNOSTA:

Genomin analysoimisessa on eräs tärkeä vaihe proteiinin tunnistaminen ja koodaamattoman RNA:n tunnistaminen (ncRNA, non-coding RNA). Tässä väitöskirjassa kohdistetaan tutkimukset proteiinien ja ncRNA homologien tunnistamisiin ja analysoimisiin käyttämällä useita tietokoneellisia menetelmiä, jotta saataisiin johtopäätöksiä niiden rakenteista, toiminnasta, kehityksestä ja säätelystä.

Tämä väitöstyö käsittää kaksi osaa. Toisessa tehdään tietokoneellisia ennustuksia proteiini ja ncRNA homologeista lähtökohtana erilaiset RNPrakenteet eli ribonukleoproteiinikompleksit. Toisessa taas käsitellään ongelmia, jotka liittyvät eukaryoottien non-random geenijärjestykseen (eli sellaiseen geenijärjestykseen, mikä ei ole satunnainen).

  • Ensimmäisessä osassa tutkittiin sellaisia RNP komplekseja, joita ei ollut aiemmin tutkittu perusteellisesti, mitä tulee niiden fylogeneettiseen jakaantumiseen. Homologiaan perustuvia metodeja käytettiin täten analysoimaan RNP komplekseja seuraavista proteiineista: RNaasi P, RNaasi MRP sekä spliseosomi. Analysoitiin myös RNP ja RNA rakenteet, jotka osallistuivat 3´prim päädyn prosessoimiseen histonin mRNA:ssa.

Tutkijaryhmä identifioi suuren joukon aiemmin tunnistamattomia homologeja, mikä kohensi käsityksiä eri ribonukleoproteiinien (RNP) evoluutiosta. Esimerkiksi homologiset suhteet RNaasien P ja MRP proteiinien kesken identifioitiin, mikä antoi lisänäyttöä ihmisen ja hiivan RNP:n välisestä homologiasta.

Tutkijat esittävät näyttöä siitä, että histoni 3´prim päädyn prosessointikoneisto on ikivanhempi, mitä aiemmin on oletettukaan ja voidaan jäljittää taaksepäin eukaryoottisen fylogeneettisen puun juuriin. Tutkijat esittivät yksityiskohtaisen kartan spliseosomaalisten U12 tyyppisten RNAgeenien jakaantumisesta.

Nämä tiedot viittaavat pienten spliseosomien varhaiseen alkuperään ja monilukuisiin tapahtumiin, missä ne ovat kadonneet kehityksen aikana.
  • Työn toisessa osassa tutkijat kehittivät geenijärjestyskarttoja, jotka osoittivat sekä proteiini- että ncRNA geenien sijainnin suuressa määrässä eukaryoottisia organismia.Sitten identifioitiin non-random geenien järjestys, jotta tunnistettaisiin kaikkein tärkeimmät määräävättekijät geenijärjestyksen pysyväisyydessä. Yhtenä tärkeänä johtopäätöksenä oli, että evolutionaalisesti pysyväiset ( konservoidut) geeniparit, jotka transkriboidaan eri tavoilla, ovat paljon todennäköisemmin toiminnallisesti sukua kuin huonoa pysyväisyyttä omaavat geeniparit.
  • Sellaiset geeniparit ovat todennäköisesti sukua myös transkriptionaalisen kontrollin suhteen.
Näitten lisäksi tutkijat esittivät eukaryoottisen selaimen Gene Order Browser(eGOB) , jonka tähän projektiin kuuluvat tietueet ovat saatavilla ja jossa tutkijat voivat visualisoida ja vertailla eri organismeissa geenijärjestyksen evoluutiota.
Lisäksi selainta voi käyttää voi käyttää läheisten evolutionaalisti pysyvien ja transkriptionaalisesti linkkiytyneiden geeniparien identifioimiseen.
eGOB ion saatavilla osoitteessa http://egob.bioimedicine.gu.se