PLoS ONE: MGEx-Udb A Nisäkkäiden Kohtu Tietokanta Expression-pohjainen luettelointi geenien poikki ehtoja, kuten endometrioosi ja kohdunkaulan Cancer

tiivistelmä

Background

geeniekspressioprofilointi kohdun kudos on tehty eri yhteyksissä, mutta merkittävä määrä tietonsa pysyvät vajaakäytössä, koska se ei kuulu nykyisten yleisten resurssit.

Menetelmät /Principal havainnot

kuratoinut 2254 aineistoja 325 kohtuun liittyvä massa mittakaavassa geeniekspressiotutkimuksissa ihmisen, hiiren, rotan, lehmän ja sian lajeja. Sitten laskennallisesti johdettu ”luotettavuutta pisteet ’kunkin geenin ilmentymisen tila (puhtaaksi /lepotilassa), sillä kaikki mahdolliset olosuhteet ja paikoissa, jotka perustuvat laajuudesta hyväksyykö poikki aineistoja. Aineisto ja johdetut tiedot on koottu

M

ammalian

G

eeni

Ex

pression

U

terus

d

ata

b

ase

(MGEx-Udb, http : //resource.ibab.ac.in/MGEx-Udb/). Tietokanta on mahdollista tiedustella kanssa geenin nimet /tunnukset, sub-kudos paikoissa, sekä erilaiset olosuhteet, kuten kohdunkaulan syövän, kohdun limakalvon syklit ja häiriötiloja ja kokeellisia hoitoja. Vastaavasti tuotanto olisi) transkriptoidaan ja lepotilassa geenit listattu kysyi kunnon /sijainti, tai b) ilmaisun profiilia kiinnostavan geenin erilaisissa kohdun olosuhteissa. Tulokset myös luotettavuutta pisteet ilmaisun tilan kunkin geenin. MGEx-Udb myös tietoja, jotka liittyvät Gene ontologia merkintöjä, proteiini-proteiini-vuorovaikutuksia, selostukset, promoottorit, ja ilmaisun tilan muiden sekvensointitekniikoilla, ja helpottaa monentyyppisiä analyysin yksittäisten geenien tai koekspressoi geeniklustereista.

Johtopäätökset /merkitys

lyhyesti, MGEx-Udb mahdollistaa helpon luettelointia koekspressoi geenien ja helpottaa myös biomarkkerimenetelmin löytö eri kohdun olosuhteissa.

Citation: Bajpai AK, Davuluri S, Chandrashekar DS, Ilakya S, Dinakaran M, Acharya KK (2012) MGEx-Udb A Nisäkkäiden Kohtu Tietokanta Expression-pohjainen luettelointi geenien poikki ehtoja, kuten endometrioosi ja kohdunkaulansyöpä. PLoS ONE 7 (5): e36776. doi: 10,1371 /journal.pone.0036776

Editor: Zhanjiang Liu, Auburn University, Yhdysvallat

vastaanotettu: 10 tammikuu 2012; Hyväksytty: 05 huhtikuu 2012; Julkaistu: 11. toukokuuta 2012

Copyright: © 2012 Bajpai et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Informaatioteknologian laitos [Grant määrä DIT /R institutionaalinen avustusta osaamiskeskuksen järjestelmän] Intian hallitukselle. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat Vakuutan, että vastaava kirjoittaja (Kshitish K. Acharya) on sidoksissa molemmat IBAB, akateeminen tutkimuslaitos ja, Shodhaka Life Sciences Pvt. Ltd Jälkimmäinen on äskettäin perustettu kaupallinen yhtiö, joka on parhaillaan käynnissä pääasiassa tutkimuksen ja koulutuksen. Se on myös kaksi liittyviä tuotteita kirjallisuudesta ja online-testi biologian liittyviä työpaikkoja ja kursseja. Tulevaisuudessa yhtiö aikoo tarjota palveluja ja ohjelmisto kehityksestä. Kirjoittajat vahvistaa kuuluminen yhtiön ja osallistumisen vastaavan tekijän johtajana yrityksen. Ne vahvistavat myös, että tämä ei muuta niiden noudattamista kaikki PLoS ONE politiikan tietojen jakamista ja materiaaleja.

Johdanto

Kohtu on tärkeä nisäkkäiden elin, joka on hyvin tutkittu sen roolista normaalit toiminnot kuten siittiöiden muuttoliike, alkion implantaatio ja sikiön ravintoa, sekä useita sairauksia [1], [2]. Kohdunkaulan syöpä on yksi johtavista syistä syövän naisten kuolinsyynä maailmanlaajuisesti [3]. Vastaavasti, kohdun limakalvon syövän, endometrioosin ja hedelmättömyyden takia viallisten kohdun toiminnot ovat myös olleet merkittäviä ihmisten terveyteen huolenaiheita. Paljon jää tuntemattomaksi noin normaalin fysiologian ja patologisten yksityiskohdat kohdun kudoksen.

Ymmärtäminen malli ja mekanismit geenin ilmentymisen säätelyyn on keskeinen merkitys suurimmassa näkökohtia biologian, mukaan lukien normaalin ja epänormaalin valtioiden nisäkkään kohtuun. Laajamittainen havaitseminen geeniekspressiomalleja on helpompaa on transkriptin tasolla verrattuna proteiinin tasolla. Mikrosiruja käytössä genomin laaja transkriptio profiloinnin ja niitä on käytetty laajasti tutkia erilaisten biologisten ilmiöiden.

vaihtelut ekspressiotaso ja asemasta geenien poikki tulokset microarray kokeiluja [4], ovat aiheuttaneet rajoituksia apuohjelmia tällaisten geenien ilmentyminen tietoja. Suositeltava standardit microarray kokeiluja ja raportointi [5] – [7], ja parantaa meta-analyysimenetelmiä [8] – [11] voisi helpottaa paremman käytön ilmoitettujen tietojen. Vaikka tutkijat tänään näyttävät suosivan sekvensointi perustuvat menetelmät transkriptin profilointi [12], [13], arvo on jo olemassa microarray tietoja ei voi aliarvioida. Microarray ja muiden korkean suoritustehon geeniekspressiota tiedot on koottu useita hyödyllisiä tietokantoja /arkistot (on luettelo, katso https://www.startbioinfo.com/gene-expression). Mutta tehottomuus hakuvaihtoehtoja erityisiä fysiologisia ja koeolosuhteet myös rajoittaa hyväksikäyttöä käytettävissä olevat tietokannat. On myös havaittu, että huomattava määrä tieto puuttuu, niin tietokantoihin [14], [15]. Kääntäminen useimmat ilmaisun tiedot yhteen paikkaan olisi valtava haaste johtuu pääasiassa kahdesta syystä: a) kerääminen tietojen hajallaan kirjallisuudessa on työlästä, mutta ei näytä olevan mitään vaihtoehtoista; b) ei ole ollut kätevä keino johtaa käyttökelpoista tietoa eri alustoilla, tutkimukset ja tietojen tyypit (raaka /käsitellyt tiedot tai lopullista vain). Tiimimme aiemmin käyttänyt noin 3 vuotta vaivalla koota geenien ilmentyminen tietoja nisäkkäiden kiveksissä, ja sitten soveltaa uuden konsensuspohjaisen luotettavuus arviointimenetelmää johtamiseksi binary ilmentymistilanne kutakin geeniä [15].

Samanlainen vaivaa tarvitaan kohdun kudokseen. Merkittävä määrä microarray data on todellakin käytettävissä nisäkkään kohdun kudoksessa [16]. On ollut muutamia tietokantoja erityinen komponentti kohtu kuten kohdun limakalvon kudoksen, (Kohdun limakalvon Data Base: https://www.endometrialdatabase.com ja SCCPIR Endometrium Database Resource: https://endometrium.bcm.tmc.edu/edr ) tai ehto, CCDB, kohdunkaulan syövän geeni tietokanta [17]. Mutta meillä ei ole ollut kohdun tiettyyn tietokantaan. , Jonka tarkoituksena on koota mahdollisimman nykyiset kohdun geenien ilmentyminen tietoja ja tukea tutkimuksen eri näkökohtia nisäkkäiden kohdun, olemme luoneet Mammalian Gene Expression Kohtu tietokanta (MGEx-Udb), ja raportoivat samat.

Tulokset

tietokanta sisältöä

(A) tiedot katsotaan pisteytys: tällä hetkellä tietokanta kattaa 325 tutkimuksissa 2254 aineistoja, jotka vastaavat 1092 ”Expression status tietyin sijainnit ja olosuhteet” (ESLCs) ihmisen, hiiren , rotta, lehmä ja sika. Noin 83% tiedoista on MGEx-Udb on peräisin tutkimuksista ihmislajin (kuvio 1). Tietokanta sisältää 970 erilaista ESLCs ihmisen (23735 geenit), 91 hiiren (24428 geenit), 15 rotan (14497 geenit), 8 lehmä (10875 geenejä), ja 8 sian (1720 geenejä). Tietokannassa on enimmäismäärä tutkimuksissa kohdunkaulansyövän (38% kaikista tutkimuksista). Seuraavaksi yleisin tutkimuksista vastaavat kohdun limakalvon syöpä ja endometrioosi (noin 13% tutkimukset kullekin). Muut vaikuttavat olosuhteet sisältävät normaalia, sileälihaskasvaimen leiomyosarkooma, CIN-muutos (CIN), kohdun limakalvon liikakasvu, kohdun limakalvon syklit, tiineyden, käsittelemällä kemikaaleilla /hormonien ja Knockout ja transfektiotutkimuksissa liittyvät geenit (kuva 2). Useimmat tauti liittyvät raportit ovat peräisin ihmisen kudoksista ja /tai solulinjat. Vaikka tutkimukset liittyvät hormonihoito, alkion implantaatio ja normaalia kudosta ovat yleisiä hiiri, tutkimuksissa kemiallinen /hormonihoidon ja endometrioosin ovat yleisiä rotta. Mikäli lehmän ja sian, raskauteen liittyvä tutkimukset ovat yleisiä.

Muita lajeja ovat lehmä ja sika. Niistä kerätyt tiedot GEO tai ”PubMed GEO ”, 85% tutkimuksista oli läsnä myös ArrayExpress, vaikka tämä ei ole merkitty kuvioon.

(ja tutkimukset) in MGEx-Udb vastaavat erilaisten fysiologisten ja patologisten kohdun olosuhteissa. ”Muut” edustavat poikimisen jälkeistä, geneettinen-ablaatio, keinosiemennys ja alkion istutusta. Tutkimukset harkitsee kudoksia, joita käytettiin verrokkeina, mutta ei voi olla täysin ”normaali” on ryhmitelty

’voi olla normaali ”

luokka (esimerkkejä:” normaali kudos vieressä kasvain /syöpä kudos ”,” ajoneuvo saaneista ”).

Niistä 325 tutkimuksissa todettu tiedonkeruu-, 295 julkaistusta artikkelista oli kuratoinut kerätä tiedot liittyvät kunkin geenin lista. Vuonna Muissa tapauksissa vaaditut tiedot kuratoivat suoraan arkistot; ei ollut vastaavaa julkaisua varten näissä kokeissa. Kaikista tutkimuksissa noin 55% oli yksinomaan saatu kirjallisuudesta. Loput tiedot tulivat Gene Expression Omnibus (GEO) [18], ArrayExpress [19] ja muut arkistot yksin tai yhdessä kirjallisuudessa (kuvio 1). Tietokantaan 90% tutkimuksista vastaavat mRNA-tasolla ilmentymisen ja 10% tutkimuksiin vastaavat ilmaisunsa proteomic tasolla. Suurin osa (91%) mRNA tason raportit tulivat sirutekniikalla, mikä myös osaltaan 72% koko aineistot. Affymetrix (66%) on johtava tekijä joukossa microarray alustoille, jota seurasi cDNA mukautettuja paneelit (21%) (kuva 3). Pienimuotoinen perustuvat tutkimukset RT-PCR (PCR), kvantitatiivinen reaaliaikainen PCR, blottaustekniikat jne, myös osaltaan aineistoja. Niistä koko aineistot, 52% on 500 geenejä kussakin, 8% heistä on 50-500 ja loput 40% sisältää 50 geenejä (kuvio 4). Useimmissa tapauksissa aineistoja vastaa pienen mittakaavan tutkimukset olivat validointi kokeilut massa mittakaavassa geeniekspression tutkimus.

”Muut” sisältää aineistoja vaikuttanut pääasiassa GE Healthcare ja Illumina alustoille.

(jossa geeni count) kerätty eri lähteistä. Mikäli ”PubMed GEO ”ja” PubMed ArrayExpress ”, pienempiä geeni luettelot tuli validointi kokeita ja kerättiin PubMed, kun taas raaka-/käsitellyt tiedot olivat aina kerättiin arkistot (GEO /ArrayExpress).

B) Tietoja ei ole harkita pisteytys: MGEx-Udb on myös sekvensointi tietoja. Tällaisia ​​tietoja ei saa työskennellä teki konsensus johtuu yhteensopimattomuus näiden tietotyypit nykyisen laskennallinen pisteytysjärjestelmä. Next Generation Sequencing (NGS) data oli mukana HeLa solujen differentiaalikaavojen vaatii 2 käsittelyä olosuhteet, 3 tutkimuksista. Linkit esitetään muiden asiaan NGS (raaka) aineistot. Pääosa sekvenointitulosten kuitenkin vastaa ilmenevän geenin osiksi (EST).

Esimerkki

( ”vaiheessa IIA ei-keratinisoituvissa okasolusyöpä kohdunkaulansyövän”) B-hierarkia ehdot ja sub -ehdot, joista tietoja on kerätty, ja avattavasta vaihtoehtoja annetaan kyselyn ja lataa sivuja MGEx-Udb. Tällä hetkellä tietokannassa mahdollistaa jopa neljä tasoa hierarkian kysellä.

Web-käyttöliittymän

Kyselyn ominaisuudet.

MGEx-Udb tarjoaa useita kyselyn vaihtoehtoja. Kysellä geeni, käyttäjä voi syöttää tunnisteiden jokin seuraavista tyypeistä: nimet, symbolit, synonyymit, Entrez geeni tunnukset, ja geeni avainsanojen /kuvauksista. Ehto-pohjainen haku voidaan tehdä valitsemalla kunnon kiinnostusta avattavasta vaihtoehtoja fysiologisten tai koeolosuhteissa eri tasoilla hierarkioiden valitulle lajeja. Esimerkiksi geenejä transkriptoidaan tai lepäävien voidaan saada ihmisen kohdunkaulan syövän sekä, okasolusyöpä kunnossa. Samoin kyselyt voidaan rajoittaa tietylle alueelle kudoksen (sub-kudos), ja solu-tyyppiä. On myös mahdollisuus valita tietyn väestön tyyppiä kuten valkoihoinen, jos ihmisten, ja kanta tyyppejä, kuten C57BL6 tai Sprague-Dawley tapauksessa hiiren ja rotan, vastaavasti.

Output.

geeni-pohjainen haku, tietokanta sisältää luettelon samanlainen sekä osittain vastaavat geenit eri lajia. Jokainen geeni tällä sivulla voidaan napsauttaa varten perustiedot geeni, niiden promoottorit, ilmentymistilanne, tuotteet (selostukset ja proteiinit), Gene ontologia (GO) merkintöjä, proteiini-proteiini vuorovaikutusten, ristiviittaus muiden suurten bioinformatiikan resursseja, ja asiaan PubMed lainaukset. Basic geeni tieto koostuu sekvenssin loci ja geeni yhteenveto. Transcript tietoja ovat transkriptio ID, koodaava sekvenssi ja eksoni-introni yksityiskohtia. Promoottori tiedot kattavat transkription aloituskohdasta (TSS), mahdolliset promoottorisekvenssi ja sen kromosomiasemassa. Proteiini tieto tarjoaa eri isoformien proteiinin (s), jossa on vastaava sekvenssi, toiminto, molekyylipainon ja aminohapposekvenssin pituus. Expression tila (t) geeni on esitetty, yhdessä luotettavuus pisteet, useita kudoksen alueille /sub-kudosten ja solujen tyypit eri fysiologisia ja koeolosuhteissa. Alkuperäinen lähde ilmaisua tiedot näytetään erillisessä paneelissa. Tämän lisäksi, tietokanta näkyy ohjeellinen ilmentymistilanne (t), joka perustuu sekvenointitulosten (EST NGS), eri kohdun kudoksissa /olosuhteet.

Kyselyn tila, (ehto-pohjainen haku) säädetään luettelot geenien transkriptoidaan ja lepotilassa kysyi kunnossa. Jokaisessa näistä kahdesta luetteloissa luotettavuuden pisteet ”näkyy jokaisen geenin. Itse asiassa, geenit on järjestetty laskevassa järjestyksessä niiden tulokset. GO merkinnät näkyvät myös ensimmäistä 100 geenejä. Käyttäjä voi viedä koko lista geenien sekä niiden luotettavuuden tulokset. Viittauksia lähde aineistoja harkita pisteytys voidaan tarkastella tätä tuotosta sivulle. Klikkaamalla mitä tahansa geenin tulossivun on samanlainen vaikutus geenin hausta on kuvattu edellisessä kappaleessa. The ’analysoida -vaihtoehto lähdön sivun avulla käyttäjä voi suorittaa nopean analyysin merkittävien toimintojen /prosessien valitun geenejä. Käyttäjä voi nopeasti aloittaa GO analysointi ja useita sekvenssin rinnastus (geenien, proteiinien ja promoottorit), ja helposti asiaan reittejä ja yhden emäksen monimuotoisuus (SNP) kirjaa. Tietokanta mahdollistaa myös co-ilme, proteiini-vuorovaikutuksen ja reitin analyysit ja tarjoaa visualisoinnin verkkojen valittujen joukossa klusterin geenien avulla GeneMANIA [20] toiminnallinen analyysi työkalu.

Tietokanta sisältää helpon selailun geenien ja olosuhteissa. Lisäksi mukana ovat linkit kohtuun liittyvät tiedot (NGS ja kopion numero variaatioita), joiden indeksi olosuhteissa ja muita resursseja.

Keskustelu

Huomattava julkaistut microarray data on ei löydy mitään yleisesti käytetty tietokannoista tai varastoja [14], [15]. Kokoaminen näiden tietojen on oltava oppaat ja olisi aika ottaa prosessi. Olemme aloittaneet kudosta viisasta kooste nisäkkäiden geenien ilmentyminen tietoja, jonka tavoitteena on käyttää olemassa olevia tietoja luettelointia geeniekspressiomalleja. Vertaileva tutkimus [15] tietokannat ehto erityisiä kyselyitä osoitti paremmuuden sellaista kudosta viisasta biocuration geenin ilmentymisen tiedot. Samanlainen vertailu MGEx-Udb muiden tietovarastot /tietokantoihin osoittivat, että entinen tarjoaa helpompaa tietojenhakujärjestelmä ja tarjoaa suuremman määrän asiaankuuluvien tutkimusten ja geenit (yksityiskohdat tilastoihin osassa tietokanta).

Vahvuus luotettavuuden pisteet ”, että binary ilmentymistilanne, on verrannollinen tietokokonaisuuksien ja sopimuksen kaikkialla niitä, mitään vastaavaa kunnossa. On joitakin rajoituksia [15] tällaisissa konsensuspohjaisen pisteytystä binary ilmaisun valtioissa. Mutta tämä binary konsensusmenetelmäänsä ei tarjota merkittävää etua verrattuna useimpiin muihin meta-analyysi menetelmiä johtamiseksi semikvantitatiivinen konsensus. Se toimii eri alustoilla ja teknologiat riippumatta saatavuus raaka /käsiteltyä tietoa, kunhan lopullinen kutsu on tehty.

hierarkkinen näyttö geenien transkriptoidaan /lepääviä tietyissä olosuhteissa voi olla hyödyllinen edustus transkription profiilit. Korkeampi pisteet kertovat johdonmukaisuuden ilmentymistilanne vastaavien geenien poikki biologisten näytteiden (käytetty eri tutkimuksissa) ja teknologioita. Itse asiassa, sakeus näyttää yllä monien geenien huolimatta vaihteluista tekniikan, kuten mikrosirun alustan, RNA: n eristys menetelmiä ja tilastoja, sekä näytteet, jotka voivat myös vaihdella suhteessa väestön /kantojen ja muiden siihen liittyvien näkökohtien kuten ikä, sosiaalinen vuorovaikutus ja ruokavalio. Tuloksena listoja voidaan käyttää tunnistamaan geenejä, jotka ovat vahvoja edusta millään fysiologinen tila /kunto nisäkkään kohtuun kudoksessa. Esimerkiksi, käyttäjä voi saada listan geenit, jotka transkriptoidaan tai lepotilassa tautitilan kiinnostava ja verrata niitä, joilla on vastakkainen ilmentymistilanne normaalissa kunnossa. Unionin luettelo geenien poikki kaksi ehtoa voidaan johtaa ja hierarkkisesti järjestetty perustuvat tulokset. Tällainen luettelo sisältäisi geenit vaihtelevalla yhdessä tauti. Esimerkiksi geenit

”transkriboidaan kohdunkaulan syöpä, mutta lepotilassa normaaleissa kohdunkaula /kohtu”

korkea luotettavuus tulokset voivat olla parempi ehdokas biologiset merkkiaineet kuin geenit yleensä tunnistettu ilmentyvät eri yhden tutkimuksen.

CDKN2A

, joka on jo tunnettu kohdunkaulan syövälle [21], [22], on yksi tällainen geeni, joka on pistemäärä 318

käänteiskopioitavat tilaansa kohdunkaulan syöpää

79 tutkimukset PubMed, 6 GEO, 1 mistä ArrayExpress ja 2 caArray, ja 88

”lepotilan normaalissa kohtu”,

32 tutkimukset PubMed ja 1 GEO. Päinvastoin, joitakin alkuun geenit lepotilassa luettelosta kohdunkaulan syövän olivat myös lepotilassa normaali kohtu, ja siten ne ovat vähemmän todennäköisesti voimakas yhteys sairauden kanssa. Täten ulostulo saadaan poikki olosuhteita voidaan käyttää erottamaan geenejä, joilla on vahva yhteys kanssa kohdun ehto niistä heikosti tai ei lainkaan -alueella. Lähestymistapa saattaa avata uuden tavan listalle mahdollisia diagnostisia, prognostisia ja terapeuttisia tavoitteita kohtuun liittyvät häiriöt. Tätä prosessia voidaan käyttää saamaan puhdistettu klustereita koekspressoi geenejä.

geeniklustereiden saatu MGEx-Udb voi olla hyödyllistä ei vain ymmärtää molekyylitason mekanismeja ja reitit liittyvät, mutta myös valaista transkription säätelyyn, sairauden vaiheen tunnistaminen, geeni priorisointia ja geenien toiminnan ennusteita. Olemme aloittaneet joitakin tutkimuksia promoottori analyysi joitakin tärkeitä klustereita koekspressoi geenejä. Koottu (jälkeen valtava seulonnan vaivaa) lähdeluettelo geenin luetteloiden vastaa kutakin kunnon ja sijainnin kohteisiin voi olla erityisen hyödyllinen käyttäjille kiinnostunut hakemaan muissa meta-analyysi menetelmiä geenin ilmentymisen tiedot.

koska MGEx-Udb tarjoaa useimmat tai kaikki geeneistä liittyy tiettyyn kunnossa, se voi olla hyvä lähtökohta tahansa funktionaalista analyysia eri kohdun olosuhteissa. MGEx-Udb tarjoaa myös mahdollisuuden vertailla geeniekspressiomalleja poikki hienovarainen vaihtelut olosuhteissa ja hoitoja. Esimerkiksi yksi voi verrata ilmentymistilanne käsittelemättömästä normaalia kudosta raportit tarkoin näennäistä /ajoneuvo-käsiteltyjen näytteiden (voi olla normaali); kasvain-viereisten kudosten (voi olla normaali), jossa kasvaimeen puuttuu kudokset (normaali); kohdun kerrokset /sykliä; vaiheissa syöpä jne – eri tutkimuksissa.

jo olemassa olevia resursseja, jotka vastaavat tiettyjä kohdun sub-kudokset /olosuhteet ovat edullisia jossain mielessä verrattuna MGEx-Udb. Siksi olemme sisällyttäneet linkit tällaisia ​​resursseja meidän tietokantaan. CCDB [17], tietokannan spesifinen kohdunkaulan syöpä, ei vain ylös /alas säädellään, metyloidut, mutatoitunut ja monistettujen geenien, mutta myös antaa tietoa miRNA liittyviä kohdunkaulan syöpään. Kohdun limakalvon Data Base (https://www.endometrialdatabase.com) ja SCCPIR Endometrium Database Resource (https://endometrium.bcm.tmc.edu/edr) koota useita raportteja ero geeniekspressioiden endometriumin olosuhteissa. Mutta, lukuun ottamatta rajoittuvat tiettyihin olosuhteisiin, niiden geeni kattavuus ei näytä olevan alle MGEx-Udb. Ne eivät myöskään suunniteltu tarjoamaan yksimielisyyteen ilmentymistilanne läpi meta-analyysissä, tai edistää prosessia. Toisaalta, kudosspesifisiä tietokantoja kuten tiikeri [23] ja TiSGeD [24] antaa kohtu erityisiä geenejä, mutta älä salli kyselyitä tauteja ja /tai koeolosuhteissa.

Tulevaisuuden kehitys

nykyinen työ on vienyt meitä 3 vuotta, lähinnä manuaalisen kuratointiin liittyviä tehtäviä. Tiedot vastaavat joitakin ehtoja ja laji on vielä mukana ja pisteytys binary tila on rajoituksensa. Aiomme päivittää tietokantaan tiedot enemmän nisäkäslajeista ja kohdun olosuhteissa: a) kutsumalla tiedemiestoverisi ladata tiedot, ja b) omin voimin seuraavista lisärahoitusta. Suunnittelemme myös parantaa pisteytysjärjestelmän monin tavoin: a) eri paino toimeksianto perustuu näytteiden lukumäärästä, hybridisaatiot ja validointi kokeita; b) sisällyttää yksimielisyys ero ilmentymistilanne yhdessä transkriptio- /lepotilan; c) mahdollisesti yhteistyössä muiden järjestöjen, vahvistaa menetelmät sisällyttää tietoja muista suurikapasiteettisten geeniekspressiota tietoja, kuten NGS ja EST, samalla saatava konsensus.

Yhteenveto

Äskettäin kehitetty MGEx-Udb on tarkoitettu lisäämään erilaatuisia ponnisteluista biologien työskentelee kohtuun kudokseen. Tärkeä sovellukset /ominaisuuksia tämän tietokannan ovat seuraavat. A) Se sisältää suuren määrän manuaalisesti koottu geeniekspression vastaavat tiedot kohdun erilaisia ​​raportteja ja tietokantoja. B) Se tarjoaa luettelon koekspressoidusta geenien erilaisissa normaaleissa ja epänormaalit kohdun olosuhteissa. C) Se tarjoaa ”luotettavuus pisteet” osoittaa, missä määrin sopimus tai ristiriidat ilmentymistilanne poikki microarray ja proteomiikka tutkimukset liittyvät tiettyyn ehto /solu-tyyppinen, kutakin geeniä. D) Se käyttää myös sekvenointitulosten erilaisissa kohdun kudoksissa /olosuhteet osoittamaan ilmentymisen tilan kunkin geenin. E) voidaan tiedustella normaali tai jollekin patologisten tilojen kohtuun, sekä geenit, hiiren, rotan ja ihmisen lajeja. F) lisäksi ilmentymistilanne yhdessä luotettavuus tulokset useita kohdun olosuhteet, tietokanta tarjoaa helpon pääsyn muita tärkeitä perustiedot kuten sekvenssit geenien, proteiinien ja selostukset, GO merkintöjä, proteiini-proteiini vuorovaikutusten ja asiaan lainaukset . G) Se mahdollistaa sekvenssiohjauksen ja toiminta-analyysejä johdettujen koekspressoi sarjaa klustereita. H) Jokainen geeni on myös rajat viitataan muihin hyödyllisiin bioinformatiikan resursseja. I) Se tarjoaa helpon pääsyn koottu viiteluettelon geenin luetteloiden vastaavat eri kohdun olosuhteissa hyödyllinen eri meta-analyysi lähestymistapoja. Kaikki nämä ominaisuudet ovat todennäköisesti katalysoivat prosessin transkriptin luettelointi ja erilaiset muut kohtu liittyvää tutkimustyötä.

Luku edustaa tiedonkeruun (yläosa), arkkitehtuuri (keskiosa) ja toiminta (pohjaosa) of tietokantaan.

Materiaalit ja menetelmät

Tiedonkeruun

hakustrategia oli huolellisesti suunniteltu keräämään asiaa artikkeleita raportoitu kirjallisuudessa, (yksityiskohtainen menettely löytyy at https://dx.doi.org/10.1038/npre.2011.2101.3). Lyhyesti, tämä mukana tunnistamiseen yhdistelmiä hakutermejä /ilmauksia kunkin hakutyökalu, saada lainaukset käyttämällä useita työkaluja ja sitten koota osumia muun kuin tarpeeton liitto lista käyttäen Citation-Compiler työkalu (https://www.shodhaka.com /kääntäjä). Esimerkki täydellisen hakustrategia ja kyselyn sarjaa löytyy FAQ osiossa tietokantaan. Tarkoituksena oli kerätä sitaatteja liittyvät massaan mittakaavassa geeniekspression kohtuun kudoksessa. Ensimmäinen seulonta artikkelit suoritettiin tarkistaa merkityksellisyys, lukemalla tiivistelmät. Artikkeleissa tunnistettu asiaan Sitten etsitään luettelon geenien raportoitu ilmaistaan, säädelty, alassäädetty jne perusteellinen koko tekstin lukeminen. Gene luettelot näistä asiaan artikkeleita kerättiin käsikirjoitus täydentävät muistiinpanoja tai kirjoittajien verkkosivuilla. Suuret arkistot kuten GEO [18] ja ArrayExpress [19], ja muut tietovarastot kuten Oncomine [25], Stanford Microarray Database (SMD) [26], Center for Information Biology geenien ilmentyminen tietokanta (CIBEX) [27], caArray (https://array.nci.nih.gov/caarray), GEMMA (https://www.chibi.ubc.ca/Gemma/) ja Public Expression profilointi Resource (PEPR) [28] lisäksi etsittiin suuret asteikko geenien ilmentyminen tietoon nisäkkäiden kohdun kudokseen. Käsitellyt kerättiin missä saatavilla, koska pisteytyksen menetelmä vaatii vain viimeinen puhelu nykyhetkestä /poissa tila geenejä. Jos kukaan ei käsitellyt tiedot, raaka tiedot on ladattu ja käsitelty sopivalla standardimenetelmiä kuten suositellaan Bioconductor pakkauksissa (https://www.bioconductor.org).

Yhdessä geenin luettelosta, jotka liittyvät tiedot, eks- tilan, lajin, kudos- ja osa-kudoksen tai solulinjan, solu-tyyppi, ja vastaava fysiologisia tai koeolosuhteissa kerättiin julkaisuja tai varastoja. Tämä joukko perusparametrit on vastedes nimitystä ”Expression Status tietyin sijainti ja kunto” (ESLC). The ’edellytykset ”sisältyy normaali fysiologinen tila, sairaudet, kohdun limakalvon syklit, tiineyden, hoidettu hormoneilla ja /tai muita kemikaaleja, jne sanaston asetettiin kullekin kunnossa, säilyttää yhtenäisyys ja johtamiseksi konsensus poikki vastaavissa tutkimuksissa. Kuvio 5 esittää hierarkian ehto ja monitasoinen sub-olosuhteissa. Muita kerätty tieto geenin luetteloiden mukana näytteiden lukumäärää, ikä henkilöiden, määrä RNA isolations ja hybridisaatiot, ja tiedot tärkeimmistä sekä validointi kokeita (esim: alustan, koettimet ja tilastolliset menetelmät). Nämä geeni luettelot yhdessä selityksin varustettua tiedot (tästedes kutsutaan aineistoja) on ladataan tietokantaan. Vähimmäismäärä geenien kohden aineisto oli 3, maksimi oli 21609, ja keskiarvo oli 8554. Jokainen merkintä oli rajat tarkastettava vähintään yhtä muuta tutkija ja keskimäärin 0,7% virheitä (esim geeni siru nimi, väestö tyyppi , aika hoitojakso) on onnistuttu havaitsemaan.

’luotettavuus pisteet ”johdettiin jokaisesta ESLC kunkin geenin, käyttäen kuvattuja aiemmin [15], osoittaa laajuus hyväksyykö poikki aineistoja, jotka vastaavat samoja tai vastaavia ehtoja ja paikkoja kunkin lajin. Korkeammat tulokset osoittavat, että vastaavien geenien johdonmukaisesti raportoitu puhtaaksi tai lepotilassa. Geenejä pienempi tulokset samasta /samanlaiset olosuhteet osoittaisivat joko pienempi määrä, joka vastaa tutkimusten tai esiintyminen ristiriitaisia ​​raportteja erityinen ilmentymistilanne harkitaan.

Sekvensointitiedot liittyvät kohdun kudoksiin /olosuhteet myös koottu. Vaikka raportit RNA sekvensointi kerättiin kirjallisuudesta, EST dataa suoraan otettu UniGene [29].

Tietokanta luominen

Perl perustuu CGI-skripti luotiin rajapinnan merkinnän geenin luetteloiden ja niihin liittyviä tietoja. In-house tietokannassa käytettiin muuntamaan geenin tunnisteet aineistoja osaksi Entrez geenin tunnisteet. Nämä Entrez geeni tunnisteet jonossa-up lataamiseen muuta geeniä liittyvää tietoa. LWP moduuli (https://search.cpan.org/~gaas/libwww-perl-5.836/lib/LWP.pm) käytettiin yhteyden NCBI ja vaaditut tiedot ladattiin tuella NCBI E-apuohjelmia (http : //eutils.ncbi.nlm.nih.gov/entrez/query/static/eutils_help.html). Ladatut tiedot sisältävät viralliset geeni symboli, aliaksia, geenisekvenssi, geeni yhteenveto, sijainti kromosomissa, potentiaali promoottorisekvenssin [-1000-200 emäsparin] ja kaikki transkripti sekvenssit (yhdessä eksoni-introni yksityiskohdat) vastaten kutakin geeniä. Proteiini liittyvää tietoa on ladattu UniProt (https://www.uniprot.org; [30]). Samoin transkription aloituspaikkoja ladattiin dbTSS (ftp://ftp.hgc.jp/pub/hgc/db/dbtss/; [31]), versio 7.0. Kun tietoja ei ole saatavilla dbTSS varten geenin 5′-pää vastaavan NCBI-geenin sekvenssiä käytettiin edustamaan TSS asentoon. Gene ontologia tiedot on ladattu FTP tietokannan (ftp://ftp.geneontology.org/pub/go/; [32]) ja proteiini-proteiini vuorovaikutus tiedot on ladattu BioGRID (https://thebiogrid.org /download.php; [33]), versio 3.1. EST data ladattiin UniGene (ftp://ftp.ncbi.nih.gov/repository/UniGene; [29]). Perl koodit kirjoitettu varmistaa sisällytetään automaattisesti ladatun tiedot tietokantaan. ClustalW ladattiin https://www.clustal.org/clustal2/ja integroitu tietokanta, antaa mahdollisuus suorittaa useita sekvenssianalyysillä.

MySQL relaatiotietokannan hallintajärjestelmä (RDBMS), jota käytetään datan tallentamiseksi. Taulukko on omistettu tallentaa perustiedot geeniin liittyvä tieto sisältäen geenin nimi, locus ja transcript yksityiskohtia. Toinen taulukko käytetään tallentamaan geenin tunnisteet kuten geenin nimi, geeni kuvaus, viralliset geeni symboli ja NCBI geeni tunnisteen mikrosiru alustan koetin tunnisteet, jne. Erilliset taulukot ylläpidetään tallentamaan tiedot, jotka liittyvät lajeja, solutyypissä, kudos, solulinjasta ja olosuhteet, jotka muodostavat ESLC. Kukin merkintä nämä ei-tarpeeton pöydät on merkitty yksilöllinen tunniste. Saadut tulokset pisteytysjärjestelmä ylläpidetään Apukansion tietokantaan. Jokainen tiedosto vastaa ainutlaatuista ESLC, joka on nimetty käyttäen tunnuksia ESLC taulukoista. Tietokannan rakenne ja toiminnot on edustettuna kaavamainen kuviossa 6.

Kiitokset

Haluamme kiittää Bhaskar Mudhagantgi ja Nisha Ann Vishwan varten kuratoiden joitakin tutkimuksia ja edistää ensisijaisen

Vastaa