PLoS ONE: Mahdolliset terapeuttiset tavoitteet Oral Cancer: ADM, TP53, EGFR, LYN, CTLA4, SKIL, CTGF, CD70

tiivistelmä

Intiassa, suun syöpä on jatkuvasti rankattu kolmen parhaan syitä syöpään liittyvien kuolemien ja se on tullut ylhäältä syy syöpään liittyvien kuolemien miesten keskuudessa. Puute tehokkaita terapeuttisia vaihtoehtoja on yksi tärkeimmistä haasteista kliinisessä hoidossa suun syöpäpotilailla. Olemme kuulustelleet suuri joukko näytteitä suusyövästä geeniekspressiotutkimuksissa tunnistaa mahdollisia terapeuttisia kohteita, jotka ovat mukana useita syövän tunnusmerkki tapahtumia. Hoitostrategioita suunnattu tällaisia ​​tavoitteita voidaan olettaa tehokkaasti valvoa syöpäsoluja. Aineistot eri geeniekspressiotutkimuksissa yhdistettiin poistamalla erä-vaikutuksia, ja sitä käytettiin alavirtaan analyysejä, mukaan lukien erilainen ekspressio analyysi. Riippuvuus verkko analyysi tehtiin tunnistaa geenien issa merkitty topologinen muutoksia suusyövän näytteissä verrattuna kontrollinäytteitä. Syy päättely analyysi suoritettiin tunnistaa merkittäviä olettamuksia, jotka voivat selittää geeniekspressioprofiilien havaittiin suusyöpä näytteissä. Tekstinlouhintavälineiden lähestymistapaa käytettiin havaitsemaan syövän tunnusmerkit liittyvät geenit ilmentyvät merkittävästi suun syöpä. Kaikkiaan 2365 geenejä havaitaan differentiaalisesti ilmentyvien geenien, joka sisältää joitakin erittäin differentiaalisesti ilmentyvien geenien, kuten metalloproteinaaseja (MMP-1/3/10/13), kemokiini (CXC-motiivin) ligandeja (IL8, CXCL-10 /-11), PTHLH, SERPINE1, NELL2, S100A7A, MAL, CRNN, TGM3, CLCA4, keratiineja (KRT-3/4 /13/76/78), SERPINB11 ja seriinin peptidaasi-inhibiittorit (SPINK-5/7). Xist, TCEAL2, sääntelyviranomaisten ja FGFR2 ovat joitakin tärkeitä geenien havaitsee riippuvuuden ja syy-verkon analyysi. Kirjallisuus kaivos analyysi selityksin 1014 geenejä, joista 841 geenejä tilastollisesti merkitsevästi selityksin. Integrointi tuotos erilaisia ​​analyysejä, johti luettelo mahdollisista terapeuttisia kohteita suusyöpää, johon kuului tavoitteita kuten ADM, TP53, EGFR, LYN, CTLA4, SKIL, CTGF ja CD70.

Citation: Bundela S, Sharma A, Bisen PS (2014) mahdollisia terapeuttisia tavoitteet Oral Cancer: ADM, TP53, EGFR, LYN, CTLA4, SKIL, CTGF, CD70. PLoS ONE 9 (7): e102610. doi: 10,1371 /journal.pone.0102610

Editor: Enrique Hernandez-Lemus, National Institute of Genomisen Medicine, Meksiko

vastaanotettu: 12 joulukuu 2013; Hyväksytty: 20 Kesäkuu 2014; Julkaistu: 16 heinäkuu 2014

Copyright: © 2014 Bundela et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Taloudellinen tuki myönsi neuvoston tieteellisen ja teollisen tutkimuksen (CSIR), New Delhi alle emeritus Scientist järjestelmästä professori PS Bisen. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Noin 7,6 miljoonaa syöpään kuolleiden määräksi arvioitiin vuonna 2008 maailmanlaajuisesti, joista 0.640.000 ihmistä kuoli syöpään Intiassa [1]. Suun syöpä on tullut yksi kolmesta syitä syöpään liittyvien kuolemien Etelä-Aasian maissa, kuten Intiassa, Bangladeshissa ja Sri Lanka [1]. Uusimpien syövän tilastotiedot raportoitu Intiasta, suun syöpä on Ylimmässä syy syöpään liittyvät kuolemat miehillä, ja se vaikuttaa noin 23% kuolemista aiheuttamia syöpätyyppien miesten [2]. Intia on tullut episentrumi suun syöpään liittyvien kuolleisuutta, ja mukaan karkean arvion yli puolet maailmanlaajuisen suusyövän kuolleisuutta ovat Intiasta [1] – [3]. Suun syöpä on parhaillaan hallitaan leikkauksen, säteily ja kemoterapiaa. Setuksimabi on hyväksynyt vain täsmähoitoihin saatavilla suun syöpä, joka kohdistuu epidermaalisen kasvutekijän reseptori (EGFR), jotka liittyvät solun kasvuun. Kohdennettu hoitomuodot ovat osoittautuneet hyödyllisiksi hallinnassa erilaisten syöpien, lähinnä koska sen kyky vähentää toksisuutta useilla taittuu verrattuna kemoterapeuttisten lääkkeiden. Hankinta vastustuskykyä kohdennettuja syövän hoitomuotoja takia syntymistä eri geneettisten ja /tai ei-geneettisiä mekanismeja, ovat vakavasti niiden kliinistä soveltamista [4] – [6]. Haasteena syntyminen lääkeresistenssin syöpäsoluissa voidaan käsitellä – (a) moniosaisia ​​tavoitteensa yhdistelmähoito, (b) suunnitella lääkeaineen vastaan ​​molekyylikohteena (t), jotka ovat mukana monipuolisia polkuja kriittisesti liittyy selviytymisen, kasvun ja syöpäsolujen lisääntymistä, tai yhdistelmä (a) ja (b).

nykyinen tutkimus, pyrkii tunnistamaan mahdollisia terapeuttisia kohteita suun syöpään, jotka liittyvät useiden syöpään tunnusmerkkejä, mikä voi helpottaa järkevä löytö tehokkaiden hoitojen suun syöpä. Olemme käyttäneet mikrosirujen aineistoja saatavissa NCBI-GEO tietokanta, tutkia transkription profiileja nimenomaan muuttunut suun syöpä. Olemme integroineet aineisto kahdesta tutkimuksesta, joissa vastaavat kokeelliset suunnittelu (eli suullinen syöpä vs. kontrolli) tehdä hyödyllisiä tuloksia Suojattavista aineisto on parannettu tilastollinen voima. Suora integrointi aineisto eri tutkimuksista on haastavaa, koska olemassaolosta lukemattomia lähteitä kuin biologista vaihtelua, jota kutsutaan usein nimellä ”erä-vaikutuksia”. Tällainen koetin-tason integraatio aineisto kahdesta eri tutkimuksista on mahdollista poistamalla erä-vaikutuksia cross-platform normalisointi [7]. Erilaisia ​​analyyttisiä menetelmiä on integroitu jotta looginen valinta lupaavimmista terapeuttisia kohteita suusyöpää (Fig. 1). Olemme käyttäneet geeni riippuvuus verkko analyysi ymmärtää topologinen ominaisuuksia alla syövän ja valvonnan kunnossa, geenien merkitty topologinen eroja voitaisiin pitää terapeuttisten kohdegeenien [8]. Syy päättely analyysiä käytettiin määritettäessä mahdollisia geenejä, jotka voivat selittää ero geeniekspression muutoksia suun syöpä. Kehittäminen syöpä on monivaiheinen prosessi käytössä esiintyminen keskeisten tunnusmerkki tapahtumia, kuten yllä proliferatiivinen signalointi, kiertää kasvu vaimentimet, vastustavat apoptoottista solukuolemaa, joka mahdollistaa replikatiivisia kuolemattomuus, angiogeneesin, aktivoivat invaasio, etäpesäke ja tulehdus [9]. Novel kirjallisuus kaivos menetelmää on käytetty liittämään nämä syöpää tunnusmerkkejä geeneihin meidän etu. Esillä olevassa tutkimuksessa, monimuotoisuus syöpään tunnusmerkkejä liittyy geenin yhdessä vaikuttava topologinen profiili dependency- ja /tai syy-verkko, täyttää geeni olla mahdollisia lääkkeiden kohde suusyöpää.

Laajamittainen integrointi tietokokonaisuuksien peräisin suusyövästä geeniekspressiotutkimuksissa oli yritetty aikaisemmin objektiivisen louhia transkription allekirjoituksia liittyy neoplastisen transformaation [10] tai selviytyminen [11]. Viime aikoina sitä on käytetty tunnistamaan usein somaattisten ajureita suullinen syövän synnyn [12]. Tehtäväksi tunnistaa potentiaalisia terapeuttisia tavoitteensa integroiva analyysi, on yritetty ensimmäistä kertaa nykyisessä tutkimuksessa. Kanssa nousuun aiheuttamista kuolemista suusyövän etenkin Intian niemimaan alueella, on kiireellinen tarve nopeuttaa pyrkimyksiämme löytää uusia hoitomuotoja suun syöpä. Nykyisessä tutkimuksessa, esittää loogisen kehyksen löytää mahdollisia terapeuttisia kohteita, jotka liittyvät useiden syöpään tunnusmerkkejä, ja kohdentamalla näin ollen niiden odotetaan olevan täydellinen vastaus haasteisiin, jotka liittyvät hankitun lääkeresistenssideterminantit kohdennettua hoitomuotojen.

materiaalit ja menetelmät

Tietolähde

geenien ilmentyminen tietojen suun syöpäpotilaiden ja normaalien henkilöiden (kontrolli näytteet), raportoitu kahdessa eri tutkimuksessa [13], [14] käytettiin nykyisessä työ (taulukko 1).

Direct data Integration

geenien ilmentyminen tuottamat tiedot eri kokeita ei voi yhdistää suoraan jatkoanalyysille, vaikka jalostuksen jälkeen samanlaisia ​​normalisoinnin menetelmää, koska luontainen ei-biologisten kokeellinen muunnelmat tai ”erä-vaikutukset”. Suora integrointi tietojen on mahdollista sen jälkeen käsittely aineistoja sopivilla normalisoinnin menetelmää seuraa siru huomautusta ja post varten tarvittavien toimenpiteiden poistamiseksi erän vaikutusten avulla erän korjausmenetelmät.

normalisointi.

raakadataa tai CEL tiedostoja käytetään geeniekspressioprofilointi tutkimus Peng et al. [14] ladattiin NCBI geenien ilmentyminen tietovarasto (NCBI-GEO), ja koetin taso yhteenvedot saatiin Tukeva Multichip Analysis (RMA) algoritmi [15] toteutetaan Affymetrix Expression Console -ohjelmaa (versio 1.3). RMA-algoritmi sopii vankan lineaarinen malli maadoituskoettimessa tasolla minimoida koetin-spesifinen affiniteetti eroja. Normalisoitu aineisto, talletetaan NCBI-GEO by Ambatipudi et al. [13], on ladattu ja käytetty nykyisessä tutkimuksessa. Yksityiskohdat normalisointi menettelyjä käytetään tähän aineisto löytyy liittyvän julkaisun [13].

Chip Lisäykset.

Netaffyx merkintä tiedosto HuEx-1_0-st-v2.na33.1. hg19.transcript.csv ladattiin https://www.affymetrix.com/, ja käyttää ensisijaisena lähteenä merkintä varten HuEx-1_0-st array aineisto. Custom parseri oli kirjoitettu Perl poimia olennaisimmat sarakkeet kuten Probeset ID, edustaja Public ID, Entrez GeneID näistä merkintätiedostoja. Merkintä tiedosto Agilent-014850 kaikkiaan Human Genome Microarray 4x44K G4112F (Probe Name versio) on ladattu vastaavasta alustan tiedosto (GPL6480) saatavilla NCBI-GEO. Custom parseri oli kirjoitettu Perl poimia Entrez GeneID ja Gene Symbol suhteutettu vastaava koetin tunnukset.

siru merkintä oli entisestään avulla gene2accession ladatun tiedoston NCBI ftp (ftp: //ftp. ncbi.nlm.nih.gov/gene/DATA). Gene2accession tiedosto auttoi meitä kadonneiden Entrez GeneIDs mittapäiden perustuvat muiden käytettävissä olevien tietojen, kuten RNA /genomista nukleotidin liittymisen id joka on yhteisen kentän huomautusta tiedosto ja gene2accession. Voisimme merkitä 30932 koettimien Agilent-014850 kaikkiaan Human Genome Microarray 4x44K G4112F (Probe Name versio) ja 38349 koettimien HuEx-1_0-st (transkriptio versio) vastaavan Entrez GeneIDs. Koettimet ilman huomautusta ei otettu huomioon loppupään analyyttinen prosesseja.

Käsitteleminen monet-moneen suhde mittapäät ja Genes.

Ei ole aina yksi yhteen vastaavuus välillä microarray antureista ja liittyvät geenit , joka luo epäselvyys vaikka tulosten analysointiin loppupään tilastollisia ja /tai toiminnallisen analyysin. Kahdentyyppisiä erityistapauksia syntyy, koska monet-moneen suhteet antureista ja geenien, eli. (A) yksi koetin on yhdistetty useampaan kuin yhteen GeneID (esim Probe1- BIRC5, BIRC3), koska epäspesifinen luonne koetin, ja (b) useampia kuin yksi anturi voidaan kartta samaan GeneID, jota usein kutsutaan kuten ”sisarus” antureista (esim Probe1- BIRC5, Probe2- BIRC5), joka yleensä johtuu ryhmittely luonteen toissijainen tietokantojen (UniGene, RefSeq) tai johtuen monistaa täplikäs antureista.

kun otetaan huomioon vain koettimet yksi-yhteen suhde olisi yksinkertaisin analyyttinen lähestymistapa; kuitenkin, se merkitsisi menettää tietoja. Ramasamy et ai. [16] suositteli antureista kartoitettu useita geenejä uusia kirjanpitoa jokaisesta GeneID. Olemme kirjoittaneet mukautettuja Perl-skripti ”laajentaa” koettimet useita geenejä käsittelemään ei-koettimien, joka kartoittaa useammalle kuin yhden geenin. Tämä luo uutta tietoa jokaiselle GeneID.

Tiedot leviävät sisarus antureista yhdistettiin avulla vankka tilastotieto, Tukeyn biweight [17]. Mediaani liittyvät Tukeyn biweight on vankka tilastotieto, jonka tiedetään olevan erinomainen käyttäytyminen läsnä ollessa tai ilman harha, koska nämä ominaisuudet, se otettiin käyttöön MAS5.0 algoritmi, jota käytetään koettimen tasolle yhteenvetoa [18]. Custom skriptejä kirjoitettu Perl ja R käsitellä sisaruksen antureista, ja R ”-menetelmä tbrm () ’saatavana dplR paketti käytettiin laskea Tukeyn biweight robusti keskiarvo. Ryhmät Sisarusten antureista tunnistettiin, ja nämä tiedot korvattiin yhdellä edustavat tallenteet, jossa ilmaisun arvojen leviäminen sisarus koettimet korvattiin Tukeyn biweight robusti keskiarvo; Tämä prosessi toistettiin jokaista sisarusten koetin ryhmä.

Kun ongelma monet-moneen suhde antureista ja geenien, 19593 ja 23407 antureista /geenit säilytetään Agilent-014850 koko genomin ja HuEx-1_0-st paneelit vastaavasti. Molemmat aineistot olivat edelleen yhdistettiin perustuu yhteisiin kenttä, eli Entrez GeneID. Sulautunut aineisto koostui 18927 koettimien /geenit, 84 syöpänäytteissä ja 27 kontrollinäytteitä. Tällä yhdistetyllä aineisto käytettiin seuraavaan erään korjausprosessin.

Erä Correction.

Käytimme kahden analyysimenetelmien eli torjua [19] ja XPN [20] käsittelemään ei-biologisten muunnelmia tai erä-vaikutuksia. Näitä menetelmiä on raportoitu parempia muihin cross-platform normalisointitekniikat [21], [22].

R täytäntöönpano Combat (www.bu.edu/jlab/wp-assets/ComBat/) käytettiin poistamalla erä-vaikutuksia kahdesta aineistot. Samoin normalisoitu aineistot käsittelivät XPN menetelmällä, toteutetaan CONOR paketti [22] saatavana CRAN paketti arkistoon (cran.r-project.org/web/packages/). Normalisoitu ja erän korjattua dataa avulla koetin /geenitasolla integrointi tietojen kahdesta tutkimuksesta, mikä helpottaa sukupolven vankka hypoteeseja tietojen parannetulla tilastollinen voima.

Arvio laatu Erä korjaus.

erää korjattu aineisto arvioitiin varten määreitä, kuten jakelun näytteille ja muutos kokeellinen valtaa. Tämä tehtiin valita keskuudessa Combat ja XPN, kun erä korjaus menetelmä, joka sopii parhaiten meidän aineisto. R täytäntöönpano Principal Component Analysis – PCA (eli prcomp () menetelmää) käytettiin arvioitaessa jakelun syövän ja kontrollinäytteiden kahden aineisto käytetty nykyisessä tutkimuksessa [13], [14]. R tilastopaketista ssize () käytettiin arviointiin kokeellisen teho [23].

Differential ilmentymisanalyysiä

normalisoitu ja erä korjattu aineisto käytettiin lisäanalyysiä. Differentiaalinen ilmaus analyysi suoritettiin käyttäen Limma paketin (versio 3.14.4) kanssa pienimmän neliösumman regressio ja empiirinen Bayes valvottu t-tilastot [24], [25]. Suunnittelu matriisi rakennettiin edustamaan ulkoasu syövän ja kontrollinäytteistä data-matriisi. Ero ekspressiotasot näytteiden kahdessa olosuhteissa tutkittiin asettamalla sijaan ”syöpää ohjaus”. P-arvot säädettiin monimuuttujille käyttäen Benjamini Hochberg vääriä löytö korjausta tai ”fdr” [26]. Geenit säädetyllä p-arvo pienempi tai yhtä suuri kuin 0,05 ja kertaluokkamuutos kynnys 1.5 pidettiin ilmennetty eri nykyisessä tutkimuksessa.

Network Analysis

R tilastopaketista ’ GeneNet ”(versio 1.2.7) [27] käytettiin päätellä laajamittainen geeni yhdistys verkostoja differentiaalisesti ilmentyvien geenien saatu tutkimuksessamme. Yhdistyksen verkot päätellä GeneNet ovat graafisia Gaussian malleja (GGMs), joka edustaa monimuuttuja riippuvuudet biomolekulaaristen verkkojen osittaisella korrelaatio. Tämä menetelmä tuottaa kuvaaja, jossa jokainen solmu edustaa geeniä, ja reunat ovat suorat väliset riippuvuudet yhdistää solmut /geenejä. Tämä menetelmä myös laskee tilastollista merkittävyyttä arvo (p-arvo) sekä FDR korjattu /oikaistun q-arvo reunat GGM verkko, joka tarjoaa mekanismin poimia ainoa merkittävä reunat verkossa. Riippuvuus verkosto luotiin kullekin kunnossa itsenäisesti. Kynnys q-arvo on pienempi tai yhtä suuri kuin 0,05, on käytetty suodattaa pois ei-merkitsevä reunat lopullisessa verkossa. Custom Perl-skriptit kirjoitettu poimia yhteyden tai aste tilastot verkkojen syövän ja kontrollinäytteistä.

Syy päättelykyky

Syy päättelyä yrittää selittää oletetun biologisen syyt havaittujen geenien ilmentymisen muutoksia perustuvat suunnattu syysuhteita. Syy- ja seuraussuhteiden voidaan esittää ”syy kaavioita”, jotka koostuvat solmujen (geenin /biologinen prosessi), ja ohjataan reunat kuvaavat suhdetta yhdistävät solmuja. Biologinen asetuksella voi myös olla edustettuina niin syy kaavioita muodossa allekirjoitettu reunojen kanssa merkki osoittaa, onko muutos syy muuttuja vaikuttaa toinen muuttuja positiivisesti tai negatiivisesti.

Nykyisessä tutkimuksessa olemme hakeneet syy päättely ehdottama menetelmä Chindelevitch et al. [28], hakea luetteloon tilastollisesti merkitsevä alkupään hypoteeseja, mikä selittää havaitut geeniekspression muutoksia tutkimuksessamme aineisto. Tämä menetelmä tunnistaa otaksuttu ylävirtaan hypoteesi perustuu joukko syy suhteiden edustettuina syy kaavio, ja sijoittuu tällaisen hypoteesin laskemalla niiden kumulatiivinen pistemäärä perustuu luonteeseen ennustuksen (oikea = + 1, väärä = -1, epäselvä = 0) teki jonka hypoteesi on syy-kuvaajan. Tämä menetelmä myös laskee tilastollista merkitystä kunkin pisteet ja lähtö n hypoteesit, jotka ovat tilastollisesti merkitseviä.

R-koodi syy perustelut menetelmän [28] vaaditaan kolme tuloa eli. (I) Syy Verkko Yksiköt: sarkainerottelua tiedosto koostuu tietoa yksikköjen syy verkko, tutkimuksessamme se koostui luettelon geenejä, jotka ovat osa syy verkon, (ii) ilmennetty eri Genelist: sarkainerottelua tiedosto koostuu kahden sarakkeen (eli geenin nimi ja suunta asetus, joka on 1 tai -1 ylös- tai alaspäin-asetus), (iii) Syy Verkko Relationships: sarkainerottelua tiedosto koostuu muodostavien yksiköiden (eli lähde geeni kohde- geeni) ja tyyppi suhde yksiköiden (tyyppi: ”lisätä” tai ”vähennä” kuvaa syy vaikutuksen lähde kohde). Tulostiedostot Tällä menetelmällä tuotetut ovat: (i) HypothesisTable.xls (katso Teksti S4): sarkainerotellussa tiedosto, jokainen rivi, joka on hypoteesi (eli kokonaisuus kuvaajan suunta + tai – ja useita loppupään toteutettavien toimenpiteiden ennustaa selostukset) ja pylväs koostuu pisteet, nimi ja numero oikein, väärä, eikä selittänyt selostukset sekä p-arvot ja Bonferronin korjattu p-arvo [29], [30] kuten varovaisen arvion merkitys toistuvassa testaus korjaus (ii) xGMML tiedostot: syy osa-kuvaajia merkittävien hypoteesin havaita menetelmällä syntyy xgmml muodossa.

syy Graph Creation.

Olemme käytetyt kausaalisuhde upotettu Kegg väyliä [31] lähteenä tuottavan syy kuvaajan nykyisessä tutkimuksessa. Kegg API velkarahalla kehyksenä jäsentämiseen yhteisöjä ja suhteet päässä kgml tiedot polun. Kegg reittejä ihmisen katsottiin kerätä tarvittavat tiedot rakentaa syy-verkkoon. Kgml tiedosto sisältää kokonaisuuden lista (geeni /yhdiste) ja suhde tietoa (aktivointi /esto /ilme jne.). Olemme katsoneet ”aktivointi” ja ”esto” yhdessä osallistuvien yksiköiden sellaisessa parisuhteessa rakentamiseksi syy kuvaaja. Lopullinen syy kaavio syntyy Kegg reittejä koostui 11586 syy-seuraussuhteiden.

Post käsittely XGMML tiedostojen ja sukupolvi Consolidated Syy Network.

xgmml tiedostoja tuottamat syy päättelyn analyysi oli jäsentää mukautettuja perl-skripti poimia kriittistä tietoa ylävirtaan hypoteesi ja luoda konsolidoitu syy verkkoon. Hypoteesit ja ennustetun suhteet olivat edelleen altistettiin seuloa poistaa hypoteeseja ei tue tietomme ja myös poistaa väärin ennustettu syysuhteet, jotka voidaan tunnistaa ”I (+/-)” Teksti S5. Oikein ennusti suhteita voidaan tunnistaa ”C (+/-)” Teksti S5. Hypoteeseja, joita ei ilmennetty eri tarkastettiin sen ekspressiotason (eli ylös /alas-asetus) kuvattu syy kuvaajaa ja verrattiin sitä vastaavan ilmaisun tasolla meidän aineisto. Jokainen hypoteesi ristiriitaisia ​​suuntaan mentymisprofiili (ts säädellään ylöspäin syy kuvaajan ja alassäädetty ilmentymisessä aineisto, tai päinvastoin) ei katsottu lisäanalyysiä varten. Siten ennusti oikein hypoteesit sisältää ainoastaan ​​ne hypoteeseja, joita voidaan vahvistavat integroituja ilmaisua aineisto käytetty nykyisessä tutkimuksessa (eli hypoteesia kuvataan yliekspressoitu syy verkossa, pitäisi myös osoittaa yli-ilmentyminen ilmentymisessä aineisto, tai päinvastoin ).

ennusti oikein suhteita ja hypoteesit katsottiin luotaessa konsolidoitu syy verkkoon. Connectivity tiedot yhdessä luonteen suhteen (nousu /lasku) välillä hypoteesi ja loppupään geenejä tallennettu ”Causal_Net.rel” (katso teksti S6). Connectivity tilastoja myös laskettava kaikille reunat lopullinen syy verkkoon ja tallennetaan ”Causal_Net.degree” (katso teksti S7).

Kirjallisuus Mining

Differentially ilmaistuna geenejä katsottiin toiminnallista analyysiä, joka perustuu tiedot saatavilla julkaissut artikkeleita arkistoitu NCBI PubMed tietokantaan. NCBI eUtils erityisesti UTKIMUKSEN ja Efetch, käytettiin yhdessä Perl LWP moduuli, kaivosteollisuuden NCBI PubMed tietokantaan [32]. Laajuus kirjallisuudesta Geeniteknologiasta symboli differentiaalisesti ilmentyvien geenien laajennettiin käyttämällä geeniä synonyymi pöytä, kyselyt sisältävät synonyymit yhdessä muiden hakutermien Sitten lähetettiin PubMed käyttäen UTKIMUKSEN apuohjelma, jonka jälkeen haku asiaankuuluvien rekisterien Efetch apuohjelma.

menetelmä käyttää tekstinlouhintavälineiden määriteltyjen sääntöjen algoritmin, luokitella differentiaalisesti ilmentyvien geenien mukaan merkkiaine tyyppi (terapeuttinen /diagnostinen /prognostinen) ja asiaan syöpä tunnusmerkkejä (apoptoosin /solun lisääntymistä /angiogeneesin /etäpesäke /tulehdus) raportoitu jakautuvat asianomaisten geenin julkaistuja artikkeleita NCBI-PubMed. Algoritmi laskee tilastollista merkitystä hakutilastotietoja ja kootaan kirjallisuudessa kaivos- tulokset raporttitiedostot. Algoritmisen virtaus kirjallisuuden kaivos menetelmää käytetään nykyisessä tutkimuksessa kuvataan kuviossa. 2.

Perl-skripti on kirjoitettu toiminnallinen merkintään panos geenin-lista, joka perustuu tekstinlouhintaa merkityksellisten esineiden noudetaan avulla NCBI eUtils. Kirjallisuudessa louhinta algoritmi toteutettu nykyisessä Tutkimus koostuu seuraavista pääosaa:

luominen geenin-synonyymi pöytä.

Kyselyn muodostumista.

Text-kaivos.

merkitys analyysi tekstinlouhintavälineiden tulos.

Gene synonyymi pöytä.

sarkaineroteltuna ”gene_info” tiedosto on ladattu NCBI fTP ja luotiin geeni synonyymi pöytä. Kilpailutyöt ihmisen poimittiin gene_info tiedoston avulla organismin koodin ihmisen (Taxonomy id: 9606), ja nämä merkinnät käytettiin luomaan väli- tiedosto, jota edelleen käytetään luoda geeni synonyymi pöytä. Sarakkeet välissä tiedoston joita käytetään tuottamaan vaihtoehtoisia nimiä geenit ovat: (i) ”geeni synonyymit”, (ii) ’kuvaavalla nimellä ”, ja (iii)’ muita nimiä”.

tuloksena geeni synonyymi taulukko tallennettiin sarkainerottelua tiedosto kaksi saraketta eli. geeni symboli ja synonyymit. Merkinnän geenissä synonyymi taulukko oli seuraavassa muodossa:

MMP-1 CLG # genaasilla # interstitiaalinen kollagenaasi # matriisi-1 # matriksimetalloproteinaasi 1.

Kyselyn muodostumista.

hakukyselyt optimoitiin käyttämällä asianmukaisia ​​hakutunnisteita [33], noutamiseen asiaan artikkeleita PubMed. Tämä optimointi on tarpeen, koska PubMed ei tue lausehakuihin. Etsiessään lause koostuu useista sanoista, PubMed haku palaisi tavarat, joissa kaikki sanat lause useisiin eri paikkoihin abstrakti. Tämä oletustoimintoja PubMed voidaan ohjata käyttämällä hakua tageja. Haku tag ”[Tiab]” (osasto /abstrakti) käytettiin jälkeen geenin termejä ja biologisiin käsitteisiin kuin apoptoosin tai angiogeneesiin, jota käytettiin istä PubMed tietokantaan. Lisäksi haku tag ”[MH] ’(MeSH ehdot) levitettiin rajoittamiseksi yhteydessä haun nimenomaan suusyövän käyttämällä MeSH termillä” mouth kasvaimet [MH] ”ja ovat käyttäneet kyselyn termi” kasvaimet [MH] ”etsimiseen artikkeleita tahansa syöpätyypin.

kyselyt käyttämät meidän menetelmällä voidaan karkeasti jakaa kahteen ryhmään eli.

Global kyselyt: Nämä kyselyt käytettiin poimia etsiä maailmanlaajuiset tilastot computing tilastollista merkittävyyttä kirjallisuuden kaivos tuloksia. Maailmanlaajuinen varten tarvittavat tilastotiedot Fisherin tarkka testi sisältää yhteensä useita artikkeleita liittyvät suusyövän /syöpä, ja useita artikkeleita funktionaalista (kuten apoptoosin, etäpesäke, angiogeneesi jne) sekä suullinen syöpä /cancer.

Esim (Solukuoleman [Tiab] TAI apoptoosin [Tiab] TAI apoptoottinen [Tiab] tai anti-apoptoosin [Tiab] TAI antiapoptooppinen [Tiab]) ja suun kasvaimet [MH].

Gene erityisiä Kyselyt: Gene symbolit alkaen ilmentyvät eri geeni-lista käännettiin vastaaviin synonyymeja avulla geenin synonyymi taulukossa. Gene tiettyjä kyselyjä sisältää synonyymejä, avainsanoja käsitteitä ja syövän tyyppi (suu kasvaimet tai kasvaimet) lähetettiin PubMed käyttäen UTKIMUKSEN apuohjelma, jonka jälkeen haku on asiaan liittyvien rekistereiden avulla Efetch apuohjelman. Ei rajoituksia asetettiin kappalemäärät haetaan per kysely, koska meidän tavoitteena oli antaa huomautus perustuu yksimielisyyteen julkaistuja artikkeleita. Koska suullinen syöpä on keskittyä tämän tutkimuksen ensimmäinen yritys meidän menetelmän oli kyselyn joukossa artikkeleita suusyövän, ja sitten harkita artikkeleita tahansa syöpää malleissa kunnossa jättämisestä hakea tietoja erityisiä yhteydessä suun syöpä. Tämä tehtiin parantamiseksi merkinnästä nopeudella tulo geenin-luettelosta.

esim. ((MMP-1 [Tiab] TAI CLG [Tiab] TAI genaasilla [Tiab] TAI interstitiaalinen kollagenaasi [Tiab] TAI matriisi-1 [Tiab] TAI matriksimetalloproteinaasi 1 [Tiab]) ja (((terapeuttinen [Tiab] TAI hoito [Tiab ] TAI diagnostinen [Tiab] TAI diagnoosi [Tiab] TAI ennustetekijöiden [Tiab] TAI ennusteeseen [Tiab] TAI tulehduksellinen [Tiab]) JA (tavoite [Tiab] TAI molekyyli [Tiab] TAI markkeri [Tiab])) OR (solu [Tiab ] JA (leviämisen [Tiab] TAI proliferatiivinen [Tiab] tai kuolema [Tiab] TAI kasvu [Tiab] TAI kuolemattomaksi [Tiab] TAI muuttoliike [Tiab])) OR (apoptoosin [Tiab] TAI apoptoottinen [Tiab] tai anti-apoptoosin [ ,,,0],Tiab] TAI antiapoptooppinen [Tiab] TAI angiogeneesissä [Tiab] TAI etäpesäke [Tiab] tai metastaattinen [Tiab] TAI tulehdus [Tiab] TAI hyökkäys [Tiab] TAI (immuuni [Tiab] JA (modulaatio [Tiab] TAI vastus [Tiab ] tai tuhoaminen [Tiab]))))) ja suun kasvaimet [MH].

Text Mining.

asiaa artikkeleita haettiin PubMed ”XML-muodossa, mikä tekee tiedon louhinta lisää tarkka johtuen läsnäolosta sisällön sisälle xml tag paria. Katsausartikkelit ei otettu huomioon tekstinlouhintaa, koska se voi johtaa louhinnan ylimääräistä informaatiota, joka on jo vangiksi kaivos alkuperäisen tutkimuksen tarkoitetut esineet näissä tarkastelun artikkeleita. Abstraktin osa artikkeleista pidettiin tekstin kaivos. Eräässä artikkelissa, geeni nimeä voidaan käyttää lyhenne sanoista käsite liity geeni ja siten voi tulla lähde väärien positiivisten [34], [35]. Menetelmämme yritykset ratkaista sekaannus johtuen lyhenne sanoista etsimällä laajennettu muoto lyhenne on sisällön edellisen lyhenne ja sitten vertaamalla sitä synonyymejä lyhenteellä noudetaan geenistä synonyymi taulukosta. Tiivistelmä pois analyysistä, jos ottelu löytyy synonyymiluettelo.

abstrakti osassa tahansa artikkeli on Käydyn artikkelin, jossa tiivis tietoja tausta, tulokset ja johtopäätökset työn mainittu artikkeleita. Paljon variaatioita voidaan nähdä rakenteessa abstrakti osa tutkimusta artikkeleita. Joissakin artikkeleissa on erillinen alaosioiden tausta, tulokset ja johtopäätökset, kun taas muut esineet olisivat kaikki nämä tiedot kirjoitetut abstrakti jaksossa ilman sub-osastointi. Sisältö tehtyjä päätelmiä momentissa artikkeleita voidaan pitää kaikkein informatiivinen ja yksiselitteisempi toiminnallinen merkintä tehtäviä, kuten meidän. Sisältö käytetään tekstinlouhintaa meidän menetelmällä eristettiin päätelmiin momentti artikkelit hyvin määritelty alaluokkiin abstraktilla osassa. Muiden artiklatekstejä Saharan leikattuna abstrakti, menetelmämme poimii nämä tiedot viimeisestä 25% osuuden abstrakteja osio oletus perustuu yleiseen havaintoon, että johtopäätökset poikkeuksetta näyttävät lopulla abstraktin ja muodostavat noin neljännes koko sisällön abstraktilla osiossa.

Perl vakiolausekkeesi käytettiin havaitsemaan liittyviä avainsanoja merkkilangalla-tyyppejä ja /tai syövän tunnusmerkkejä sisältöä, joka poistetaan abstrakti osiosta artikkelin. Hakusanalla sisältävä uutettu sisältöä jaettiin yksikköä yhteen lauseeseen. Jäsentää tällaisen yhden lauseen verrattuna jäsentää koko kappaleen yhtenä kokonaisuutena on raportoitu, jolloin saadaan korkeampi tehokkuus tekstinlouhintavälineiden perustuvan tiedon louhinta [36]. Perl moduuli ”Lingua :: FI :: Lause” käytettiin lauserajan havaitsemista, se hajottaa panos tekstisisällön osaksi lauseita jatkoanalyysille. Lauseet sisältävät sekä laajennettu geenin synonyymejä ja avainsanoja liittyvät merkki-tyypin ja /tai syövän tunnusmerkit käytettiin osoittamaan huomautusta geenin. Asia tunteeton säännöllinen lauseke sovitus toteutettiin havaita lauseita, jotka sisältävät avainsanoja kohteisiin ja geenin synonyymit. Avainsanoja käytetään toiminnallisia kommentointiin geenien nykyisessä tutkimuksessa voidaan karkeasti luokitella seuraaviin kahteen ryhmään:

Marker liittyvät hakusanat:

Terapeuttinen merkki: geeni katsottiin terapeuttista merkin, jos geeni /synonyymi sisältävien lause on yksi tai useampia kohteita siihen liittyvän avainsanan-lista [terapeuttinen tai terapian].

prognostiset merkki: geeni katsottiin ennustavia merkin, jos geeni /synonyymi sisältäviä lauseita on yksi tai useampia kohteita siihen liittyvän avainsanoilla lista [ennustetekijöiden tai prognoosi].

Diagnostic merkki: geeni katsottiin diagnostisen merkin, jos geeni /synonyymi sisältäviä lauseita on yksi tai useampia kohteita siihen liittyvän avainsanan-lista [diagnostisia tai diagnoosia tai ennakoivaa Peng et ai. [13].

Vastaa