PLoS ONE: tunnistaminen Cancer Erityiset Toiminnallisesti merkitykselliset miRNA päässä Gene Expression ja miRNA-to-Gene Networks käyttäminen regularisoitua Regression

tiivistelmä

tunnistaminen microRNA allekirjoituksia eri tyypit ja alatyypit syöpä voi johtaa parempaan havaitsemiseen, luonnehdinta ja ymmärrystä syövän ja siirtää meidät kohti yksilöllisten strategioita. Kuitenkin käyttämällä microRNA n differentiaalikaavojen (kasvain vs. normaali) määrittää allekirjoituksista voi johtaa epätarkkoihin ennusteita ja alhainen tulkittavuutta koska meluisa luonteesta miRNA ekspressiotietojen. Esitämme menetelmän valinta biologisesti aktiivisen MikroRNA geenien ilmentymisen tiedot ja microRNA-to-geenin vuorovaikutuksen kautta. Meidän menetelmä perustuu lineaariregressio joustavalla net laillistamisen. Meidän simulaatiot osoittavat, että meidän menetelmä, aktiivinen miRNA voidaan havaita suurella tarkkuudella ja lähestymistapamme mittaa luotettavasti kovalle melulle ja puuttuvia tietoja. Lisäksi tuloksemme todellisiin tietokokonaisuuksien glioblastoma ja eturauhassyövän vahvistavat microRNA ekspressiomittaukset. Meidän menetelmä johtaa valintaan mahdollisesti funktionaalisesti tärkeitä MikroRNA. Yhteenliittymille joitakin tunnistettu miRNA syövän mekanismeja jo vahvistettu muissa tutkimuksissa (hypoksia liittyvät HSA-mir-210 ja apoptoosiin liittyvien HSA-mir-296-5p). Olemme kartoittaneet myös uusia miRNA, joita ei aiemmin tutkittu yhteydessä syövän mutta johdonmukaisen ennustetaan aktiivisena meidän menetelmällä ja voivat oikeuttaa lisätutkimukset. Koodi on saatavilla Matlab ja R ja voi ladata https://www.cs.toronto.edu/goldenberg/Anna_Goldenberg/Current_Research.html.

Citation: Mezlini AM, Wang B, Deshwar A, Morris Q, Goldenberg A (2013) tunnistaminen Cancer Erityiset Toiminnallisesti merkitykselliset miRNA päässä Gene Expression ja miRNA-to-Gene Networks käyttäminen regularisoitua regressio. PLoS ONE 8 (10): e73168. doi: 10,1371 /journal.pone.0073168

Editor: Xin-Yuan Guan, The University of Hong Kong, Kiina

vastaanotettu: 28 maaliskuu 2013; Hyväksytty: 18 heinäkuu 2013; Julkaistu: 02 lokakuu 2013

Copyright: © 2013 Mezlini et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: No current ulkopuolisen rahoituksen lähteet tässä tutkimuksessa.

kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Koska erittäin konservoitunut tärkeä tekijä transkription jälkeisen sääntelyn , MikroRNA uskotaan olevan merkittävä vaikutus geenien ilmentymistä ja siksi useimmissa biologisten mekanismien ja toimintoja. Välinen yhteys miRNA ja syöpä on tehty useat viimeaikaiset tutkimukset ja arviot [1] – [4]. Uskossa, että miRNA profiilia muutos ei ole vain sivustakatsoja seuraus syövän mutta voi myös olla aktiivinen rooli sen, yhdistellään useita havaintoja. Ensinnäkin, miRNA ilme tiedot osoittavat johdonmukaisen ja radikaaleja muutoksia ilmentymistasoissa välillä kasvain kudosten ja terveen kollegansa. Toiseksi, on havaittu, että monet miRNA sijaitsevat genomin alueille, jotka ovat alttiita CNVs /deleetioita syövän [5]. Lopuksi ja mikä tärkeintä, monet miRNA on osoitettu olevan suora vaikutus syöpään liittyvien mekanismien kuten apoptoosin [6], leviämisen [7], angiogeneesi [8] ja etäpesäkkeiden [9].

Differential analyysi miRNA ekspressioprofiileja syövän vs tervettä kudosta yksinään voi johtaa suuri määrä vääriä positiivisia johtuen meluisa luonteeseen miRNA ekspressiotietojen. Lisäksi meillä on heikko tuntemus kuinka paljon poikkeama ilmentymisessä tietyn miRNA voi aiheuttaa toiminnallisesti merkittäviä muutoksia geenien ilmentyminen. On mahdollista, että geeniekspressioprofiili on erittäin herkkä pienetkin muutokset joissakin miRNA ”määriä samalla rajuja muutoksia muissa miRNA ei ole merkittävää vaikutusta siihen.

Edellinen havaitsemiseksi käytettävistä tärkeitä miRNA syövän tehdä joukko keskeisiä oletuksia. Esimerkiksi RegulatorInference [10] on äskettäin menetelmästä, jolla pyritään löytämään aktiivinen miRNA kautta regressio lähestymistapaa. Implisiittisesti oletetaan, että kaikki geenit vaikuttavat kopioluvun vaihtelut samalla lineaarisesti, ja että vaikutus miRNA on kohdegeenin on lineaarinen sitoutumiskohtien lukumäärä. Lisäksi RegulatorInference käyttää miRNA ekspressiotietojen esivalintana potentiaalisesti aktiivisen miRNA, vaikka tämä vaihe on valinnainen. In [11], geenien ilmentyminen, miRNA ilmaisun ja geeni-geeni vuorovaikutusverkosto käytetään rakentaa otaksuttu monimutkainen miRNA-kohde vaikuttaa verkon miRNA vaikutuksen kertoimet, jotka lasketaan perustuvat miRNA suora /epäsuora vaikutus geenien ja geenituotteiden geeni selityksin vuorovaikutusta.

tässä artikkelissa, me esittää menetelmä ennustamiseksi toiminnallisesti asiaan miRNA välillä ero geenien ilmentyminen tietoja käyttämällä miRNA-geenin vuorovaikutusta tiedon ja mRNA: n ilmentymisen vain. Toisin kuin edellinen menetelmiä, emme käytä miRNA ekspressiotietojen meidän ennusteet ja teemme mitään olettamuksia siitä, miten eri miRNA, CNVs tai vuorovaikutukset voivat vaikuttaa eri geenit. Ajatuksena on valita joukko miRNA vastuussa suurimmasta osasta havaitut muutokset geenien ilmentyminen perustuu aiempaa tietoa olemassa miRNA-geenin vuorovaikutusta ilman ylimääräisiä oletuksia vahvuuksia näiden vuorovaikutusten. Lähestymistapamme perustuu regressiomallin geenin ero ilmaisua. Lisäsimme joustava verkko laillistaminen [12] välttämään overfitting korkeaa datan kohinan ja valitse minimaalinen joukko aktiivisia miRNA. MiRNA ero lauseke tietoja käytetään ainoastaan ​​validointitarkoituksissa. Sikäli tietomme mukaan tämä on ensimmäinen lähestymistapa määrittää aktiivisen miRNA syövän geenien ilmentyminen tietoja vain (ei miRNA data) ja sen vuoksi voimme arvioida toimintaamme käyttämällä ero miRNA ekspressiotietojen samasta potilaista.

meidän simulaatioiden mukaan että menetelmä mittaa luotettavasti useita melua ja puuttuvat tiedot ja että se pystyy ennustamaan asiaa miRNA niin kauan kuin tulo geeniekspressiota muutokset ovat ainakin osittain johtuen miRNA. Käytimme tietoa 157 glioblastoma potilasta ja 111 eturauhassyöpäpotilaalla ja ennustettu useita asiaan miRNA vaikutuksia jotka vahvistettiin miRNA ekspressiomittaukset näihin samoihin potilaista.

Tuloksemme todellisiin tietoihin tunnistettu miRNA joiden roolit aikaisemmin validoitu syöpä kuten mir-210 ja mir-296-5p yhdessä muiden mahdollisesti tärkeitä miRNA: mir-1, mir-154, mir-339-3p, mir-539, mir-561, mir-607 glioblastoma ja asennuspalveli- 143 *, mir-30c-2 *, mir-330-3p, mir-526b ja mir-939 eturauhassyövässä.

Methods

1 Tietojen esikäsittely-

suuri osa vaihtelusta geenin /miRNA ekspressiomittaukset eri kasvainnäytteestä johtuu eri saastumisen terveitä soluja. Tyypillisesti on kasvainkudoksen koostuu terveiden solujen, jonka geeni /miRNA ilmentymisen signaali häiritse syövän signaalin eri määrin eri näytteiden (potilasta).

Käytämme Isopure [13] poimia puhdistetun syöpä signaali kaikille potilaille. Tämä antaa paremman johdonmukaisuutta syöpäpotilaiden ja tarkempia tuloksia miRNA ennustuksen.

2 Normalisoitu differentiaalikaavojen laskenta

Kun olemme puhdistaa kasvain tiedot, otamme log geenin mittausten potilailla ja valvontaa. Sitten jokaiselle potilaalle laskemme normalisoitu ero lauseke yksi geeni tai yksi miRNA mukaan [14] 🙁 1) jossa E ja Y ovat vastaavasti alkuperäisen ja normalisoitu geenien ilmentyminen potilaalle, n ja m ovat vastaavasti numero terveiden valvontaa ja syöpäpotilaat, ja ovat keskimääräisiä ja varianssi ilmaisukeino että geeni terveillä verrokeilla. Termi rankaisee geenejä, joilla on korkea vaihtelut syöpäpotilailla. Samaa normalisointi käytetään miRNA tietojen saamiseksi ero miRNA ilme kasvaimen vs terve näytteitä kun käytämme miRNA ilmaisua validointitarkoituksissa.

3 valitseminen aktiivinen miRNA

määrittää listan aktiivisista miRNA valitsemalla miRNA jotka olisi täytynyt olla aktiivinen havaitaan saatu mRNA ilmaisun muutos rakenteessa poikki genomin. Tarkemmin, mallinnetaan genomin laajuinen muutos mRNA: n ilmentymisen tasot summa tuntematon miRNA vaikutteita. Vaikutteet ovat nollasta panos kaikille miRNA jotka kohdistuvat tietyn geenin. Käytämme miRNA-to-geeni verkkoon geenin kohde- tiedon ja edustaa sitä matriisi. Saimme verkkoon Euroopan bioinformatiikan instituutin (ww.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download. Pl), joka määrätään sarjasta kohdegeenien jokaista miRNA (711 miRNA, 16799 geenit ja 470000 reunat). Jos ei ole havaittavissa vaikutusta miRNA ilmaisun muutoksen tavoitteista ”ilmaisun muutoksen vaikutuksen arvioidaan olevan nolla. Mirna vaikutukset on arvioitu potilasta kohti perusteella. Jos ennustettu miRNA vaikutus on ei-nolla, ja sillä on sama merkki poikki valtaosa potilaista, oletamme, että tietty miRNA on aktiivinen ja voi olla tärkeä tekijä tietyn sairauden. Vuokaavio meidän menetelmä on kuvattu kuvassa 1, ja formulaatio on seuraava: (2) B

Voimme ennustaa aktiivinen miRNA kunkin yksittäisen potilaan, niin tutkimme johdonmukaisuutta aktiivisen miRNA poikki potilaille.

Matrix of mikroRNA-geenin vuorovaikutusta määritellään seuraavasti: (3) B

negatiivisia arvoja matriisissa osoittavat, että miRNA yleensä alas-säädellä geeniekspressiota. Koska tietoa siitä, kuinka paljon tietyn miRNA vaikuttaa tietyn geenin ei ole käytettävissä, kertoimien ratkaisu edustaa ”vaikutus” on miRNA on geeniekspressioprofiili sijaan miRNA ero ilmentymistä (eli kuinka paljon muutoksen geenin ilmentymisen miRNA tavoitteet voidaan katsoa, ​​että tietty miRNA). osoittaa kaksi asiaa: 1) onko miRNA oli aktiivinen (); ja 2), miten se vaikutti ilmaisua, eli onko kohde geenit yliekspressoitu syöpäkudoksen verrattuna normaaliin kudokseen osoittaa, että miRNA tasot köyhdytettyä () tai alle ilmaisi osoittaa yli-ilmentyminen tietyn miRNA () .

Jos vaikutuksen aktiivisen miRNA on sama merkki, jolla on annettu potilaan havaittu miRNA differentiaalikaavojen, sanomme, että miRNA ennustus varmentanut miRNA mittauksista.

Koska haluamme välttää overfitting ja kannustaa mallit pieni määrä aktiivisia miRNA (yksinkertaisempia malleja, joissa vain muutama aktiivinen miRNA on helpompi tulkita ja ovat biologisesti osuvampia), käytämme joustava verkko tyyppiä rangaistus. Tuloksena Kohdefunktio minimoimiseksi on: (4) missä ja ovat joustava verkko parametrien valinta parametrien käsitellään alla. Joustava verkko rangaistus on valittu tässä, koska se pystyy välttää joitakin rajoituksia voimme kohdata käyttämällä yksinkertaista seuraamus kuin [10]. Esimerkiksi, kun meillä on erittäin korreloivat muuttujat (miRNA paljon tavoitteita yhteistä) rangaistus on taipumus valita yhden muuttujan sattumanvaraisesti ja jättää muut, kun taas joustava verkko valitsee kaikki asiaankuuluvat muuttujat.

4 valinta parametrien (cross validointi) B

parametrit joustava verkko määritellä niukkuus ratkaisun: määrä miRNA jotka ennustetaan aktiivisesti ajo geenien erilainen ekspressio. Sen määrittämiseksi, käytimme rajat validointijärjestelmä ehdotettu [12] (Toteutus on saatavana R glmnet paketti). Hyväksyttäviä tuloksia saadaan vastaavat minimaalinen ennustavan virheen käyttäen 10-kertainen syötön validointi. Valitsevat suurimman vastaa ennustevirhe 1 keskivirhe sekä minimaalinen ennustavan virhe voi johtaa tarkempia tuloksia simulaatioissa on vähäisempää melua. Kuitenkin se antaa usein liian harva ratkaisuja, kun ennustevirhe on korkea varianssi, ja siksi käytämme minimaalinen ennustevirhe sopimus kyseisissä tapauksissa. Meidän tulokset, me korjata sama kaikille potilaille on keskimääräistä valitun arvon yli potilaille. Valinnalle toistimme koko kokeen (simulointi ja todellisia tietoja) eri arvoilla (0,1, 0,25, 0,5) eikä merkittäviä havaittu eroja Lopullisessa ennustettu miRNA, joten asetimme 0,25 kaikissa kokeissa.

tulokset

1 simulaatiot ja herkkä melulle

Ensimmäinen testasimme kykyä menetelmämme valita oikein osajoukko geenien ilmentymisen-ajo miRNA keskuudessa asetettu kaikkien miRNA, ja kyky määrittää oikean vaikutteita valitulle miRNA (merkki in (2)). Tätä varten me satunnaisesti valittu 30 miRNA olevan aktiivinen miRNA ajo geenin ilmentyminen muuttuu ja me osoitettu suurten positiivisten tai negatiivisten keskiarvo ilmaus arvot heille (itseisarvo tasaisesti valittu ja merkki on saatu puolueeton kolikon tossing). Olemme määritetty keskiarvo on nolla-arvot kaikille muille miRNA, joita ei ole simuloitu aktiivisena. Sitten simuloitu 100 potilaalla on miRNA ero ekspressioprofiileja keskittynyt niille keskiarvot (Gaussin jakaumalla ja annetaan keskiarvo ja keskihajonta 0,5). Tämän seurauksena saadaan jokaiselle potilaalle joukon miRNA differentiaalikaavojen mittauksia, joissa 30 miRNA simuloitu aktiivisena tullaan johdonmukaisesti ilmentyvät eri ja kaikki muut miRNA tulee edustaa taustakohinaa. Lopuksi, joka vaivaan kerromme miRNA simuloitu ero ilmaisun toimenpiteitä, joita miRNA-geenin vuorovaikutusverkosto (matriisi yhtälössä 2) saada simuloitu geeni differentiaalikaavojen toimenpiteitä (Tämä vaihe on myöhemmin nimitystä geenin ero ilmentymisen simulointi vaihe). Verkko käytetty tässä on sama kuin kohdassa 2.3 ja jonka Euroopan bioinformatiikan instituutin syömällä vuorovaikutukset 711 miRNA ja 16799 geenejä, mediaani miRNA ottaa noin 650 potentiaalinen kohde geenejä.

Tavoitteena Tämän kokeilu on testata, jos ongelma voidaan ratkaista, vaikka miRNA on usein satoja päällekkäisiä mahdollisia kohteita, ja että useita miRNA voi olla vastakkainen vaikutus geeni-ilmentymisen tasolla.

yritti tuhat simulaatioita tuottaa tietoja edellä on kuvattu. Huomasimme, että tapauksista, pystyimme tunnistamaan tarkka satunnaisesti valitun osajoukon miRNA ajo muutoksia geenien ilmentyminen ja oikein ennustaa kaikkia vaikutus merkkejä. Käytännössä tämä tarkoittaa, että meidän menetelmä toimii oikein mistään näytteen todellista tietoa jossa miRNA ”ero lauseke vastaa suhteellisen suuri osuus differentiaalisen ilmentymisen mRNA. Tämä tarkoittaa myös sitä, että johdonmukaisuuden, jossa ryhmät geenit ovat yli /alle ilmaistuna on riittävän vahva signaali havaitsemiseksi aktiivisen miRNA vaikka eri miRNA voi olla vastakkainen vaikutus yhteinen tavoite geenejä.

Seuraavaksi testasimme luotettavuutta meidän menetelmiä erityyppisten melua. Olemme tutkineet vaikutus neljänlaisia ​​ääntä, joka voi tehdä tätä ongelmaa vaikeampi ratkaista:

Me osuus rakenteellinen melu (väärät negatiiviset vuorovaikutukset) on miRNA-geeni verkko lisäämällä satunnainen reunoista ennen geenin differentiaalikaavojen simulointi ja sitten käyttämällä alkuperäistä miRNA-geeni verkoston ennusteita, tuloksena jotkut miRNA vaikutuksen tietoa käytetään tuottamaan tietoja puuttui klo ennusteen vaiheessa.

Me osuus virheellisten reunojen (väärä positiivinen vuorovaikutus) vuonna miRNA-geeni verkko poistamalla satunnainen reunoista ennen geenin differentiaalikaavojen simulointi. Alkuperäinen miRNA-geeni verkkoa käytetään yhä ennusteita.

Me simuloitu vaikutus jätetyn geeni-geeni vuorovaikutusta geenien ilmentymisen (käytämme proteiini-proteiini-vuorovaikutuksen verkko).

Me korottaa kohinaa ekspressiotietojen (lisäämällä Gaussin kohinaa 0-keskiarvo ja varianssi verrannollinen ekspressiotasoja) tilille muita mekanismeja muuttaa geeni-ilmentyminen syövässä kuten kopioluvun vaihteluita.

Kuva 2 esittää vaikutuksen mallinnus puuttuvat /virheellisiä tietoja miRNA-geenin verkkoon. Huomaamme, että menetelmä pystyy suunnilleen mitataan oikea osajoukko miRNA vaikka oletamme, että miRNA-geeni selityksin vuorovaikutukset ovat väärässä (poistamme reunojen verkon kaavion aikana geenin ilmentymisen simulaatio vaihe) tai kun olettaa merkinnät sisältävät vain puolet todellisesta miRNA-geenin vuorovaikutusta (lisäämme reunat aikana geenin ilmentymisen simulaatio vaihe). On näyttöä siitä, että menetelmä on vakaampi puuttuvien tietojen (Väärät negatiiviset reunat) kuin virheellisiä tietoja (vääriä positiivisia reunoja), mikä tarkoittaa, että se on edullista käyttää konservatiivista verkkoja tässä yhteydessä. Kuvio 3 osoittaa luotettavuutta menetelmän kovalle melulle geenien ilmentyminen. Geeniekspressiota melu on parametrized muuttujalla ohjaamalla vahvuus melu: jokaista geeniä, varianssi viimeisen melutyyppien kerrotaan keskimääräinen ekspressiotaso (antaa Poisson tyyppi varianssi). Lopuksi, geeni-geeni vuorovaikutus melua ohjataan diffuusion muuttuja seuraavasti: (5) B-

(A) Herkkyys ja (B) Menetelmän tarkkuuden ennustaa geenin ilmentyminen-ajo miRNA kun vaihtelemalla osuudet virheellisten reunojen ja puuttuu reunat miRNA-Gene vuorovaikutusten verkon (poistaa reunat /lisätään uusi reunat). Kaikki miRNA myös ennustettu olevan oikea suunta vaikutus (vaimentimen vs onkogeeni vaikutus).

(A) Herkkyys ja (B) Menetelmän tarkkuuden ennustamisessa geeni-ilmentymisen-ajo miRNA kun vaihteleva taso geenin-vuorovaikutusten kohinaa (kautta diffuusio parametri) ja intensiteetti melun ero geeni-ilmentymisen tason kautta (muuttuja). Kaikki ennustettu miRNA on oikea vaikutus merkkejä.

Missä on geeni ero ekspressiovektori, on geeni-geeni suorassa vuorovaikutuksessa matriisi ja on matriisi, jossa toisen asteen geeni-geeni vuorovaikutuksia (toisen kertaluvun naapurit geeni-geeni vuorovaikutusten verkon edustus). Tämä tarkoittaa geeniekspression vaikuttaa jonkin verran ilmentymisen vuorovaikutuksessa geenien (lähinaapurit) ja pienemmässä määrin geenit vuorovaikutuksessa lähinaapurit (toisen kertaluvun naapureita). Geeni-geeni vuorovaikutusverkosto käytimme tässä osajoukko yhdistetyn henkilöverkolle ladata Biogrid verkkosivuilla. Se tallentaa tietoa 16799 geenejä, jotka ovat läsnä meidän miRNA-geenin verkko ja se sisältää 85590 reunat. Kuvio 3 osoittaa, että kyky menetelmämme palauttaa tosi miRNA on korkea vaikka läsnä muita vaikutteita, kuten vaikuttaa vuorovaikutuksessa geenien, joka meidän malli ei ota huomioon. Meidän simuloinnin tulokset osoittavat, että menetelmä on vankka erilaisiin melua.

2 Analyysi syöpätietojen

2.1 Arviointiperusteet.

Käyttämällä menetelmää, me ennusti toiminnallisesti asiaankuuluvat miRNA ja niiden vaikutus geenin ilmentyminen ero geenien ilmentyminen tietoja glioblastoma multiforme ja eturauhasen syövät. Koska meidän ennusteet ovat potilasta kohti pohjalta valitsemme ne miRNA jotka ennustivat aktiivinen () kanssa samaan suuntaan vaikuttamiskanava yli potilaista. Nämä miRNA ovat todennäköisesti heijastaa todellista biologista mekanismia yhteinen syövän, koska ne olivat johdonmukaisesti ennustettu aktiivisena meidän menetelmällä on lukuisia itsenäisiä potilailla. Sitten katsomme miRNA ”ekspressiomittaukset saman potilaille. Jos aktiivinen miRNA ”ero ilmaisuilla on sama merkkejä kuin niiden ennustetaan vaikutteita enemmän kuin potilaista, pidämme niitä validoitu miRNA mittauksia.

miRNA ero ekspressiotietojen, jotkut miRNA ovat johdonmukaisesti yli- tai alle ilmaisi poikki potilaat ja jotkut eivät. Arvioimme merkitys meidän aktiivista miRNA asettamien laskemalla p-arvo: todennäköisyys jolla yhtä hyvä tai parempi validointi tuloksia kuin menetelmässä, jos miRNA ennustukset olivat satunnaisia.

Laskemme että p-arvo ensin valitaan satunnaisesti osajoukko miRNA tiedoista, asetetun koon sama määrä miRNA ennusti aktiivisena meidän menetelmällä. Sitten me satunnaisesti määrittää suunnan vaikutus (merkkejä) kohteeksi valittuihin miRNA. Lopuksi arvioimme osa näistä satunnaisia ​​ennustukset että validoi miRNA mittaukset käyttämällä miRNA tiedot vastaavat samaa tutkituilla potilailla (a miRNA on validoitu, jos se on johdonmukaisesti yliekspressoitu /under-ilmaisi kun sen vaikutus merkki on vastaavasti positiivinen /negatiivinen). Toistamme tätä kokeilua 10000 kertaa. P-arvo on osuutta satunnainen kokeiluja korkeampi validointi nopeudella kuin meidän menetelmää ennustuksen. Pieni tarpeeksi p-arvo osoittaa, että miRNA valitsemat menetelmämme eivät olleet satunnaisia ​​ja että todennäköisesti on toiminnallinen merkitys suhteessa syövän osoittamaan yhdenmukaisuutta miRNA /geeniekspression poikki potilailla.

2.2 Glioblastoma .

glioblastoma geenien ilmentyminen tietojen tuotettiin Broad Institute käyttämällä Affymetrix HT_HG-U133A koesuunnittelun. Se sisältää 157 kasvain tapauksissa ja 10 ohjaa. Tämä data yhdessä miRNA ilmaisua käytämme validointi löytyvät TCGA verkkosivuilla.

Kun puhdistamalla geenien ilmentyminen tietoja (katso kohta 2.1) ja muuttaa sen normalisoitu ero lauseke (katso kohta 2.2), ennustimme 11 miRNA aktiivinen useammassa kuin potilaista. Näistä 11 miRNA ennustukset, 7 todensi käytettävissä miRNA lauseke (todennettu yli tapauksista) ja 2 muuta tarkastettiin yli tapauksista. Nämä tulokset vastaavat p-arvo 0,0005 (katso kohta 3.2.1 lisää yksityiskohtia). Kuvio 4 esittää miRNA johdonmukaisesti ennustettu koko potilailla. Niistä miRNA joka ennustettiin ja vahvistettiin, löysimme mir-210, mir-339-3p, mir-561, mir-1, mir-154, mir-539, mir-607.

Pink on yliekspressoidaan miRNA ja sininen on alle-ilmaistuna. Jokainen sarake edustaa potilaan ja jokainen krs miRNA.

miR-210 on indusoituva hypoksia ja aiemmin tunnistettu itsenäinen merkki useiden syöpien (rintojen [15], haima [16], pää ja niska [17]). Se on myös mainittu säätelijänä varten Normoxic geenien ilmentymisen, joka on mukana kasvain aloittamista [18]. Me ennusti sen aktiivisina ja vahvisti sen yli-ilmentyminen aktiivisuuden avulla havaitaan tietoja glioblastoma.

Myös ennustettu ja vahvisti yli-ilmentyminen mir-339-3p, ja alle-ilmentymisen mir-1, mir-154, mir-539, mir-561 ja mir-607. Tällä hetkellä ei ole olemassa tietoa toiminnallisten roolien näiden miRNA syövässä. Lisävalidointia kokeita tarvitaan ymmärtämään paremmin toiminnan näiden miRNA glioblastoma. mir-548b-5p, mir-548c-3p, mir-548c-5p myös ennusti melkein kaikilla potilailla, vaikka niiden kohdegeenin sarjaa olivat hyvin erilaisia, mutta ne olivat vain validoitu vastaavasti, tapauksista.

2.3 eturauhassyöpä.

eturauhassyövän data tuotettiin Memorial Sloan-Kettering Cancer Center (MSKCC) ja on saatavana GEO tulonumerolla GSE21032. Aineisto sisältää tietoja 111 potilasta ja 28 säätimet, jotka sekä geeni ja miRNA ilmentymisen tiedot ovat saatavissa.

Kun jälkikäsittely geenien ilmentyminen tietojen saamiseksi puhdistettua normalisoitu ero ilmaisun ja käyttämällä menetelmää ennustaa sarjaa aktiivisten miRNA jokaiselle potilaalle, valitsimme 10 miRNA: 7 näistä miRNA validoitiin käyttäen tarkkailtavan miRNA ekspressiotietojen yli potilailla, vahvistaa suuntaan miRNA vaikutuksesta. Toinen miRNA: mir-574-5p oli validoitu potilaista. Nämä tulokset vastaavat tilastollisesti merkitsevä p-arvo.

joukossa miRNA joka ennustettiin ja vahvistettiin, mir-210 oli yli-ilmentynyt samalla havaintomme että glioblastooma data, ja mir-296-5p ( yliekspressoidaan) oli aikaisemmin liittynyt apoptoosin androgeenista riippumaton eturauhassyöpä solujen [19] mir-143 * ennustettiin ja vahvisti havaitun datan alle ilmaistu kaikilla potilailla, mutta ei aiemmin mainittu syöpämarkkerina kirjallisuudessa . Samoin mir-30c-2 *, mir-526b, mir-330-3p ja mir-939 (kaikki ennustettu ja vahvistettiin yliekspressoitujen) olivat satunnaisesti mainittiin ilmennetty eri miRNA syövän kirjallisuudessa, mutta ilman kiinteitä kokeellista näyttöä luonnehtivat tarkka rooleja syövissä vielä.

Lopuksi mir-569 ja mir-607 oli ennustettu enemmistö sekä eturauhassyövän ja glioblastooma potilaita vaan vasta validoitu glioblastoma koska niitä ei mitattu eturauhassyöpää tietoja. Samoin mir-574-5p ennustettiin molemmissa aineistoja mutta sen mitat olivat ole käytettävissä glioblastoma potilaille, joten se oli vain vahvisti eturauhassyövän.

tiivistelmä tuloksemme korkeimmalla validointi hinnat eturauhassyövässä ja glioblastooma on kuvattu kuviossa 4.

keskustelu

tässä tutkimuksessa esitettiin ensimmäistä menetelmää, joka ennustaa aktiivinen miRNA syövän päässä miRNA-geenin sääntelyverkon ja mRNA: n ilmentymisen tiedot turvautumatta miRNA ilme itse. Käytämme elastinen verkko-tasoittuvan regressio puitteet tehdä näitä ennusteita voimakkaasti. Koska mRNA ilmaisu ei useinkaan helposti saatavilla, meidän menetelmää voidaan käyttää ohjaamaan analysointiin miRNA priorisoimalla ne myöhempää kokeita. Me validoitu menetelmämme käyttäen sekä simuloinnin ja todellisia tietoja yhdistettynä miRNA ekspressiomittaukset vahvistaa havaintomme. Meidän simulaatiot ovat osoittaneet, että menetelmä vahvasti tunnistaa aktiivinen miRNA ja suuntaa niiden vaikutus (vaimentimet tai onkogeenien) maailmanlaajuisesta geeniekspressiomalleja. Tuloksemme todellisiin tietoihin osoitti mahdollisesti tärkeä miRNA glioblastoma ja eturauhassyövän, joista osa on jo validoitu aiemmissa tutkimuksissa (Sen hypoksia liittyvä mir-210 ja eturauhasen syöpäsolun apoptoosiin liittyviä mir-296-5p) ja muut, joille tarkat rooli syövän on vielä määrittämättä.

Future parannuksia meidän menetelmä liittyvät läheisesti paremmin mallinnus datan häiriöt. Esimerkiksi huomioon ottaen ilmaisun muutoksia, joita indusoi karyotyyppitutkiraus muunnelmia tai kopioida numeron vaihtelut syövän auttaisi eristää vaikutus toiminnallisesti asiaan miRNA, etenkin jos vaikutus näiden muunnelmia geenien ilmentymisen on tarkasti ymmärretään ja mallinnettu tulevaisuudessa. Parempia tuloksia voidaan saavuttaa, jos meillä on hyvä malli geenin-geenin vuorovaikutusta, joka voi muuttaa ilmentymisen riippumatta miRNA.

Vastaa