PLoS ONE: Kestävä valinta Algoritmi (RSA) Multi-omic biomarkkereiden Discovery; Integrointi Functional Network Analysis tunnistaa miRNA valvotuilla Pathways in Multiple Syövät

tiivistelmä

MikroRNA (miRNA) on ratkaiseva rooli ylläpidossa solun homeostaasin säätelemällä mielipiteenilmaisun kohdegeenien. Sinänsä dysregulaatio miRNA ilmentyminen on usein yhdistetty syöpään. Nopeasti varaamiseen molekyylitason tietoja, jotka liittyvät potilaiden hoitotuloksiin, tarve tunnistamiseen vankka usean omic molekyylimarkkereina on kriittinen, jotta kliinistä vaikutusta. Vaikka edellinen bioinformatiikan välineitä on kehitetty tunnistamaan mahdolliset biomarkkereita syövän, nämä menetelmät eivät mahdollista nopeaa luokitteluun onkogeenien versus tuumorisuppressoreilla ottaen huomioon kestävä differentiaalikaavojen, cutoffs, p-arvot ja ei-normaalisuus tietoja. Tässä ehdotamme menetelmää, Robust valinta algoritmi (RSA), jossa käsitellään näitä tärkeitä ongelmia iso data omiikka-analyysi. Vilkkaus selviytymisen analyysin varmistetaan tunnistaminen optimaaliset raja-arvot omiikka ilmaisun, vahvistaa p-arvo lasketaan intensiivisellä satunnainen resampling ottaen huomioon mahdolliset ei-normaalisuus datan ja integroitumista multi-omic toiminnallisia verkkoja. Tässä olemme analysoineet yleiseurooppalainen syövän miRNA potilastietojen tunnistamiseen toiminnallinen reittejä osallisina syövän etenemiseen, jotka liittyvät valittuun miRNA tunnistaa RSA. Lähestymistapamme osoittaa miten nykyiset eloonjääminen analyysi tekniikoita voidaan integroida toimiva verkko analyysi puitteet tehokkaaseen tunnistamiseen lupaavia biomarkkereita ja uusia terapeuttisia ehdokkaita ympäri sairauksia.

Citation: Sehgal V, Seviour EG, Moss TJ, Mills GB, Azencott R, Ram PT (2015) Tukeva valinta algoritmi (RSA) Multi-omic biomarkkereiden Discovery; Integrointi Functional Network Analysis tunnistaa miRNA valvotuilla Pathways in Multiple Syövät. PLoS ONE 10 (10): e0140072. doi: 10,1371 /journal.pone.0140072

Editor: Xia Li, Harbin Medical University, Kiina

vastaanotettu: toukokuu 21, 2015; Hyväksytty: 20 syyskuu 2015; Julkaistu: 27 lokakuu 2015

Copyright: © 2015 Sehgal ym. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään

Data Saatavuus: Tiedot me ovat käyttäneet saatiin TCGA ja hakuparametrit ja kopioidut tiedot on selitetty menetelmät jaksossa. TCGA tiedot löytyvät tämän URL https://tcga-data.nci.nih.gov/tcga/dataAccessMatrix.htm.

Rahoitus: työ esitetään tässä tuetaan osittain National Institutes of Health (NIH ) U54-CA112970 ja Blanton-Davis munasarjasyöpä Foundation (PTR). TJM tukee koulutusta apurahan päässä Keck Center of Gulf Coast Consortium (NLM T15LM007093) ja Odyssey Program University of Texas MD Anderson Cancer Center. VS tukee koulutusta apurahan päässä CPRIT Computational syöpäbiologian koulutusohjelma (CPRIT RP101489).

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

MikroRNA (miRNA) ovat pieniä koodaamattomalla RNA säätimiä, jotka sitoutuvat komplementtijaksoja kohde RNA: iden (mRNA: t), jolloin kohde-mRNA: ”translaation tukahduttaminen tai hajoamista. MiRNA voi myös sitoutua komplementaariset sekvenssit promoottorialueella kohdegeenien ja aiheuttaa transkription aktivaation [1, 2]. Täten muutokset miRNA ilmentyminen vaikuttaa geenisäätelyn, mikä puolestaan ​​johtaa muutoksiin solujen homeostatic vakauden [3, 4].

Useita miRNA on osoitettu olevan tärkeä rooli syövän [5-7]; ja tutkimukset ovat myös osoittaneet, että yli 50% miRNA geenit sijaitsevat syöpään liittyvän genomisen alueilla [8]. Monet miRNA on osoitettu olevan ratkaiseva roolit syöpää aiheuttavaa oncomiRs tai kasvaimia estävä MIRS [9]. Esimerkiksi miR-21 on hyvin tutkittu oncomiR että ylössäädellään monissa eri syövissä, [10, 11]. ja sillä on tärkeä rooli lääkeresistenssin [12]. Jäsenet miR-17-92 perheen toimia myös merkittävä oncomiRs [13] ja voivat edistää syövän kehitystä negatiivisesti säätelemällä tuumorisuppressorigeeneille. Toisaalta, miRNA kaltaisia ​​let-7 perheen toimivat tuumorisuppressoriproteiinia MIRS [14-16] ja voivat estää syöpää estämällä onkogeenien ja säätötoimintoa kuten apoptoosin ja solujen erilaistumista.

Useat ryhmät ovat tutkineet kapasiteettia miRNA käytettäväksi biomarkkereita tiettyjen syöpien [17-22]. Useimmissa näistä tutkimuksista, tutkijat käyttivät sekvensointi, mikrosiruja tai PCR-pohjaiset tekniikat maailmanlaajuiseen profilointiin miRNA, ja ovat siten tunnistaneet useita miRNA että tärkeä rooli syövän. Nämä lähestymistavat kärsivät useista rajoituksista. Kuten esitetään meidän paperi, nykyinen menetelmiä analysointiin miRNA tai muiden omiikka tietoja, jotka ovat riippuvaisia ​​mielivaltaisia ​​valintoja kuten poiminta kynnysarvot erottamiseksi potilaita korkea ja matala ilme ryhmät voivat olla

erittäin herkkä

pienille satunnainen vaihtelu potilaat ryhmä, jonka seurauksena suurin vääriä löytö määrä. Niinpä esittelemme innovatiivinen vankka systeemianalyysin joissa miRNA on kytketty potilaan eloonjäämisen tuloksia eri syöpätyyppejä entistä nopeammin ja tehokkaammin tunnistaa mahdolliset oncomiRs ja kasvaimia estävä Mirs.

Toinen rajoitus virran menetelmiä on korkea tunnistettuja miRNA ja siihen liittyvä vaikeus validointi niin paljon miRNA kokeellisesti. Jotta rajata määrä miRNA niille, joilla on parhaat mahdollisuudet useita syöpätyyppejä, me hankki lisäksi integroida toiminnallisten verkostoanalyysiä. Ensisijainen tehtävä miRNA on säätelyssä mRNA-tasot solussa sitoutumalla sekvenssit 3 ’UTR mRNA, joka muuttaa vakaan tilan tasot mRNA ja myöhempi muutos funktionaalisessa lähtö geenin [23 -25]. Siksi pyrimme tunnistamaan toiminnallisia miRNA-mRNA verkkojen perustuu korrelaation miRNA ja mRNA: n ilmentymisen tasot potilaalla kasvaimissa, joissa miRNA osoittivat kliinistä merkitystä.

Kun räjähdysmäisen kasvun tietojen määrä, joka syntyy potilasnäytteistä mittaamalla eri molekyyli- ominaisuudet klo omiikka tai maailmanlaajuisesti kustakin potilaasta, kehittäminen täydentävien bioinformatiikan ja systeemibiologian analyysityökaluja on välttämätöntä. Olemme tässä ehdottaa työnkulku, joka yhdistää selviytyminen analyysi omiikka tietojen toiminnallinen verkko analyysitekniikoita tunnistaa mahdollisia miRNA biomarkkereiden ja polkuja ne vaikuttavat siirtoa eri syöpätyyppeihin. Koska meidän lähestymistapa otetaan huomioon mahdolliset

epälineaarinen

toiminnallisia suhteita potentiaalisten markkereiden ”ekspressiotasot ja potilaiden eloonjäämisen tuloksiin, sen suorituskyky ylittää perinteiset Korrelaatioanalyysin, joka rajoittuu löytämässä noin

lineaarinen

toimivia ihmissuhteita. Lisäksi ehdotamme epäparametrinen tietojen analysointi tekniikoita, joista ei ole implisiittisesti normaaliuden oletuksia jakamisesta geeniekspressiotasot tarvitaan, koska suurin osa omiikka tiedot eivät noudata normaalijakaumaa. Tässä tutkimuksessa olemme osoittaneet tämän menettelyn hyödyllisyyden käyttää potilaan aineistoja The Cancer Genome Atlas (TCGA) tunnistaa prognostisia biomarkkereita ja edelleen validoineet ehdotetun työnkulun käyttäen aiemmin julkaistu aineisto.

Methods

koska pyrimme tunnistamaan miRNA jotka toimivat joko tuumorisuppressoreilla tai oncomiRs, me luokitellaan kukin miRNA voimakkaiden vaikutukset suhteessa potilaan survivalas ole korkeaa ilmaisu liittyy hyvä potilas eloonjäämisen (GS miRNA) tai korkea ilmaisun yhteydessä heikkoon elossaololuku (PS miRNA). Tarkastelimme potilaan tiedot hoitotuloksia ja miRNA ekspressiotasot; olemme kehittäneet uuden Kestävä valinta-algoritmin (RSA), jota käytetään luokittelemaan miRNA, koska ne liittyvät joko hyvä tai huono selviytymistä. Otimme ja lasketaan innovatiivisen

vankka p-arvo

määrällisesti vaikutusta kunkin ehdokkaan miRNA hyviä tai huono selviytyminen (kuvio 1A ja kuvio A ja kuvio B S1 File). Osoittaakseen ehdotettu työnkulun, haimme meidän RSA ja myöhemmin toimivien reittien analyysi TCGA aineistoja viiden syöpätyyppejä: rinta-, munasarja-, pään ja kaulan, keuhko-, ja munuaisissa (hyödyllisten tietojen lataamista tämä tieto löytyy S1 taulukko).

(A) Kaavamainen näyttämällä yleiskuvan RSA. Tulot ovat kliiniset tiedot ja miRNA ekspressiotietojen; tulokset ovat ehdokas miRNA korreloi joko hyvä tai huono selviytymistä. (B) validointi RSA käyttäen aiemmin julkaistu geeni allekirjoitukset korreloi selviytymisen tuloksia. Käytimme RSA rintasyöpään aineisto Martin et al. Ja tarkasteltiin päällekkäisyys geenien korreloi hyvän ja huonon selviytymistä laskea RSA ja niiden tuloksista. Heatmap näistä päällekkäisten geenien vedettiin näyttämällä korkean geenin intensiteetin keltainen ja alhaisen geenin intensiteetin sinisellä.

Data ja esikäsittely

TCGA sisältää erilaisia ​​omiikka tietojen kuten miRNA ilme, mRNA ilme. Se sisältää myös kliiniset tiedot näistä potilaista antavat tietoa selviytymisen näillä potilailla. Erilaisten syöpäpotilaiden RNA-sekvenssin tietoja TCGA, poimimamme kunkin miRNA keskimääräinen kypsä ja tähti lohkon ilmaisua erikseen. TCGA on tietoja saatavilla miRNAseq muodossa, ja pystyimme etsimään 2092 miRNA (yhteensä miRNA, joista tietoja on saatavilla) tunnistaa ehdokas miRNA jonka differentiaalikaavojen korreloi selviytymisen.

TCGA miRNA ekspressiotietojen hankitaan käyttämällä joko Illumina Hiseq tai Illumina GA alustalla. Running alkuperäistä analyysejä näillä alustoilla erikseen tuotti erilaisia ​​tuloksia. Sitten tutkittiin näiden alustojen ”miRNA ilme jakaumat onko voisimme yhdistää kahden alustan näytteitä saada suuremman määrän potilaan näytteitä. Vertailla kahta alustojen ”miRNA jakaumia, me soveltanut Kolmogorov-Smirnov testi käyttäen hypoteesia, että nämä kaksi jakaumat ovat samat 5% merkitystä. Tämä auttoi meitä tunnistamaan mikä miRNA oli sama (joskin vastaavasti selvä) jakaumat molemmissa ympäristöissä.

latasivat myös kliiniset tiedot kunkin 5 syöpätyyppien edellä mainitut alkaen TCGA. Näistä tiedoista poimimamme potilaiden eloonjäämisen kertoja, kunnes kuolema tai sensurointi. Useat potilastiedot TCGA oli selityksin olevan mitään seuranta-ajan ja siten systemaattisesti poistettiin meidän lopullinen aineisto analyysi. Sitten Hyväksytty potilaat, joille kliiniset ja RNA-sekvenssin tietoja oli saatavissa.

homogenizing Data alustojen

TCGA miRNA ilmaisun tiedot eri syöpätyyppejä olivat yleensä hankittu eri alustoille. Normalisoida miRNA ekspressiotasot ja korjata esineitä vuoksi luonti eri hankinta säännöt, me yhdistettiin kaikki käytettävissä TCGA miRNA ekspressiotietojen ja altistettiin se on homogenointitoimenpiteessä kuten selostetaan tarkemmin tässä jaksossa. Sitten käytimme näitä normalisoidut arvot meidän lopullinen aineisto analyysi. Tämä homogenointitoimenpiteessä on tärkeä, koska se korjaa datan esineistöä vuoksi luonti kautta eri alustoilla ja hankinta säännöt.

Kaksi Laiturien miRNA jakaumat eivät olleet kovin samankaltaisia, ja näin ei voi yhdistää käyttämällä tavallista mediaani normalisointi askel . Siksi olemme suorittaneet seuraavat homogenointi menettelyn yhdistää alustojen ”miRNA lauseke jakaumat kullekin syöpätyypin. Saadakseen identtinen kertymäfunktio (CDF) homogenisoitua ilmaisun saatavia arvoja molemmilla alustoilla, meillä homogenisoitiin kaksi miRNA ilmaisu jakaumat johdettu kahdesta alustoilla. ”Tavoite” CDF määritellään keskiarvo CDF kahden alustoja, nimittäin

F (x) = 0

.

5F1 (x) + 0

.

5F2 (x ) B, jossa F1 ja F2 ovat CDF: n kahden alustojen vastaavasti. Olkoon

G

olla käänteisfunktio

F

. Jokainen ilme arvo

x

laiturilta 1 sovitetaan homogenoidun ilme arvo,

z (x) B, joka lasketaan kääntämällä toiminnon

F

arvossa

F1 (x) B; Näin,

z (x) = G (F1 (x))

. Jokainen ilme arvo laiturilta 2 homogenisoidaan samalla, jossa

z (y) = G (F2 (y))

.

mitään arvoa, 0≤ K ≤ 1, {F (z (x)) ≤ K} joss {z (x) ≤ G (K)} joss {G (F1 (x)) ≤ G (K)} joss {F1 (x) ≤ K}, ja vastaavasti {F ( z (y)) ≤ K} joss {z (y) ≤ G (K)} joss {G (F2 (y)) ≤ G (K)} joss {F2 (y) ≤ K}.

Näin ollen meidän ottelu quantiles

x

ja

y

erillisessä jakaumat niiden quantiles

z (x) B ja

z (y) B yhdistetyssä jakelu

F

.

Kestävä valinta algoritmi

kirjallisuushaku suoritettiin tunnistaa menetelmiä, joita voitaisiin käyttää parantamaan nykyisiä arviointimenetelmiä miRNA ja tunnistaminen syöpään liittyvien reittien ne vaikuttavat. Havaitsimme yhdessä tutkimuksessa, jossa arvioitiin ennustetekijöiden arvot tiettyjen miRNA useissa syöpätyypeissä [26]; olemme kuitenkin tarkistanut, että metodologiaa [26] on potentiaalisesti varsin herkkä pienetkin häiriöt nykyisten potilaiden ryhmässä, ja olemme vahvistanut tämän epävakauden soveltamalla sitä tietojemme.

Voit testata herkkyyttä menetelmää potilaan ryhmään, käytimme munuaissyöpää aineisto ladattavissa TCGA. Tästä aineisto, loimme 100 simuloitu aineistoja satunnaisesti pudottamalla 2% potilaista molemmissa simuloidussa aineisto. Jokaisena simuloitu aineisto, me sitten käytetty metodologia [26] ja valitse MIRS korreloivat voimakkaasti potilaan selviytymistä. Tällä tavoin saimme 100 luettelot valittu miRNA. Sitten lueteltu kaikki ne miRNA joka ilmestyi 99 tai useampi näistä 100 luetteloita. Vakaus menetelmää karakterisoidaan sitten katsomalla histogrammin osa on valittu miRNA, jotka olivat stabiileja. Koska 2% vaihtelua potilasryhmissä on pieni vaihtelu, meidän pitäisi vaatia vakaa metodologia valitsemaan samantyyppisiä miRNA toistuvasti. Kuitenkin meidän simulaatiot viittaavat siihen, että metodologia [26] valitsee vain 68% vakaa miRNA, jossa loput herkkä erityinen koostumus potilaan ryhmässä (katso S30 kuvio varten määrällinen miten pienet muutokset tietoihin voivat johtaa suuri väheneminen vakautta tunnistettu biomarkkereita).

Lisäksi tämä ja muut tällaiset tutkimukset, usein käyttää yhtä kynnystä ekspressiotietojen vertailla eloonjäämiskäyrien, ja antaa tulokset ehdokas miRNA varten syövän tyyppiään aika. Siksi olemme kehittäneet vankan valinta-algoritmin (RSA), joka käyttää ei-parametrinen tilastollinen yhteinen analyysi elossaololuku tietojen ja potilaskohtaista miRNA ekspressiotasot määrällisesti ennusteen arvioinnissa kunkin miRNA. Toisin menetelmiä käyttää yhtä kynnystä vertailla Eloonjääntitulokset, meidän RSA poistaa käytöstä yhden kynnyksen Kaplan-Meier selviytymisen käyräanalyysi, valitsemalla monenlaisia ​​cutoffs peräisin ilmaisun dataa useita tilastollisesti raja-arvot. Siten suorituskyky meidän RSA on melko vastustuskykyinen pieniä satunnaisia ​​häiriöitä potilaiden ryhmässä.

Kliinisesti miRNA jonka ilmaisuja liittyvät eri toimet saavat erilaisen kohtelun. Esimerkiksi miRNA jonka korkea ilmentyminen korreloi pidempi eloonjäämisen (ts tuumorisuppressorit) käsitellään eri tavoin eri jonka korkea ilmentyminen korreloi lyhyempi elinaika (ts oncomiRs). Siksi meidän ensimmäinen luokitella jokaisen miRNA kuin GS miRNA (high ilmaisu-hyvä selviytyminen) tai PS miRNA (high ilmaisu-huono selviytyminen). Tämä alustava luokitus vaihe suoritetaan ensin laskemalla mediaani elinaika kaikkien saatavilla potilaista, alkaen Kaplan-Meier eloonjäämisennusteet ja sitten luokittelemalla miRNA seuraavasti.

Käyttäen TCGA tiedot, ensin laskea Kaplan-Meier on sensuroitu elinaika potilaiden, jossa miRNA ilmaistaan. Tämän jälkeen käytämme ilmaisua histogrammitietoja tunnistaa kaksi potilasryhmille: potilaat, joilla on korkea miRNA ilmaisun ja potilailla, joilla on alhainen miRNA ilme. Kunkin miRNA,

m

j

, erotamme potilaita korkea miRNA ilmaisu tai matala miRNA ilmaisu ryhmien avulla rajallinen verkkoon cut-off,

C

, että vaihtelevat 45%: kvantiili kuin 60% kvantiili jakelun ekspressiotasot askelin 1%. Jokaisessa tällaista cut-off

C

määrittelemme

G

korkean

= potilasryhmässä, joilla on korkea miRNA ilme = ryhmä jossa miRNA ilme on suurempi kuin (

C

+4) quantile ilmaisun tasoilla jakelu

G

matalan

= potilasryhmässä alhaisen miRNA ilme = ryhmä jossa miRNA ilmaisu on pienempi kuin

C

quantile ilmaisun tasoilla jakelu

korkea miRNA ilmaisun ja alhainen miRNA ilmaisun ryhmiä on erotettu ” neutraali ”ryhmä, jossa miRNA ilmentymisen tasot ovat välillä

C

% ja (

C

+4)%. Tämä 4% marginaali voidaan lisätä heikentämättä analyysiä kunhan korkea miRNA ilmaisun ja alhainen miRNA ilmaisun ryhmät ovat kohtuullisen suuri.

Kunkin sulku C%, me erikseen laskea Kaplan-Meier selviytymisen käyrät

G

korkea

ja

G

matalan

ryhmiä. Log-rank-testiä käytetään arvioimaan ero kahden Kaplan-Meier selviytymisen käyrät, ja p-arvo,

PVAL (C) B, lasketaan. Nollahypoteesi log rank-testi on se, että kaksi selviytyminen käyrät ovat samat. Optimaalinen cut-off

C%

erottamiseksi potilaita

G

korkea

tai

G

pieni

valitaan minimoimaan

PVAL (C)

. Olkoon

q

j

olla optimaalinen valitun raja-kullekin miRNA

m

j

. Jokaista miRNA

m

j

laskemme mediaani eloonjäämisajasta potilaiden korkean miRNA ilmaisu ryhmä (

Med

high

) ja potilaille alhaisen miRNA ilmaisu ryhmä (

Med

matalan

) optimaalisella cut-off

qj

. Sitten luokitella miRNA seuraaviin kahteen ryhmään:

Esimerkkejä tämän tyyppisestä miRNA luonnehdinta on esitetty kuviossa B S1 tiedosto. Jokaista miRNA m

j kuuluvan GS tai PS ryhmiä, edellisen laskennan myös antaa meille

j = PVAL (q

j

) B , joka määrittää merkitys välinen mahdollinen yhteys miRNA

m

j

ja potilaiden elinaika. Kaplan-Meier selviytymisen tontteja potilailla, joilla on viiden merkittävän ehdokas miRNA kohteisiin eri syöpätyyppejä yhdessä eloonjäämisaste käyrä potilailla, joilla että syöpätyypin näkyvät S27 ja S28 kuvioissa.

Generation of Tukeva p- arvot

Olemme toistuvasti totesi, että p-arvot lasketaan edelliseen menetelmä voi olla hieman ymmärtävät niitä potilaita ryhmään. Poistaa tämän herkkyyden, esittelemme ja soveltaa innovatiivinen resampling menettely tuottaa

vankka p-arvot

. Menetelmä on kuvattu edeltävässä osassa käytetään määrittämään, onko miRNA ilmaisu on mahdollinen epälineaarinen merkittävää korrelaatiota selviytymistä. Jokaista GS miRNA tai PS miRNA esittelemme satunnainen resampling tekniikka laskemaan vankka p-arvo,

PV (M

j

) B, ja korvaa edellisen p-arvo,

pv (m

j

)

. Tämän toteuttamiseksi rs, jokaisen cut-off

C%

ja jokainen kiinteä miRNA

m

j

, me satunnaisesti pudottaa 1% potilaista kustakin kaksi ryhmää

G

korkea

ja

G

matalan

. ja laskemme Kaplan-Meierin eloonjäämiskäyrissä näiden kahden levoton potilaiden ryhmää.

Kuten edellä, ensin laskea optimaalinen cut-off parhaiten erottaa miRNA ilme, joka perustui häirityn Kaplan-Meier selviytymisen tontteja ja sitten laskea p-arvo

pv (m) B tai selviytymistä tässä optimaalinen cut-off. Jokaista kiinteä miRNA

m

j

, toistamalla satunnaistettu häiriön prosessi 500 kertaa generoi joukon 500 virtuaalisen p-arvot

pv (m) B. Luotettavasti määritellä yläraja-

PV (m

j

) B tuntemattoman p-arvo

PVL (m

j

) B, asetamme

PV (m

j

) B olevan yhtä suuri kuin 75

persentiili 500 virtuaalisen p-arvot. Me kutsumme

PV (p

j

)

vankka p-arvo

for miRNA

m

j

. MiRNA

m

j

merkittäviä vankka p-arvot

PV (m

j

)

sitten luokiteltu ehdokas miRNA jotka korreloivat hyvä tai huono selviytyminen, mikä tarjoaa luettelon miRNA joiden differentiaalikaavojen korreloi joko hyvä tai huono selviytyminen kertaa. Kaavamaisen algoritmin esitetään S29 kuvassa.

analyysimme, me hylätä kaikki miRNA jotka ovat keskimäärin 0 ilmentymistä potilasryhmässä. Lisäksi TCGA näytteitä olevaksi, joilla ei seurata aikaa ei sisällytetty analyysimme.

syöpätyyppeihin

Tunnistaa ehdokas miRNA jonka differentiaalikaavojen on vahvasti sidoksissa enemmän kuin yksi syöpä tyyppi, käytimme meidän RSA useisiin syöpäpotilaan aineistot saatavilla TCGA. Käytimme meidän RSA että aineistoja syöpätyyppien edustettuna ainakin 400 näytettä ja jotka vastasivat kliinisiä ja miRNA ilmaisun tietoja oli saatavissa, nimittäin, rinta (BRCA), munasarjojen (OVCA), pään ja kaulan (HNSC), keuhkojen (LUAD ), ja munuaisten (KIRC) syöpä. Numerot täsmäsi näytettä kutakin näistä syövän tyypit on esitetty S1 kuviossa. Koska rintasyöpä on alatyyppi-tiettyä tautia, tutkimme myös rintasyövän alatyyppejä erikseen, onko tietty alatyyppi oli vastuussa vahva yhteys ero miRNA ilmaisun ja potilaan selviytymistä.

Validation

Martin

et al

. [27, 28] yhdistettiin Hyväksytty selviytymisen ja geenien ilmentyminen tietoja kuudesta eri Rintasyöpäpotilas aineistoja ja totesi, että yhdistämällä tiedot synergistisesti vaikuttavat luokittelu suorituskykyä ja parantaa geenin allekirjoitus vakautta. Kirjoittajat käyttivät yhdistettyä aineisto tunnistaa geeniekspression allekirjoitus korreloi potilaan selviytymistä. Koska meidän RSA voidaan analysoida paitsi miRNA ilmaus tietojen lisäksi geenin tai proteiinin ilmentymisen data, valitsimme tietoaineiston vahvistettavaksi. Käytimme tätä aineisto (saatavilla kautta Gene Expression Omnibus) vahvistaa suorituskyky meidän RSA tunnistamaan mRNA korreloi potilaan selviytymistä. Käytimme meidän RSA yhdistetyistä aineisto Martin et al. tunnistaa geenejä, joiden ero ilmaisuja korreloivat potilaan selviytymistä. Niiden paperi, tunnistettiin klustereita geenien vahvasti korreloivat hyvän ja huonon selviytymistä. Soveltaminen menetelmämme RSA niiden aineisto myös tunnistettu 1 klusterin geenejä, joiden korkea ilmentyminen oli vahvasti sidoksissa hyvän säilymisen ja toinen klusterin geenejä, joiden korkea ilmentyminen yhteydessä heikkoon säilymiseen. Lisäksi kahden menetelmän antoi limityksellä 22 geenejä. Lämpökarttana Yhteisen geenien osoittaa niiden vastaavuus eloonjääminen näkyy kuvassa 1B.

integrointi Yhteinen miRNA-mRNA eksressoitumistasojen tuottaa Functional Networks

tunnistamiseksi reittejä säädetään kunkin ehdokkaan miRNA meidän RSA valitaan, keräsimme potilaskohtaista yhteinen miRNA-mRNA-ekspression tietoja TCGA ja analysoida niitä tuottamaan miRNA-mRNA korrelaatio verkoissa. Korrelaatiot laskettiin käyttäen monimuuttuja lineaarisen mallin, joka selittää mRNA: n ilmentymisen tason aiheuttamien vaihtelujen DNA kopiomäärä muutoksia ja promoottori metylaatio klo geenilokuksesta. Me laskemiseen sijoittui luettelot geenien ja vastaavien regressiokertoimia kuten aiemmin on kuvattu [29]. Vähennetään mahdollisia vääristely tietojen vuoksi strooman saastumisesta näytteissä, poistimme liittyviä geenejä soluväliaineen (S8 kuvio). Sen sijaan, että keskitytään yksittäisiä geenejä, jotka korreloivat voimakkaasti tietyn ehdokkaan miRNA, käytimme Netwalker [30], ohjelmistopaketti, joka yhdistää geenien ilmentyminen tietoja ja molekyylien vuorovaikutus tietojen pisteet tunnettuja yhteisvaikutuksia, tunnistaa koko vuorovaikutuksen verkkoja, jotka olivat positiivisesti tai negatiivisesti korreloi ehdokas miRNA. Käyttämällä miRNA-mRNA regressiokertoimia syötteenä arvot Netwalker, laskimme reuna vuon arvot tunnettujen molekyylien välisestä vuorovaikutuksesta sekä käytimme vuorovaikutus korkeimmat reuna vuon arvot (top 200 positiiviset ja top 200 negatiivinen vuorovaikutus) tuottaa verkkoihin. Log2 beeta-arvot näkyy kaikissa verkoissa.

rakennettu miRNA-mRNA vuorovaikutuksen verkkoja viiden vahvin ehdokas miRNA, joita on huomattavasti korreloivat selviytymisen tuloksia neljässä syövän tyypit (eli LUAD, HNSC , KIRC, ja OVCA). Nämä viisi ehdokas miRNA verkkoihin, jotka sisältävät geenejä, jotka ovat joko positiivisesti (keltainen) tai kielteisesti (sininen) korreloi korkea miRNA ilme, esitetään S9-S29 kuviot. Tunnistaa reittejä potentiaalisesti säätelevät näiden viiden ehdokkaan miRNA monissa eri syöpätyyppejä, ensin tunnistettu syöpätyyppejä, joissa näitä miRNA liittyi samalla ennusteeseen (eli joko hyvä tai huono selviytyminen) ja sitten analysoitiin yhteinen geeni ontologian liittyvät termit verkkojen näitä syöpätyyppejä.

tulokset

sovelletaan myös RSA TCGA potilastietoja, jotka sisältävät miRNA ekspressiotasot ja kliinisiä tuloksia. Sen jälkeen esikäsittelemällä tietoihin, kuten homogenointi menettelyn, poistaa vaikutukset eri alustoja uuttamalla miRNA ilmaisun, ensin lasketaan optimaalinen kynnys, joka parhaiten erottaa miRNA ekspressiotasot kannalta selviytymisen tulosten laskettu käyttämällä Kaplan-Meier menetelmä ja log-rank-testi. Sitten klusteroitu miRNA ryhmiin, miRNA liittyy hyvä selviytyminen (GS miRNA) ja miRNA liittyy huono selviytyminen (PS miRNA), vertaamalla mediaani kokonaiselinaika optimaalisissa ryhmissä mediaani kokonaiselinaika koko väestöstä. Intensiivisen satunnaisotannalla, me lasketaan vankka p-arvo kunkin ehdokkaan miRNA tunnistaa ehdokas GS miRNA tai PS miRNA kullekin syöpätyypin.

Seuraavaksi tunnettu kartoitetut miRNA kromosomi sijainti ja genomin vakauteen ja rakennettu miRNA-mRNA toiminnallisia verkkoja. Analysoimalla vuorovaikutukset ennustetekijöitä miRNA markkereita ja toiminnallinen reittejä osallisina syövän etenemiseen, me määritelty tärkeimmät reitit näiden miRNA ennustetekijöitä merkkiaineiden vaikutusta.

miRNA-tauti Survival Network

Kunkin syövän tyypistä, nimittäin , rinta (BRCA), munasarjojen (OVCA), pään ja kaulan (HNSC), keuhkoissa (LUAD), ja munuaisten (KIRC) syöpä, tunnistimme ehdokas miRNA jonka differentiaalikaavojen oli vahvasti sidoksissa potilaiden eloonjäämisen useita syöpätyyppejä. GS miRNA ja PS miRNA ehdokasta joista merkittävä vankka p-arvo osoitti korrelaatio selviytymisen vähintään 3 eri syöpätyyppejä on esitetty kuvassa 2A. Me määritelty ja rakennettu miRNA-tauti selviytymisen verkkojen koodattu assosiaatiot miRNA ja syövän tyypit (kuvio 2B). Eri piireissä sisältävät miRNA liittyy ennusteeseen (vasemmalta oikealle) yhden, kahden tai kolmen syöpätyyppeihin. Näiden alapuolella 3 ympyrää, miRNA merkittävästi liittyvät ennusteeseen neljässä syövän tyypit on ilmoitettu. Koska meidän tärkeimpänä tavoitteena on ollut tunnistaa kohteet, jotka ovat voimassa useita syöpätyyppejä, valitsimme viisi miRNA (miR-24-1 *, miR-30e, miR-15b, miR-485, ja miR-487b), jotka on vahvasti sidoksissa selviytyminen (vankka p-arvo ≤ 0.01) useita syöpätyyppejä.

(A) Asiaan miRNA RSA merkittävästi (vankka p-arvo 0,01) korreloi hyvän säilymisen tai huono hengissä vähintään 3 syöpätyyppeihin . (B) miRNA-taudin säilymiseen verkkoon. Ympyrät ilmaisevat miRNA vahvasti sidoksissa elossaololuku siirtoa eri syöpätyyppeihin. Vasemmalta oikealle: miRNA liittyy ennusteeseen yhdessä syövän tyyppi, 2 syöpätyyppien, ja 3 syöpätyyppeihin. Valkoisen suorakaiteen edustaa syöpätyyppeihin. Keltainen suorakaide edustaa miRNA. Väri reunan välillä miRNA ja syövän tyyppi, osoittaa, onko miRNA korreloi hyvä (sininen) tai huono (oranssi) ennusteen syövän tyyppi.

Kopioi numero muutostyöt

Kukin ehdokas miRNA vahvasti sidoksissa potilaan selviytymistä vähintään 4 eri syöpätyyppejä tutkittiin tarkemmin kannalta sen kromosomi sijainti ja ilmentämiskuviota potilailla. Synergisillä tulokset kopioluvun muutoksia kunkin kromosomin paikoissa näiden miRNA kussakin syöpätyypin saatiin cBio tiedot portaalin ja on esitetty kuviossa 3A. miR-485 ja miR-487b, jotka sijaitsevat hyvin lähellä toisiaan kromosomissa 14, on samanlainen suhteita ennusteeseen monipuolinen syöpätyyppeihin ja ovat samanlaisia ​​kopioluvun muutokset koskettavat näitä syöpätyyppejä (kuvio 3A). miR-15b on vahvasti sidoksissa hyvää selviytymistä HNSC ja OVCA ja näyttää samanlainen kopioluku voittoja näitä syöpiä. Voitto kopioluvun tietyssä kromosomissa sijainti osoittaisi lisääntyneen ekspression asianomaisen miRNA. Kunkin valitun miRNA, kuviot sen ekspression tasoja normaaleissa ja tuumorikudoksissa ovat samanlaisia ​​kuin vastaavat profiilit kopioluvun muutoksia (kuvio 3B). (Emme voineet tehdä samanlainen vertailun OVCA, koska meillä ei ollut tietoa normaalin kudosnäytteiden.) B

(A) Lisäkarakterisointia on 5 vahva ehdokas miRNA mitattuna kopioluvun vaihtelun ja ilme. Synergisillä identifioitu kopioluvun muutoksia kussakin kromosomissa loci for miRNA eri syöpätyyppejä näytetään. ”GS” tai ”PS” sisällä jokainen ympyrä ilmaisee yhteyden hyvä (sininen) tai huono (oranssi) ennustetta. (B) ekspressio kasvaimen ja normaalin kudoksen kunkin vahva ehdokas miRNA. Sillä OVCA, normaali kudos tietoja ei ollut saatavilla.

Myös lasketaan korrelaatio kopiomäärä muutokset on kromosomissa sijainti kunkin ehdokkaan miRNA ja muutokset metylaatiotasoilla kunkin syöpätyypin erikseen ja kaikkien 5 syöpätyyppeihin yhdistetty (S2-S6 kuviot). Löysimme merkittävä korrelaatio miRNA ilmaisun ja kopioluvun vaihtelua näissä loci ja välillä miRNA ilmaisun ja metylaatiotasoilla asianomaisissa syövän tyyppejä. Kun olemme analysoineet yhdistettyjen tulosten perusteella 5 syövän tyypit, vielä havaittu merkittäviä korrelaatioita miRNA ilmaisun ja kopioluvun vaihtelua ja metylaatiotasoilla.

Vastaa