PLoS ONE: sisäiset Gene DNA Metylointi vaihtelevuus on kliinisesti Independent Prognostiset Marker in Naisten Cancers

tiivistelmä

tuomaan uusi per-geenin mitta sisäisen geenin DNA: n metylaatio vaihtelevuus (IGV), joka perustuu Illumina Infinium HumanMethylation450 alustan, joka on prognostisia itsenäisesti tunnettu ennustavat kliinisen tuloksen. Käyttämällä IGV, johdamme vankka geeni-paneeli ennustetekijöiden allekirjoitus munasarjasyöpä (OC,

n

= 221), jolla vahvistetaan kaksi erillistä tietojen keräämisessä Mayo Clinic (

n

= 198) ja TCGA (

n

= 358), jolla on merkitystä

p

= 0,004 kummassakin. OC prognostisia allekirjoitus geeni-paneeli koostuu neljästä geenistä ryhmistä, jotka ovat erillisiä biologisia prosesseja. Osoitamme IGV mittaukset näiden geenin ryhmät ovat todennäköisesti heijastusta seosta sisäisen kasvaimen heterogeenisuus ja transkriptiotekijä (TF) sitova /aktiivisuus. IGV voidaan käyttää ennustamaan kliinistä tulosta potilaille yksilöllisesti, joka tarjoaa korvike lukemisen pois vaikeasti toimenpide sairausprosesseja.

Citation: Bartlett TE, Jones A, Goode EL, Fridley BL, Cunningham JM, Berns EMJJ, et ai. (2015) sisäiset Gene DNA Metylointi vaihtelevuus on kliinisesti Independent Prognostiset Marker in Naisten Syövät. PLoS ONE 10 (12): e0143178. doi: 10,1371 /journal.pone.0143178

Editor: Dajun Deng, Pekingin yliopiston Cancer sairaalan ja Institute, Kiina

vastaanotettu: 05 lokakuu 2015; Hyväksytty: 30 lokakuu 2015; Julkaistu: 02 joulukuu 2015

Copyright: © 2015 Bartlett et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään

Data Saatavuus: DNA: n metylaatio data tärkeimpien OC data-set analysoitiin tässä on talletettu Gene Expression Omnibus (GEO) hakunumerolla GSE72021.

Rahoitus: Tämä työ oli rahoitettu (MW, AJ) Euroopan unionin seitsemännen puiteohjelman ( FP7 /2007-2013) avustussopimuksen numero 305428 (Project EpiFemCare), National Institute for Health Research Lontoon yliopistollisessa sairaalassa Biomedical Research Centre, ja jonka Eve Appeal ja Euroopan verkko- translaatiotutkimus naistentautien Oncology (ENTRIGO) ja european Society of gynekologinen Oncology (ESGO). TEB saanut rahoitusta UK Engineering ja fysikaalisten tieteiden tutkimusneuvosto (ESPRC) ja Yhdistyneessä kuningaskunnassa Medical Research Council (MRC) kautta UCL monimutkainen. ELG saanut rahoitusta Fred C. ja Katherine B. Andersen Foundation, NIH myöntää R01-CA122443, P50-CA136393 (Mayo Clinic munasarjasyöpä SPORE) ja P30-CA15083. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Lyhenteet : BRCA, Rintasyöpä invasiivinen karsinooma; DNAm, DNA: n metylaatio; EY, Kohdun limakalvon syöpä; ENCODE, Encyclopedia of DNA-elementtejä; FDR, False löytö korko; ITH, sisäinen kasvain heterogeenisuus; OC, munasarjasyöpä; IGV, Intra geenin vaihtelevuus DNA: n metylaatio; TCGA, The Cancer Genome Atlas; TF, Transkriptiotekijän; UCEC, Kohdun corpus kohtukarsinooma

Johdanto

erot DNA: n metylaatio (DNAm) tasot ovat yksi varhaisimmista muutoksia ihmisen syövän syntymistä [1] ja ovat tunnusmerkki syöpä [2], joka tarjoaa mahdollisuudet uusia strategioita ennustaa syövän biologian ja lopputulos. Epigeneettisenä erot nämä muutokset aiheuttavat ovat vakaampia kuin erot geeni-ilmentymisen tasolla. Geeniekspressiotasot mitattuna RNA, sovelletaan määräajoin ja ohimeneviä eroja (kuten vuorokausivaihtelua ja mRNA epävakautta), jotka eivät koske DNAm. Tunnistaminen luotettavat indikaattorit eroja DNAm malleja voisi tarjota arvokasta johtoa kehittämiseksi DNA-pohjainen syöpä biomarkkereita kudosten ja kehon nesteiden.

Munasarjasyöpä (OC) ja kohdun limakalvon syöpä (EY) ovat tavallisimmat gynekologiset syövät [3]. Vain yksi kolmesta potilailla, joilla on edennyt pitkälle OC hengissä viiden vuoden kuluttua niiden alkuperäisen diagnoosin [4]. Hyvin vähän tiedetään OC biologian ja kuinka manipuloida tätä tautia terapeuttisesti. DNAm muutokset ovat tärkeitä syövän [5]; epigenome on rajapinta genomin ja ympäristön [6, 7], ja siten DNAm muutokset voivat mitata altistumista ympäristön riskitekijät syövän. DNAm biomarkkerit jotka edustavat korvike malleja geenin vuorovaikutuksen on aiemmin liittynyt kliinistä tulosta monenlaisia ​​syöpiä [8], sekä erityisesti naisten syöpiä [9].

Näyte näyte vaihtelu DNAm tietyissä genomista paikoissa tiedetään olevan tärkeä syövän kehittymiseen [10, 11], ja se on äskettäin osoitettu, että lisäys sisäisen geenin vaihtelu DNAm (IGV), mitta sisällä näytteen metylaatio vaihtelua ( Kuva 1a), on erittäin liittyy syöpäkudokset verrattuna terveisiin [12]. Ero metylaatio on yleisesti käytetty menetelmä, jolla metylaatiotasoilla verrataan kudosten, fenotyypit ja koeolosuhteet (vastaavasti differentiaalisiin geenien ilmentyminen). Täällä kehitämme ennustetyövälineenä allekirjoitus perustuva IGV joka on riippumaton tunnettu kliininen ennustetekijöiden ominaisuuksia, ja osoittavat, että tämä IGV ennustetekijöiden allekirjoitus todennäköisesti korvike lukeman heijastaa sekoitus sisäisen kasvaimen heterogeenisuus ja transkriptiotekijä (TF) sitova /aktiivisuus .

(a) keskimääräinen metylointi taso yli tietyn genominen alue lasketaan erikseen TSS200 (promoottori) ja geenin rungon genomialuetta. Sininen käyrä uuden asennon punainen käyrä jälkeen lisäaineena maailmanlaajuinen muutos metylaatio tasolla, mikä saattaa johtua teknisiä tai muita kokeellisia tekijät, ja ero vaaka punainen ja siniset viivat (keskiarvo tasoa) havainnollistaa vaikutus tämän shift keskiarvoon metylointi tasolla. (B) sisäiset geeni metylaatio vaihtelevuus (IGV) lasketaan keskiarvon vaihtelukerroin metylaatio tasolla, ts katkoviivoitetusta pystyviivat, ja on samalla lasketaan erikseen TSS200 ja geeni kehon genomialuetta. Pystysuorat vihreät viivat ovat muuttuneet hyvin vähän verrattuna pystysuora punaisia ​​viivoja, jotka osoittavat, että tällainen maailmanlaajuinen lisäainetta muutos keskimääräisessä metylaatio tasolla on paljon vähemmän vaikutusta IGV, joka näin ollen kutsutaan ”itsekalibroivasta toimenpide.

tulokset

vertailu ennustava luotettavuutta per-geenin metylaatio toimenpiteet tietojen

tehokkuuden arvioimiseksi ja kestävyys IGV verrattuna tarkoitetaan metylaatiotasoilla vertasimme neljä pro- geenin metylaatio toimenpiteitä, jotka perustuvat keskimääräisen metylaatio tasolla ja IGV (kuvio 1). Jokaista geeniä, laskimme keskiarvo metylaatio tasolla ja IGV, erikseen promoottori (TSS200) ja geenin rungon alueet, käyttämällä Illumina Infinium HumanMethylation450 alustan tekniset tiedot CpG: t näillä alueilla kunkin geenin. Mietimme eri genomialuetta erikseen, koska metylaation vaihtelevat suuresti genomin alueella toiseen, ja vaikutus metylaation tasolla geenisäätelyn vaihtelee genomin alueella. Neljä toimenpiteet vertasimme, ovat seuraavat:

TSS200 keskiarvo metylaatio

TSS200 IGV

Gene elin tarkoittaa metylaation

Gene elin IGV

Saimme genominlaajuisten DNAm profiilien kautta Illumina Infinium HumanMethylation450 alustalla, 218 ensisijaista OC näytteitä. Kunkin neljän kuvattujen toimenpiteiden, käytimme ”Elastic Net” [13, 14] löytää prognostinen valikoima geenejä. Joustava verkko on todettu olevan optimaalinen lineaarinen mallinnus menetelmää tunnistaa ryhmät geenien, jotka toimivat yhdessä osana yhteistä biologinen prosessi [15]. Se on regressiomenetelmä joka ”valitsee” joukko geenejä, jotka mallin tiedot parhaiten, yrittää sisällyttää niin vähän geenejä mallissa kuin mahdollista, varmistaen samalla, että malli ennustaa tuloksista edun mahdollisimman tarkasti. Näin se hylkää geenejä, jotka eivät tarjoa hyödyllistä tietoa, tai jotka tarjoavat toistuvia tietoja. Koska tavoitteenamme on löytää minimaalinen joukko geenejä käyttää ennustetyövälineenä allekirjoitus, on tärkeää huomata, että joukossa nämä geenit, siellä on ryhmiä geenien joille niiden IGV sisältää tarpeettomia tai päällekkäisiä tietoja, ja siellä on ryhmiä geenit, jotka IGV sisältää täydentävät tiedot kustakin geenistä. Siksi päätimme käyttää Elastinen Net tekniikka tarkasti erottaa tällaisen ei-tarpeeton ryhmittely geenien minimaalinen ennustavan asettaa hyvin monia mahdollisuuksia, genomin leveä. Toteamme, että vaikka tämä menetelmä voi tuntua monimutkainen tässä yhteydessä, yksinkertaisempi menetelmä ei pysty erottamaan näitä parsimonious ryhmittymät geenien jossa päällekkäisiä ja tarpeettomia tietoja pidetään mahdollisimman pienenä.

arvioi tehokkuutta per-geenin metylaatio toimenpiteet ennustetekijöiden toimenpiteitä satunnaisesti jakamalla tiedot kahteen osaan a ’harjoitussetti ”, ja” Koepakettia ”. Elastinen Net käytettiin valita geenien ja sopivat mallin koulutukseen asettaa, ja kyky tämän geenin valinnan ja malli sokeasti ennustamaan potilaan eloonjäämisen tulos (oikaistu kliininen covariates) arvioitiin käyttämällä testiä-set. Tämä toistettiin 2001 kertaa, ja merkittävästi ennustava valitut ryhmät geenien määriteltiin mukaan väärien löytö korko (FDR) säädetty [16]

p

-arvo (eli FDR

q

-arvo) 0.1 (kuvio 2a). Kuten kuviossa 2b, vain geeni elin IGV ennustaa hyvin.

(a) Menetelmät yleiskatsaus vertailun neljä per-geenin metylaatio toimenpiteitä. (B) tulokset tämän vertailun. (C) Menetelmät katsaus laskemisessa munasarjasyövän IGV ennustetekijöiden pisteet.

johtaminen munasarjasyöpäsolu prognoosi- allekirjoitus, ja IGV ennustetekijöitä pisteet

käyttää IGV johtamiseksi OC DNAm ennustetekijöiden allekirjoitus (kuvio 2c), joka perustuu geenin rungon IGV (tästä eteenpäin kutsutaan yksinkertaisesti ”IGV ’). Teimme määrittämällä yksimielisyyteen joukko geenejä ennakoivaa säilyminen, noudattamalla samaa menettelyä jakaminen dataa testi ja koulutus asetetaan, ja sitten arvioidaan geenin valinta ja sovitetun mallin kyvystään sokeasti ennustaa potilaan eloonjäämisen tulos (oikaistu kliinisten covariates) testissä asetettu. Sen varmistamiseksi, lähentymistä vakaan tuloksen, teimme 10

5 tällaiset väliseinät datan, kunkin tuloksena on ennakoivaa valikoima geenejä. Näiden, 8281 löydettiin merkittävä (FDR

q

0,1), ja merkitys kullekin geenille laskettiin sitten perustuen useita merkittäviä malleja, joissa tämän geenin ilmestyi. 679 geenit valittiin näin sisällytettäväksi OC ennustetekijöiden allekirjoittamista merkittävyystasolla FDR

q

0,05, vähiten merkitsevän geenin läsnä 1057 ulos 8281 malli sopii. Top 100 Merkittävin näistä geeneistä esitetään lisätaulukot (S1 File).

Genes toimivat usein yhdessä osana biologisia polkuja, ja prosesseja. Siksi voimme odottaa, että nämä 679 OC prognostisia allekirjoitus geenejä voidaan esittää pienemmällä määrällä taustalla biologisia prosesseja, jotka ovat tärkeitä taudin etenemiseen. Ryhmittely geenejä vastaavat kokeelliset mittaukset käyttämällä ryhmittelymenetelmät on vakiintunut tehokkaaksi lähestymistapa määrittämiseksi kliinisesti merkittäviä ennustetekijöitä markkereita [17, 18]. Siksi paljastaa tällaisia ​​ryhmittymiä 679 geenit meidän OC prognoosi- allekirjoitus, suoritimme konsensus klustereiden [19], tunnistaa ryhmät geenien vastaavia malleja IGV poikki potilaista. Jokainen klusterin tunnistettu tällä tavoin paljastaa eri IGV trendi, ja siksi voi vastata eri taustalla biologinen prosessi, joka aiheuttaa rakenteessa IGV havaittu, että klusteri. Klusterijärjestelyssä suoritettiin erikseen geenejä, jotka yksittäin liittyy huonompi elossaololuku tulos kasvoi IGV ( ’hyper’ geenejä) ja laski IGV (hypo geenejä). Tulos oli neljä klusterit: kaksi hyper geeneistä, nimeltään klustereiden hyper 1 ’ja’ hyper 2 ’, ja kaksi hypo geeneistä, nimeltään klusterit hypo 1 ja hypo 2’; ne näkyvät lisätaulukot (S1 File). Keskimääräinen IGV geenien kunkin neljän klustereiden antaa IGV ”klusteri pisteet”, kunkin klusterin ja jokaiselle potilaalle, jotka otetaan edustavan eri IGV trendejä, ja vastaavat taustalla biologisten prosessien sisällä OC ennustetekijöiden allekirjoitus.

sitten laskenut IGV ennustetekijöiden pisteet, sovittamalla monimuuttuja Coxin suhteellisen vaarat malli (osuus myös kliiniseen covariates) neljän IGV klusterin tulokset. Se ei ollut mahdollista asentaa tällaisen mallin koko joukko 10014 geenejä, koska on paljon enemmän ennustajan muuttujat (geenit) kuin näytteitä [20]. Kuitenkin vähentää ennustetekijöiden allekirjoituksen 4 klusterin tulokset, eli 4 ennustajia, sallii Coxin suhteellisten riskien mallia voidaan asentaa. Tämä johtaa mallissa kerroin kunkin klusterin pisteet /ennustajan; niitä käytetään laskettaessa IGV ennustetekijöiden pisteet. IGV ennustetekijöiden pisteet on yhden numeron ennustetekijöiden indikaattori yhden näytteen /potilas, ja toteamme, että sen on laskettava kaikissa neljässä klusterin pistemääriä olevan merkittävästi ennustetekijöitä.

mediaani Tämän IGV prognoosi- pisteet käytettiin jakamaan potilaille tärkeimmistä OC data asettaa osaksi parempia ja huonompia ennustetekijöiden ryhmiä, kuvassa 3a ja 3b. IGV ennustetekijöiden pisteet validoitiin kaksi erillistä sarjaa syöpiä peräisin MUllerin ärsytystä. Uusi OC asettaa Mayo Clinic (

n

= 198) vahvisti ennustetekijöiden kapasiteetti IGV ennustetekijöiden pisteet molemmissa Yksiulotteisissa (kuvio 3c) ja monimuuttuja (kuvio 3d) analyysit. Sen testaamiseksi, onko IGV ennustetekijöiden pisteet on vain rajoitettu OC, vai onko se myös ennakoivaa muissa syövissä, jotka johtuvat samasta alkionkehityksen rakenne (ts MUllerin kanava), haimme meidän ennustetekijöiden pisteet on julkisesti saatavilla kohdun corpus endomet- karsinooma (UCEC) asettaa

Cancer Genome Atlas

(TCGA) [21] (

n

= 358). Jälleen sekä yhden muuttujan (kuvio 3e) ja monimuuttuja (kuvio 3f) analysoi, pystyimme Kelpuuta IGV ennustetekijöiden pisteet.

(a), (c) ja (e): vertailu eloonjäämiskäyristä ryhmien määrittelemän IGV ennustetekijöiden pisteet, in: (a) tärkeimmät OC datajoukon, (c) Mayo Clinic OC validointi asetettu, (e) kohtusyöpä TCGA validointi asetettu. Ryhmät jaetaan mediaani IGV ennustetekijöiden pisteet johdettu pääasiassa OC DNAm data-set. Riskisuhde (

HR

) näytetään 95% CI suluissa vastaavien

p

-arvo lasketaan yksiulotteista Coxin regressio. (D), (e) ja (f): Multivariate Coxin regressio vertaamalla samoissa ryhmissä määrittelemän IGV ennustetekijöiden pisteet.

Toteamme, että käyttämällä mediaani ennustetekijöiden pisteet päässä OC data-set (harjoitussarjassa) ja dichotomise potilaiden Mayo OC ja TCGA UCEC validointi sarjaa tekee tästä todellisen arvioinnin ennustetekijöiden kyky tämän menetelmän. Tämä johtuu tällä menetelmällä, potilaat validoinnin sarjat luokitellaan yksitellen parempi tai huonompi ennustetekijöiden ryhmä, mitä tulee niiden DNAm mittauksiin. Tämä luokitus tehdään mukaan kynnys tai rajan jakamalla nämä ennustetekijöitä ryhmät (eli mediaani ennustetekijöiden pisteet harjoitustietosivut-sarja), ja tämä kynnys on asetettu täysin itsenäisesti näistä validointitiedot-sarjaa.

IGV ja sisäisten kasvainten heterogeenisuus

Ehdotamme, että IGV klusterin tulokset ovat kukin edustavat eri biologisia prosesseja, tärkeä taudin lopputuloksen. Mutta mitä ovat nämä prosessit? Yrittää löytää joitakin vastauksia tähän kysymykseen, meidän on ensin oletettu, että sisäinen kasvain heterogeenisuus saattaa olla heijastusta IGV. Kohteena sisäisen kasvaimen heterogeenisuus on parhaillaan sai paljon huomiota, paljastamiseksi paljon ajallisen ja monimuotoisuuden genomisessa prosessien yksittäisissä kasvaimissa [22]. Ihannetapauksessa DNA methylome yksittäisten solujen samasta kasvain näytteestä olisi analysoitava käsitellä tätä kysymystä. Vaihtoehtoisena lähestymistapana, käytämme tässä rajat näyte metylaatio varianssi (ts keskiarvo metyloinnin varianssi yksittäisten CpG: t tietyn geenin kehon alue), mittana sisäisen kasvaimen metylaatio heterogeenisyys, jotta voidaan arvioida, miten tämä vaihtelee sen funktio IGV (kuvio 4a). Cross-näyte metylaatio vaihtelu on myös mitta kuinka samanlaisia ​​Metylointilaitteistoon profiilit ovat geenin, poikki näytteitä. Jos rajat näyte metylaatio vaihtelu oli heijastusta IGV, kuten IGV kasvaa, me voisimme odottaa johdonmukaisesti lisätään rajat näyte metylaatio varianssi (kuvio 4b, odotettu suhteellinen fit). Sen sijaan näemme malli, jossa alhaisen IGV, rajat näyte metylaatio varianssi kasvaa, kun taas korkean IGV, rajat näyte metylaatio varianssi pienenee jälleen ja on hyvin alhainen korkeimman IGV arvoja. Voidakseen vahvistaa tätä edelleen, olemme analysoineet kaksi ylimääräistä aineistoja, joille useita näytteitä eri alueilta saman syöpä on otettu. Ensimmäinen lisätiedot-sarja on peräisin kohdun limakalvon syöpiä, joissa riippumattomien näytteitä on otettu 2 tai 3 ensisijainen syövän ja metastaasien, kussakin 10 potilasta (kuvio 4c, yksi käyrä best fit näkyy potilasta kohti). Toinen on peräisin eturauhasen syöpä, jossa 8 erillistä näytettä on otettu samasta kasvain, kustakin viidestä syöpäpotilailla [23] (kuvio 4d, yksi käyrä potilasta kohti). Rakenteessa näiden käyrien on lähes samanlainen kuin sisäisten kasvain heterogeenisyys tutkimuksissa pääasiassa OC tutkimus jota käytetään tunnistamaan OC ennustetekijöiden allekirjoituksen (kuvio 4b), ja pohjapinta näytteitä TCGA rintasyöpähoitopalvelut invasiivisia karsinooma (BRCA) data-set (kuvio 4e). Päällekkäisyys geenien kaikilla alueilla nämä tonttien on myös erittäin merkittävä kaikkialla aineistoja (kuvio 4f-4h).

(a) Cross-näyte vaihtelu metylaatio (sisäinen kasvain heterogeenisuus) ja IGV lasketaan erilaisia ​​ja toisiaan täydentäviä suuntiin. Heatmap näyttää metylaatio profiilin yhden geenin (vaaka-akseli), useiden näytteiden (pystyakseli). (B) – (e) Luonteenomaista kuvio high cross-näytteen vaihtelu (sisäinen kasvain heterogeenisuus) kun IGV on alhainen, ja päinvastoin, on johdonmukaisesti havaittu eri tutkimuksissa: (b) Tärkeimmät OC data-set, (c ) endometriumsyöpä sisäistä kasvain heterogeenisyys data-set, (d) eturauhassyöpä sisäistä kasvain heterogeenisyys data-set, (e) BRCA pohjapinta data-set. (F) – (h) päällekkäisyys geenien kullakin alueella (b) kanssa geenien yhtä alueilla (c) – (e) on erittäin merkittävä. Kohdassa (c) ja (d), jokainen rivi liittyy näytteitä yhdestä potilaan, ja on parhaiten sovitettu käyrä, joka vastaa kuvan (b) ja (e). (B), kertoimet-suhteet ja

p

-arvot yläosassa juonta osoittavat rikastuminen geeneistä kunkin klusterin, kummallakin puolella mediaani IGV on ennustetekijöiden allekirjoituksen. Lyhenteet: ITH (sisäinen kasvain heterogeenisuus), OC (munasarjan karsinooma), BRCA (rintasyöpä invasiivisia syöpä).

geenit Klusterin hyper 1 ovat hieman yliedustettuina vasemmalla puolella kuvion 4b, jossa IGV on alhaisempi, ja rajat näyte metylaatio heterogeenisuus on yleensä suurempi. Tämä viittaa siihen, että lisääntynyt IGV näiden geenien liittyy sisäiseen kasvaimen heterogeenisuus. Kuitenkin geenit klustereiden hyper 2 ja hypo 2 lasku enimmäkseen alueella korkea IGV ja matalan rajat näyte metylaatio vaihtelua (kohti kuvion 4b). Tämä tarkoittaa sitä, että geenit näistä klustereista, niiden metylaatio profiilit ovat yleensä samanlaisia ​​eri näytteitä samasta kasvain, tai eri kasvaimia. Kun kyseessä on klusterin hyper 2, tämä vastaa korkea metylaation vaihtelu yhden geenin huonossa prognostisissa tapauksissa ja että tämä vaihtelu on johdonmukaisesti samanlainen koko kasvain ja välillä kasvaimia. Siten geenien klusterin hyper 2 suuri joko IGV huonossa prognostisissa tapauksissa vielä näyttää olevan riippumaton sisäisen kasvaimen heterogeenisuus. Siksi me spekuloida, että lisääntynyt IGV näiden geenien on kasvain-solu luontainen ilmiö, joka on riippumaton sisäisen kasvaimen heterogeenisuus. Tämä tarkoittaa sitä, että IGV prognostisen allekirjoitus yhdistyvät toimenpiteet sisäisen kasvaimen heterogeenisyys, kanssa riippumattomien, kasvaimen solujen luontaista ilmiöitä. Toteamme, että termit ”hyper” ja hypo, tässä liittyvät muutoksiin, kuin absoluuttisia tasolla. Esimerkiksi S1 kuvio osoittaa, että klusteri hypo 2 on korkein IGV minkään klusterin; kuitenkin IGV tämä klusteri on itse asiassa alempi huonossa verrattuna hyvä ennustetekijöitä tapauksia.

geenit määritellään klusteri hypo 1 on korkein keskimääräinen rajat näyte metylaatio vaihtelua (kuva 4), samoin kuin suurin keskimääräinen metylaatio taso (S2 kuvassa), ja alhainen IGV on hypo 1 geenien yhteydessä huonoon ennusteeseen. Aluksi se tuntuu vaikea selittää, että huono ennustetekijöiden syövät ovat alhaisemmat IGV että hypo1 geenit, mutta nämä hypo1 geenejä edustaa myös korkea näyte-näyte metylaatio heterogeenisuus. Tämän selittämiseksi, käytimme mitta CpG-CpG metylaatio vaihtelua, jota kutsumme keskimääräinen johdannainen [12], joka on laskettu keskiarvona absoluuttinen ero metylaatiotasoilla vierekkäisten CpG: t geenin kehon geenin, joka yhden näytteen. Illumina HumanMethylation 450K array mittaa metylaatiotasoilla erityisiä CpG loci, keskimäärin yli sekaisin näyte monia soluja. Kuvio 5a ja 5b on esitetty kaksi esimerkkiä siitä, kuinka korkea metylaation vaihtelu on yksisoluiset tasolla saattaa ilmentyä mittauksissa hankittu käyttämällä tätä tekniikkaa.

450K array tarjoaa metylaatio mittauksia sekaisin näyte useita soluja. (A) on esimerkki metylaatiokuvion joka on erittäin vaihteleva, samalla tavalla solujen kesken. Tämä johtaa alhaisen rajat näyte heterogeenisyys, ja korkea IGV, kuten cluster hyper 2 (b) on esimerkki metylaatiokuvion joka on erittäin vaihteleva, mutta heterogeeninen tavalla eri soluja. Tämä johtaa korkean rajat näyte heterogeenisyys, mutta nettovaikutus keskiarvo metylaation profiilien poikki sekoitti näytteen monien solujen antaa mittaus alhainen IGV, kuten cluster hypo 1 (c) mitta CpG-CpG metylaatio vaihtelevuus , laskettu keskiarvona johdannainen, tai keskimääräinen absoluuttinen ero metylaatio tason vierekkäisten CpG: t. (D) vaihtelu keskiarvon-johdannainen toimenpide poikki näytteitä määrällisesti heterogeenisyys CpG-CpG metylaatio vaihtelua. Cluster hyper 2 on alhainen mukaisesti (d), ja näin ollen vastaa kuvion, kuten (a). Cluster hypo 1 on korkea mukainen (d), ja näin ollen vastaa kuvion, kuten (b).

esimerkissä Kuvion 5a, näemme, että on olemassa vain vähän solu-heterogeenisyys, vaikka on paljon vaihtelua geenin sisällä. Siksi tämä johtaa mittaukset korkea IGV, ja matalan keskityksen otoksen metylaatio vaihtelua, kuten näemme klusterin hyper 2. Sitten Kuvio 5b esittää esimerkin, joka on paljon solu-solu vaihtelevuus, sekä paljon vaihtelu geenissä . Tuloksena on, että rajat näyte metylaatio vaihtelu array mittausten on korkea, mutta koska erittäin vaihteleva metylointi profiilit ”keskimääräisen” yli sekaisin soluja näytteessä, nettotulos on mittaus alhainen IGV. Tutkimaan, onko tämä hypoteesi on uskottava, käytämme keskimääräinen johdannainen mitta CpG-CpG metylaatio vaihtelua (Kuva 5c). Tarkastelemalla miten heterogeeninen tämä CpG-CpG vaihtelu on poikki näytteistä (kuvio 5d), voimme vahvistaa, että geenien klusterin hypo 1 CpG-CpG metylaatio vaihtelu taipumus olla erilainen eri soluja kuin missään muussa klusterin kuten heijastuu korkea varianssi keskimääräisen-johdannainen mittauksia. Meillä on myös mahdollisuus vahvistaa kuvasta 5d että geenien klusterin hyper 2 CpG-CpG metylaatio vaihtelu yleensä vähemmän erilainen eri soluja kuin missään muussa klusterissa, kuten alhainen varianssi keskimääräisen johdannaisen. Näin ollen nämä tulokset tukevat mallin kuviossa 5a ja 5b geenien klusterin hyper 2 ja hypo 1, vastaavasti.

toiminnallinen rooli transkriptiosta tekijän aktiivisuus IGV

Koska geenejä, jotka käsittävät cluster hyper 2 näyttävät osoittavan samaa IGV useimmissa tuumoriverisuonien, mutta korkea IGV klusterin hyper 2 geenien liittyy huono prognoosi, me pidämme klusterin hyper 2 IGV olla ”johdonmukainen kasvain-solujen luontaista ilmiö” , joka on todennäköisesti säädellä ero sitoutuminen transkriptiotekijöiden (TF). Siksi tutkimme TF sitoutumisen geenin kehon alueilla OC ennustetekijöiden allekirjoitus geenejä, ja testattu korrelaatio TF ilmaisun kanssa IGV geenien ne sitoutuvat (joka TCGA joukko perus rintasyöpiä). Olemme havainneet, että kukin prognostisia allekirjoitus klusterin osoittaa omanlaisensa kuvio TF sitoutumisen (kuvio 6a), joka voidaan oletuksia liittyy biologisia prosesseja vastuussa luonteenomainen IGV havaittu, että klusterin.

(a ) False löytö korko tarkistetaan

p

-arvot ja kertoimet-suhde (OR) osoittavat rikastamista sitoutumisen erityisten transkriptiotekijöiden (TF: t), geeniin kehon alueilla geenien kunkin klusterin. TF joka sitoutuu merkittävästi yli vai alle rikastettua (Fisherin testiä, FDR

q

0,05) on vihreä ja punainen, vastaavasti. (B) TF: t, jotka osoittavat merkittävästi enemmän positiivinen korrelaatio IGV geenien ne sitoutuvat, verrattuna geenit eivät sitoudu. (C) TF: t, jotka osoittavat merkittävästi enemmän negatiivinen korrelaatio IGV geenien ne sitoutuvat, verrattuna geenit eivät sitoudu. (D) TF: t, jotka ovat merkittäviä mukaan (a) ja joko (b) tai (c); TF: t, joiden tiedetään merkitystä on merkitty viittaus asiaa tutkimusta. Puute rikastaminen TF sitoutumisen geenien klusterin hypo2, on heijastusta pieni määrä (19) geenien tässä klusterissa.

Transkriptiotekijän sitoutumiskohdan tietoja, saadut ENCODE ( Encyclopedia of DNA Elements) hanke [24], oli käytettävissä geenin kehon alueilla kaikkien geenien edustettuna Illumina HumanMethylation 450K array, 55 transkriptiotekijät. Testasimme kukin näistä 55 TF: iä, sillä suurentaa tai pienentää huomattavasti sitoutumaan geeneihin kunkin ennustetekijöiden allekirjoituksen klusteri. Cluster hypo 2 käsittää vain 19 geenien, ja siksi emme odota nähdä monia merkittäviä korrelaatioita, koska pieni otoskoko. Mutta kiinnostavaa, klusterin hyper 2 (koostuu geenejä, joiden metylaatiotasoilla vaihtelevat hieman yli kasvaimia, mutta niissä suurempi IGV), nähdään, että 20% (11/55) on TF: ien testattujen näytä merkittävästi sitoutumisen näiden geenien odotettua, kun taas 16 % näytä merkittävästi vähemmän sitovia kuin odotettiin. Sillä geeniryppäät jolle DNAm vaihtelee /kasvaimiin ja on yleensä alhainen IGV (klusterit hyper 1 ja hypo 1), ei yksittäinen TF osoitti odotettua suurempi sitovia, kun taas 27% ja 38% ien osoittavat odotettua pienempi sitoutuminen geenit käsittävät klusterin hyper 1 ja hypo 1, vastaavasti. Tämä on sopusoinnussa sen ajatuksen kanssa, että TF sitoutuminen on mukana erillisiä ja eri liittyviä prosesseja IGV ja metylaation heterogeenisyyttä näytteessä.

Lisäksi halusimme testata todellinen korrelaatio ilmentymisen TF: ien kanssa IGV geenien ne sitoutuvat, ja geenit, ne eivät sitoudu, genomin laajuinen. Tätä varten käytimme TCGA joukko pohjapinta rintasyöpiä, joille 450k metylaation tiedot sekä ekspressiotietojen olemassa. Olemme jo korkea samankaltaisuus käyttäytymisen meidän prognostisten allekirjoitus geenien OC ja nämä TCGA BRCA pohjapinta näytteistä (kuvio 4). Edelleen, se on kattavasti osoituksena TCGA konsortio korkealaatuisesta serous munasarjojen ja kohdun ja BRCA pohjapinta syövät ovat erittäin molekyylirakennetta samanlainen [25]. Kuvio 6b ja 6c esittävät TF: t huomattavasti enemmän positiivisia, ja enemmän negatiivisia, korrelaatio IGV geenien ne sitoutuvat, verrattuna geeneihin ne eivät. On mielenkiintoista, että kaksi korkeimmin rankattu transkriptiotekijöiden mukaan lisääntynyt positiivinen korrelaatio niiden ilmaisun kanssa IGV sitoutuneessa geenejä,

Rad21

ja

Brg1

(

SMARCA4

), ovat molemmat osat kromatiinin muokkaamalla komplekseja merkitystä kantasolujen identiteettiin [26, 27]. Erityisesti

Brg1

(

SMARCA4

) on osoitettu äskettäin olevan erityistä merkitystä pienisoluinen munasarjasyöpä [28-30]. Yhtymäkohdista TF: iä, jotka ovat merkittävästi erilaisia ​​sitovia malleja suhteessa OC ennustetekijöiden allekirjoitus geenejä, ja TF: t jotka näyttö merkittävästi muuttunut korrelaatio niiden lausekkeen IGV geenien ne sitoutuvat, on esitetty kuviossa 6d. Paljon tarvittavan yksityiskohtaisesti on jo raportoitu noin useimmat näistä TF: ien (viittaukset huomattava kuvassa): joko niiden sitoutuminen vaikuttavat metylaatio (tai

päinvastoin

), tai ne ovat mukana chromatin remodeling kantasoluja . TF: ien Kuvion 6d ovat tärkeitä prosesseja taustalla taudin etenemistä, jotka liittyvät meidän OC ennustetekijöiden allekirjoitus (TF: t, joiden tiedetään olevan merkitystä on merkitty viittaus asiaa tutkimuksen [26, 31-40]). Siksi hypoteesin, että IGV, meidän OC prognostisten allekirjoitus geenin paneeli edustaa korvike toimenpide niiden toiminta ja rooli taudin muunnoksen.

Association prognoosi- allekirjoituksen CpG: t CpG saaria ja enhancer alueiden

Sijainti CpG: t suhteessa CpG-saarekkeiden (CGI) tiedetään olevan tärkeä tekijä toiminnallista roolia näiden CpG: t [41]. Testasimme väkevöimiseen koettimia selityksin CGI alueille ”saari”, ”shore” ja ”hylly” keskuudessa geeni kehon selityksin antureista, sekä koettimet lisätty huomautusta geeni elinten geeneistä meidän prognoosi- allekirjoitus, ja neljästä klustereiden . Vaikka olemme huomanneet, että geeni elin koettimet yleistä merkittävästi köyhdytetty anturien näillä CGI alueilla, päinvastainen oli totta geenien elinten meidän prognoosi- allekirjoitus (ks täydentävä Taulukot S1 File). Tämä vaikutus näyttää olevan pitkälti sidoksissa toisen klusterin. Tämä osoittaa merkittävä asema CpG saarilla asianomaisten alojen geenien meidän ennustetekijöiden allekirjoitus.

sijainti CpG: t suhteessa tehostajansa alueille on myös tiedetään olevan merkitystä toiminnallista roolia CpG: t. Testasimme oliko rikastamista metylaatiokohtia annotoituna parantajina geeni elimissä yleisesti, ettei kyse, kuten voisi odottaa. Sitten testasimme tehostajana rikastamiseen samalla tavalla ennustetekijöiden allekirjoitus geenin elimissä, ja geeni elinten yksittäisten klustereita.

Vastaa