PLoS ONE: tunnistaminen tuumorisuppressoreilla ja Onkogeenit genomisesta ja Epigeneettiset ominaisuudet munasarjasyövässä

tiivistelmä

tunnistaminen geneettisen ja epigeneettiset muutokset peruskoulusta kasvainsolujen on tullut yleinen tapa tunnistaa geenien kriittinen kehittymistä ja etenemistä syövän. Pyrimme tunnistamaan ne geneettisiä ja epigeneettiset poikkeamia, joilla on eniten vaikutusta geenien toiminnan sisällä kasvain. Ensin suorittaa bioinformatiikan analyysi kopioluvun vaihtelu (CNV) ja DNA: n metylaatio kattaa geneettisen maisemaa munasarjasyöpä syöpäsoluja. Me erikseen tutkittu CNV ja DNA: n metylaatio 42 ensisijaisen serous munasarjasyöpä näytteitä MOMA-ROMA määrityksissä ja 379 kasvain analysoidut näytteet The Cancer Genome Atlas. Olemme tunnistaneet 346 geenejä, joilla on merkittäviä deleetioita tai monistuksissa joukossa kasvain näytteissä. Hyödyntämällä liittyy geenien ilmentyminen tietojen ennustamme 156 geenien muuttuneeseen kopiomäärä ja korreloivat muutoksia ilme. Näistä geeneistä CCNE1, POP4, UQCRB, PHF20L1 ja C19orf2 sisäpuolelta löytyi molempia aineistoja. Olimme kiinnostuneita nimenomaan kopioluku vaihtelua kuin meidän pohja genomista omaisuutta ennustaminen tuumorisuppressoreilla ja onkogeenien muuttuneen munasarjakasvain. Siksi muutosten tunnistamiseksi DNA: n metylaation ja ilmaisun kaikille vahvistetaan ja poistetut geenit. Me tilastollisesti määrittää tuumorisuppressoriproteiinia ja onkogeenisten ominaisuuksia näissä menettelyissä ja suorittaa korrelaatioanalyysiä ilme. Me ennusti 611 potentiaali onkogeenien ja tuumorisuppressoreita ehdokkaat integroimalla nämä tietotyyppejä. Geenit, joilla on vahva korrelaatio metylaation riippuvat ilmentyminen muuttuu näytteillä vaihtelevilla kopioluku kromosomipoikkeavuuksien kuuluvat CDCA8, ATAD2, CDKN2A, RAB25, AURKA, BOP1 ja EIF2C3. Tarjoamme kopiomäärä vaihtelua ja DNA metylointianalyysi yli 11500 yksittäisten geenien kattaa geneettinen maisemaa munasarjasyöpä kasvaimia. Näytämme laajuus genomista ja epigeneettiset muutokset tunnetuille tuumorisuppressoreilla ja onkogeenien ja myös käyttää näitä määriteltyjä ominaisuuksia tunnistaa mahdolliset munasarjasyöpään geenin ehdokkaita.

Citation: Wrzeszczynski KO, Varadan V, Byrnes J, Lum E, Kamalakaran S, Levine DA, et ai. (2011) tunnistaminen tuumorisuppressoreilla ja Onkogeenit genomisesta ja Epigeneettiset ominaisuudet munasarjasyövässä. PLoS ONE 6 (12): e28503. doi: 10,1371 /journal.pone.0028503

Editor: Xin-Yuan Guan, The University of Hong Kong, Kiina

vastaanotettu: 25 heinäkuu 2011; Hyväksytty: 09 marraskuu 2011; Julkaistu: 08 joulukuu 2011

Copyright: © 2011 Wrzeszczynski et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat puolustusministeriön W81XWH-05-1-0068, Starr Foundation (https://www.starrcancer.org) ja Philips Research Pohjois-Amerikassa. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Osa tästä rahoittajaorganisaatio Philips Research Pohjois-Amerikassa. Vinay Varadan, Sitharthan Kamalakaran ja Nevenka Dimitrova ovat työntekijöitä Philips Research Pohjois-Amerikassa. Ei ole olemassa patentteja, tuotteiden kehittämiseen tai kaupan tuotteiden julistaa. Tämä ei muuta tekijöiden noudattaminen kaikki PLoS ONE politiikan tietojen jakamiseen ja materiaaleja, yksityiskohtaisena online-oppaassa tekijöille.

Johdanto

Yhdysvalloissa, tulee olemaan yli 22000 uutta tapausta munasarjasyövän 2011. Näistä noin 14000 periksi tauti. Jotta voitaisiin paremmin hoitaa näitä naisia ​​ja parantaa selviytymistä, tavoitteenamme on selvittää molekyylitason muutoksia, jotka ovat tapahtuneet potilaan kasvaimia, ja pystyä tulkitsemaan merkitystä näillä muutoksilla on kasvua ja kehitystä kasvain. Tämä poikkeava kasvu on seurausta kromosomipoikkeavuuksien ja epigeneettiset vaihtelut [1], [2]. Lisäksi yleensä alhainen somaattisten nukleotidin mutaation munasarjasyövän verrattuna muihin kiinteisiin kasvaimiin viittaavat suurentuneeseen merkityksen kopioluvun ja epigeneettiset poikkeavuuksia. Tämän tyyppinen asetus on osoitettu vaikuttavan monien tuumorisuppressoreilla ja oncogenes liittyvät munasarjasyöpä [3].

Kopioi numero variaatioita (CNV) ovat yhteinen esiintyminen kaikissa muodoissa syövän [4], [5] [6], [7], [8], [9]. Tyypillinen syöpä näytteestä keskimäärin 17% monistukset ja 16% deleetiot koko genomin. Somaattiset kopioluvun muutoksia on osoitettu vaikuttavan merkittävästi reittejä, joihin liittyy kinaasi toiminto, solusyklin säätelyssä, Myc ja NF-KB: n verkkoja ja apoptoosin [4]. Detection Näiden muutosten ja tunnistaminen erityisiä geenejä vastaava syövän leviämisen voi auttaa molekyylitasolla alatyypin syöpiin ja johtaa kohti enemmän yksilöllisiä syöpää tyyppikohtaisia ​​hoitojen [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20].

Epigeneettiset ominaisuuksia syövän genomin korreloivat kehitystä ja toimintaa syöpäsolun [1], [21], [22], [23], [24]. Erityisesti, DNA: n metylaatio on geenin promoottori alueet voivat säädellä geeniekspressiota eri onkogeenien ja tuumorisuppressoreita [25], [26], [27]. On ehdotettu, että kokonais-DNA: sytosiini 5C-metylaatio normaalin ja syöpäsolujen näyttää uudelleen tiettyihin CpG loci in syöpäsolun [28], [29]. Lakkaa toimimasta tai transkription hiljentäminen kautta hypermetylaation on tunnistettu tuumorisuppressorigeeneille, kun taas hypometylaatio syyksi on onkogeneesiin ja menetys painamista ominaisuuksia tiettyjen syöpään liittyvät alleelit [1], [30].

Kasvain vaimennin ja onkogeeni genomista ja epigeneettiset ominaisuudet vaihtelevat suuresti sisällä munasarjasyöpään [3]. Tunnetut tuumorisuppressoreilla ja oncogenes eivät ole yhtä edistää syövän. Toivomme tunnistaa ne geneettisiä ja epigeneettiset poikkeamia, joilla on eniten vaikutusta geenien toiminnan sisällä kasvain. Monet nykyisen bioinformatiikan protokollat ​​käyttävät ainoastaan ​​yhden modaali analyysi määrittää geenin toiminnan tietyn kasvaimen tyyppi. Genomi lähestymistapa yhdistämällä useita lähteitä geneettinen poikkeavuus tiedot on tarpeen ennustamiseen mahdollisesti johdonmukainen ja epigeneettiseltä integroituja väyliä, jotka toimivat kasvainten synnyssä. Suoritimme laajan bioinformatiikan analyysi kopioluvun vaihtelua, ilmaisun ja epigeneettiset tietoja tunnistamaan mahdollisia tuumorisuppressoreilla ja oncogenes liittyvät vakavasta munasarjasyöpä. Analysoidaan 42 itsenäistä serous munasarjasyöpä näytteitä ja hyödyntämällä Cancer Genome Atlas (TCGA; https://tcga.cancer.gov) [31] tietojen vertailua ja parantaa meidän protokollaa, me tunnistaa epänormaali DNA kopioluvun kanssa korreloi muutoksiin metylaatio ja ilmaus serous munasarjasyöpä geenejä. Yhdistelmä epigenetic ja ilmaisun tietojen analysointi voidaan mahdollisesti antaa tietoja nimenomaan molekyylitasolla ja syövän alatyyppejä ja valottaa geenit ajo erilaisten kasvainten [28], [32], [33], [34], [35]. Siten lopulta mahdollistaa kliinikoiden sisällyttää tämäntyyppisiä kattavan multimodaalisen datan selvittämisestä kasvaimeen biospesifiseen diagnostiikan ja polku ohjataan terapeuttisia [36].

Methods

Patient Näytteet (MSKCC Data) B

Kasvain DNA 42, joilla on vasta diagnosoitu, hoitamaton, pitkälle, serous munasarjojen karsinoomat nähty Memorial Sloan Kettering Cancer Center välistä ajanjaksoa vuoden 1992 toukokuusta helmikuun 2003 saadut mukana tässä tutkimuksessa. Näytteet kerättiin alla tutkimussuunnitelmissa hyväksymien Memorial Sloan-Kettering Cancer Center IRB. Tutkimuksessa potilaan näytteitä ja analyysin kaikista näytedatan noudattanut suuntaviivoja Memorial Sloan-Kettering Cancer Center IRB ja hyväksyi Memorial Sloan-Kettering Cancer Center IRB. Potilaat yksilöllisesti toimitti kirjallisen tietoisen suostumuksen käyttämään yksilöitä tutkimustarkoituksiin. Lisäksi käytimme 7 munasarjakudoksen normaali näytteestä saatujen Cooperative Human Tissue Network, varasto kudosten ja kasvain materiaali hoitaa National Institutes of Health. Kutsumme tätä potilaan ja normaali näyte asetetaan MSKCC keräämiseen.

Kopioi numero Detection kautta Representational Oligonukleotidi Microarray Analysis (ROMA) B

ROMA protokolla aiemmin esittämiä [11], [15 ], [37] suoritettiin high-density oligonukleotidi joukon sisältäessä ~85,000 ominaisuuksia valmistaa Nimblegen Systems Inc. Lyhyesti, monimutkaisuus-vähentää esityksiä [38], joka koostuu pienistä (200-1200 bp) fragmenttien tuotettu pilkkomalla DNA-näytteiden restriktioendonukleaasilla Bglll, monistettiin adapteri-välitteisen PCR genomi-DNA [11]. DNA-näytteet (2 ug) leimattiin joko Cy5-dCTP tai Cy3-dCTP käyttämällä Amersham-Pharmacia megaprime -leimauskittiä ja kilpailukykyisesti hybridisoitiin toisiinsa samassa slide [11]. Hybridisaatiot koostui 35 ui hybridisaatio- liuosta (37% formamidia, 4 x SSC, 0,1% SDS, ja leimatun DNA). Microarry hakemus ja hybridisaatio suoritettiin, kuten aiemmin on raportoitu [11]. Skannaaminen Axon GenePix 4000B skanneri käyttäen pikselikoko 5 pm ja kaikki tiedot on tuotu S-Plus 2000 analyysin ohjelmisto (syvällisiä, Seattle, WA). Normalisoitu loki suhteet kustakin kokeessa keskimäärin per segmentointia. Sitten soveltanut CBS (Circular Binary Segmentointi) algoritmi näihin tietoihin. CBS segmentointimenetelmää on pyöreä binary segmentointialgoritmi kuvatulla Olshen, AB. et. al. [39]. Kuten ennen analyysiä, CNV segmentit määritellään alueet tilastollisesti yhdistetyn koettimen (merkki) intensiteetit laskema CBS algoritmilla [39], [40]. Kaikki yleinen analyysi ja tilastot laskettiin käyttäen S-plus, R paketit ja yksittäiset Perl /Python skriptejä. Kaikki ROMA data on MIAME yhteensopiva ja löytyvät GEO tietokannassa (https://www.ncbi.nlm.nih.gov/geo/) varten alasarjan hakunumero GSE28013.

Metylointi Detection kautta Representational Oligonukleotidi microarray Analysis (MOMA) B

MOMA-protokolla suoritettiin, kuten aiemmin on kuvattu [41], [42]. MOMA metylointi ilmaisuryhmän on suoritettu ja validoitu solulinjoissa ja syöpäsolunäytteen näytteitä. Selityksin varustettu genomista CpG saari paikkakunnalla saatiin UCSC genomista selain. Tuolloin kokeen genomin sisältämien 26219-CpG-saarekkeiden välillä 200-2000 bp. Nämä CpG saari paikoissa katettiin MspI rajoitus pirstoutuminen. Arrays valmistanut Nimblegen Systems Inc. käyttäen 390.000 koettimia muodossa. CpG saari huomautus ihmisen genomista rakentaa 33 (hG17) käytettiin suunnitella 50-mer laatoitus array. Ensisijainen restriktioendonukleaasin käytetään MspI. Keittoprosessin jälkeen linkkerit ligatoitiin ja materiaali puhdistetaan fenoli kloroformilla, saostettiin, sentrifugoitiin ja suspendoitiin uudelleen. Materiaali on jaettu kahtia, puoli se pilkottiin endonukleaasilla McrBc erittelyn mukaan New England Biolabs ja toinen puoli on mock pilkottu. Menetelmät hybridisaatio ja pesu on raportoitu aiemmin [41]. Menettely suoritettiin kahtena väriaineella-swap Toisessa kokeessa. Tarrat vaihdettiin välillä McrBc käsiteltyjen ja mock näytteitä. Kunkin koetin, geometrinen keskiarvo suhteet (GeoMeanRatio) sekä McrBc käsiteltyjen ja kontrolli Sitten näytteet lasketaan koetta kohti ja siihen liittyvän väriaineen swap. Microarray kuvat skannattiin GenePix 4000B skanneri ja data uutettiin käyttäen Nimblescan ohjelmistoa (Nimblegen Systems Inc). GeoMeanRatios kaikkien näytteiden tietueiksi Sitten normalisoitiin käyttäen kvantiili normalisoinnin menetelmää [43]. Kaikki yleinen analyysi ja tilastot laskettiin käyttäen S-plus, R paketit ja yksittäiset Perl /Python skriptejä. Kaikki MOMA data on MIAME yhteensopiva ja löytyvät GEO tietokannassa (https://www.ncbi.nlm.nih.gov/geo/) varten alasarjan hakunumero GSE27940.

Gene Expression Analysis for Human Munasarjojen kasvain Näytteet

Gene Expression data suoritettiin käyttäen Affymetrix Human Genome U133A array: GEO alustan tunniste GPL96. RNA eristettiin käyttäen Trizol-protokollaa. RNA muunnetaan cDNA: ta ja kaksijuosteinen cDNA käytetään templaattina in vitro transkriptio reaktiossa, joka sisälsi biotinyloidun CTP ja UTP lisäksi neljän modifioimattoman ribonukleosiditrifosfaattien. Standardi Affymetrix protokollaa käytetään. Lopullinen signaali voimakkuudet käsitellään käyttäen RMA normalisoinnin menetelmää on affy paketin R Bioconductor 2.5. Kaikki array data on MIAME yhteensopiva ja vastaavat CEL-tiedostot löytyvät GEO tietokannassa (https://www.ncbi.nlm.nih.gov/geo/) varten alasarjan hakunumero GSE27943.

Cross- modaalinen analyysi Cancer Genome Atlas data (TCGA data) B

Kopioi numero vaihtelu tietojen primääri munasarjojen kasvaimia on ladattu TCGA (https://tcga.cancer.gov/) ja CBS [39] datatiedostot Agilent SurePrint G3 Human 1 M CGH (vertaileva Perimän Hybridisaatio) Microarray etikettipuoli mskcc.org_OV.CGH-1 × 1M_G4447A analysoitiin. CBS käsitellyt tietoja TCGA sitten selityksin kanssa UCSC Genome Browser hg18 kokoonpano tietoa määrittää kopioluvun vaihtelu seg.mean arvot per geeni näytettä kohti. Jotta opiskellakseen CNV per geeni rajoitimme tietojamme yhtä täydellistä CBS segmentin geeniä kohti näytettä kohti. Näin ollen, jos geenilokus osittain kattaa kahden tai useamman CBS segmenttiä näytettä kohden emme sisällyttää se meidän analyysi. Vain jos täydellinen geenilokus oli näytteessä CBS segmentti oli siinä sisällytettiin analyysimme. Lisäksi me eivät aiheuttaneet CBS segmentti informatiivinen (num.info) arvo on alle 4. Lisäksi jotta kaapata merkittävä CNV me vain analysoiduista näytteistä 90% tiedoista ilman 5% tiedoista lähimpänä seg. keskiarvo 0 alkaen positiivisen ja negatiivisen arvon jakelu. TCGA metylaatio tiedot on saatu jhu-usc.edu_OV.HumanMethylation27.2.lvl-3 tiedostoihin kunkin vastaavan kasvain- ja normaalissa näytteessä. Tämä on peräisin Illumina Infinium Human27-metylaatiomääritystä. Lopullinen keskimääräinen beeta-arvon geenien kanssa 2 tai useamman antureista laskettiin per geeni näytettä kohti. Lopuksi TCGA ekspressiotietojen käyttää tähän analyysi oli peräisin broad.mit.edu HT_HG-U133A geenin ilmentymisen tiedosto kunkin vastaavan kasvain ja normaali näyte ajaa Affymetrix GeneChip- HT Human Genome U133A array. Tutkimme 379 näytettä TCGA jotka olivat aikaan analyysimme. Ennen lopullista toimittamista meidän käsikirjoituksen Cancer Genome Atlas on julkistettu alustava selvitys munasarjasyöpäpotilailla [31]. Meidän käyttö TCGA tietokokonaisuus on parantaa ja vertailla tuumorisuppressoriproteiinia ja onkogeeni etsintäprotokolla että me soveltaa MOMA-ROMA (MSKCC) aineisto. Tunnustamme muita vastaavia havaintoja olemme tehneet käyttämällä pöytäkirja TCGA aineisto todettuun viime TCGA julkaisu.

bioinformatiikka- Analyysi MSKCC Copy Number (ROMA), DNA Metylointi (MOMA) ja Expression Data

Kaikki analyysi suoritettiin käyttäen Perl, Python, Matlab, ja R paketteja. Strategiamme oli tutkia epigeneettiset ja genomisen ominaisuuksia mahdollisia tuumorisuppressoreilla ja onkogeenien primääri munasarjojen kasvaimia. Kun pohja ominaisuus on kopioluvun vaihtelua tarkastellaan metylaatio ja ilmaisun tiedot kunkin geenin monistettu tai poistettu kopioluku olosuhteissa. Siksi onkogeenin on luokiteltu monistetun geenin, jolla on alhainen metylaation ja kohonnut ilmentyminen (kuvio 1). Tämä sama monistettu onkogeeni voidaan epigeneettiseltä säännellä hypermetylaation munasarjasyövän tuloksena on vähentynyt ilmentyminen vaikka kopiomäärä monistetaan. Kääntäen, kasvain vaimennin voi laskeneet kopiomäärä vaihtelua ja voidaan hypermetyloitunut mikä laski ilmentymistä tai säännellä hypometylaatio mahdollistavat sen ilmentymistä alensi CNV olosuhteissa (kuvio 1). ROMA fragmentit johtuvan geenejä käyttäen UCSC Genome Browser hG17 kokoonpano. Me tunnistetaan näyte vertailun TCGA alustan ja romanifoorumin (jolle 7 näytteet olivat yhteistä) romanien alustakohtaisia ​​kynnyksen 0,0 seg.mean joka kaappaa enimmäisosuudesta poistetut geenit säilyttäen vähintään väärä positiivinen prosenttiosuus monistettua tai neutraaleja kopio geenejä. Lopullinen geeni metylaatio toimeksianto suoritettiin käyttäen suurinta koetin arvon kullekin MOMA fragmenttia ja suurin MOMA fragmentti arvo johtui lähinnä geenin. Wilcoxonin allekirjoitettu-rank-testiä käytettiin laskemiseen rikastamiseen p-arvot CNV ja ilmaisun tiedot sekä Benjamini-Hochberg (BH) menetelmää käytettiin Multitest säätö ja False Discovery Rate (FDR) kontrolli. Euklidinen metriikka laskettiin normaalin ja kasvaimen näytteitä metylaation ja ilmaisun datapisteitä kaikkien geenien sekä MSKCC ja TCGA aineistoja. Kun kyseessä on MSKCC datajoukon kun riittävä normaalissa näytteessä ilmaisua tietoja ei ollut saatavilla, 50 × bootstrap näytteenotto suoritettiin käyttäen TCGA normaalia näytettä ekspressiotietojen per geeni. Single variate ja Hotelling monimuuttuja t-testit suoritettiin seuraavilla etäisyydet laskea kaikki p-arvot suoritettaessa metylaation ja ilmaisun analyysi vaihtelevilla kopioluku arvot, jossa tilastollinen useita testi FDR säädöt kuten yllä. Jotta voitaisiin tunnistaa todennäköisesti toiminnallisia ja reitin muutokset vangiksi meidän ominaisuus perustuu geenin analyysi testasimme, onko jäsenyys ennustettu MSKCC geenien kunkin toiminnon luokan sisällä yhteensä 173 Kegg biologisten reittien oli suhteessa niiden kokoon. Tämä tarkoittaa tunnistaa polkuja, jonka geeni jäsenyys kussakin ominaisuus luokassa poikkeaa merkittävästi null, jotka on määritelty hypergeometrisen jakeluun. Lopullinen luettelo merkittävistä polkuja valittiin jälkeen ohjaamalla vääriä löytö korkoa Benjamini-Hochberg useita testaus korjauksen. Tietojen analysointi skriptit ja edelleen analyysi tiedot löytyvät Analysis S1.

Kopioi numero vaihtelu on perusta genomista ominaisuus meidän tunnistamiseksi tuumorisuppressorigeenin ja onkogeeninen geenin ominaisuuksia munasarjasyöpä. Onkogeeni voidaan yliekspressoituvan alle monistaa kopiomäärä ja alhainen metylaatio, kun taas hypermetylaation voidaan säännellä ilmentämiseen geenin monistettu tilassa. Samoin vähentynyt tuumorisuppressoriproteiinia ilmentyminen voi johtua osittain kopioluvun menetyksen kanssa hypermetylaation. Tuumorisuppressoreilla voidaan myös mahdollisesti säädellään hypometylaatio on kopiomäärä poistettu totesi. Analyysimme on mallinnettu tällaisia ​​ominaisuuksia ja tutkii ensin CNV per geeni ja sitten attribuutteja epigeneettiset muutos jokaiselle kopiomäärä poikkeamia geenien ilmentyminen.

Tulokset

munasarjakasvain Kopioi numero Aberrations ja DNA metylointi

ensimmäinen erikseen tarkastellut sekä kopiomäärä vaihtelua ja DNA: n metylaatio kunkin geenin kromosomaalinen asema 42 serous primääri munasarjojen kasvaimia antamat Gynekologiassa Research Laboratory at Memorial Sloan-Kettering Cancer Center (MSKCC tietokokonaisuus) käyttämällä Representational Oligonukleotidi Microarray Analysis (ROMA) [37], [44] ja metylointi havaitseminen Oligonukleotidi Microarray Analysis (MOMA) [41], [42]. Vahvistetut ja poistetut breakpoint lokusten kattavat yhteensä 561 alueiden kesken kaikissa näytteissä (kuvio 2). ROMA tunnistaa 205 poistetaan ja 356 vahvistusta breakpoints. Raja-arvot määriteltiin alueiden välillä kunkin segmentin (tilastollisesti yhdistetty koetin intensiteetti) lasketaan käyttämällä CBS (pyöreä binary segmentointi [39], [40]) menetelmällä. Niistä 42 kasvain näytteet, löydämme keskimäärin 76 CBS lasketaan segmenttiä per kromosomi. Segmentointi laskennalle per kromosomi vastasi kromosomi koko paitsi kromosomien 8, 11, 12, 17, 19, ja 20, joissa segmentointi tiheys oli suurempi kuin normalisoitu kromosomi koon ja vähemmän kromosomien 6, 9, 10, 14, 15, 16, ja 18. suurin vaihtelu kopioluvun vaihtelu (mitattuna CBS segmentointi keskiarvot) kaikkien näytteiden tapahtuu kromosomeissa 19, 2, 10 ja 4, vastaavasti (kuva S1). Yleisimmät poistot ( 10% kasvainnäytteestä) havaittiin loci; CHR4: Q25-q35.2, CHR7: p22.3-p15.3, CHR 8: p23.3-p21.1, chr13q12.11-q34, chr14q32.2-q32.33, chr15q13.3-q21.1, chr16q11.2-q24.3, chr17p13.3-q25.3, CHR 19: q13.2-q13.43 ja CHR 22: q11.21-q13.33 (taulukko 1 antaa osuus kaikista näytteistä poistetaan sisällä loci). Yleisimmin vahvistetaan ( 10% kasvainnäytteestä) loci kaikissa kromosomeissa kaikkien 42 kasvainnäytteestä ovat; chr1: p34.4-p34.1, chr1: q21.1-q21.2, CHR3: q13.2 Q23, CHR 8: q11.22-q24.3, CHR 19: Q12-q13.12 ja CHR20: Q13. 12-q13.2 (taulukko 1). Kolme breakpoint symmetria loci (monistukset ja poistot samoilla genomista tehtävissä useiden näytteiden) havaittiin; CHR 17: q11.2-q21.32, CHR 19: q13.12-q13.2 ja CHR 21: q21.3-22.13. Verrattaessa ROMA tulokset (taulukko 1) ja kopioi määrä dataa normaalien yksilöiden löytyy HapMap [45] osoittaa mitään päällekkäisyyttä harvoista monistettu alueita löytyy HapMap normaalissa keräämiseen. Päällekkäiset alueet poistetaan välillä CNV tulosten ja HapMap ovat 8p23 ja 22q11.23 jossa molemmat alueet osoittavat usein heterotsygoottinen menetys. Sitten analysoitiin DNA-metylaation CpG-saarekkeiden käyttäen samaa 42 primääri munasarjojen kasvaimia ja 7 normaalin kudoksen näytteissä (kuvio 3). Olemme koonneet metylaatio arvot 11978 geenin promoottori alueet kattavat 22 kromosomia. Kun suoraan verrattuna normaaliin kudokseen yhteensä 68 geenien havaittiin rankattu hypermetyloitunut ja 19 rankattu hypometyloidut 10% koko normaalin kasvaimen suhde jakelu (taulukko S1). Geenit, joilla metylaatio arvot normaalia näytteitä ovat onkogeeni PHOX2B, The neuroblastooma liittyvän geenin ALX3, yleisesti metyloitua PCDHα geeniklusterin, POU4F2, REXO1L1, BAPX1, ja kalium-kanavan KCNJ8. Erityisesti REXO1L1, (RNA-eksonukleaasi) osoittaa korkeita metylaation sekä kasvaimen ja normaali näytteet kuitenkin on 56%: n nousu metylaation tuumorinäytteissä. Geenit alin kasvaimen normaaliin metylaation suhteet sisältävät kromosomissa 4 variantti onkogeenisel- edistää geeni ubikitiinipromoottori hydrolaasi DUB3 (19% vähennys) ja CAPS (onkogeeni osallisena kohdun limakalvon syöpä, 25%: n lasku). Muut hypometyloidut geenejä verrattuna normaaliin näytteet ovat; RNPC3, USP37, LDHD, GJB4 (aukkoliitos proteiini), LCN8 (sekaantunut etäpesäke) ja CGB1 (istukkagonadotropiinia, beta polypeptidi 1) (taulukko S1).

Breakpoint kannat kopioluvun vaihtelua (deleetioita kuvattu sininen, monistukset kuvattu punaisella) 22 kromosomeissa näkyvät määritetään ROMA syntyy segmentointi tiedot. Alkuperäinen muuttamalla poisto tai vahvistusta perimän asemaa kuvataan kaikista 42 munasarjatuumorissa syöpänäytteissä.

kasvain: normaali suhde prosenttiosuus MOMA metylaation per geeni 42 munasarjasyöpä kasvain näytteet ja 7 kudoksen normaalia näytteiden hahmoteltu per kromosomi. Kunkin näytteen keskiarvo metylaatio arvo lasketaan suurimman MOMA -arvo anturi, joka sisältää geenin promoottorialue. MOMA metylaatio kuuluvia tietoja 11978-geenin promoottori alueille. Näkyvä hypermetylaation (punainen) ja hypometylaatio (vihreä) geenit merkitty ja esitetty taulukossa S2.

korrelaatiot Gene Expression kanssa Kopioi numero vaihtelu tai DNA Metylointi

erikseen tutki riippuvuus geenin ilmentymisen (välityksellä Affymetrix Human Genome U133A array, katso menetelmät) kappaleeseen numero vahvistus, kopioiden määrä poistetaan ja promoottori metylaatio munasarjasyövän kasvaimia. Ensin verrataan jakelun geeniekspression diskreetti korkean ja matalan CNV geenit löytyy meidän MSKCC datasarja ja TCGA keräämiseen. Kaksi aineistoja osoitti vastaavia suuntauksia ilmaisun jakelu geenien korkean ja matalan kopioluvun vaihtelua (Kuva 4, Kuva S2). Koska kopioluvun muutos nousee poistetaan monistusta keskimääräinen geenien ilmentyminen lisää myös (kuvio 4). Siksi osoittavat myös korrelaation kokonaismäärän lisääntymiseen geeniekspression monistaminen geenikopiomäärä primääri munasarjojen kasvaimia. Lisäksi olemme mitattu kumulatiivinen geeniekspression poistetut ja monistettujen geenien. Kumulatiivinen jakauma on kokonaisprosenttiosuus geenien alapuolella dynaaminen ilme kynnys. Jos geenit, joilla on alhainen CNV (poistetaan) on enemmän alle ilmaistaan ​​kuin geenejä, joilla on korkeampi CNV (monistettu ja yli ilmaistuna) kumulatiivinen käyrä aiheuttaa jyrkempi nousu alemmilla ilmaus arvot poistetut geenit (mikä osoittaa suurempaa osaa geenejä löytyi alempi lauseke arvot). Korkeintaan kumulatiivinen ilmaisun ero 7-17% on havaittu geenien alhaisen kopioluvun verrattuna geenien suuren kopiomäärän (kuva S3). Seuraavaksi suoritimme ilmaisua CNV korrelaatio per geeni kaikkien kasvain näytteet sekä MSKCC datasarja ja TCGA keräämiseen. Havaitsimme 124 geenejä, joilla on positiivinen CNV ilmaisuun Pearsonin korrelaatiokerrointa rajat ≥0.8 että TCGA datajoukon (p-arvot 1,0 × 10

-10, taulukko S2B). Seg.mean vahvistusta ja poisto-alue MSKCC datajoukon ei ole niin suuri kuin havaittiin TCGA datajoukon (kuviot S1 ja S2), ja siksi vähemmän geenejä siepataan merkittäviä CNV ilmaisuun korrelaatioita. Olemme kuitenkin pystyvät tunnistamaan 32 geenien Pearson korrelaatio values≥0.6 (p-arvot 4,0 x 10

-5, taulukko S2A) kanssa 18 32 geenien myös yksilöity TCGA datajoukon (taulukko S2A).

Koska geenikopiomäärä vaihtelu kasvaa poistamiselta monistusta keskimääräisen geeniekspression myös lisää sekä MSKCC (sininen viiva) ja TCGA (vihreä viiva) aineistoja.

Suur-geenin ilmaisun erot normaalin ja kasvaimen näytteitä ei havaita ennen kuin luottaa vain ne näytteet, joissa geenejä äärimmäisen monistukset ja poistot (kuva 4). Siksi lähestymistapamme geenien tunnistamiseen on muuttunut kopioluvun vaihtelu korreloi ilmentyminen oli tutkia ilmentymistä arvoja geenien korkean ja matalan kopioluvun seg.mean arvoja ja verrata ilmentymistä näiden geenien kuin normaalin kudosnäytteistä. Eräässä tapauksessa, jossa on kopio numero aberraatiota normaaleissa näytteissä tämä samantyyppinen korrelaatio olisi noudatettava. Tutkimme vain kasvain näytteet koska suuruus ja laajuus kopioluvun muutoksia on vielä merkittävämpää havaitaan kautta protokollan. Aluksi laskimme keskimääräisen ilmaisu arvo kunkin geenin, jossa 20% tuumorin näytteissä oli CNV arvo on yli 0,50 seg.mean tai alle -0,50 seg.mean ja suodatetaan pois geenejä, joiden normaali ilmentyminen ei ollut sisällä standardin poikkeama (oletus TCGA CNV kynnysarvoja käytettiin, jotka vastaavat vähintään yhtä monistetaan tai poistetaan kopioida ja kyky vangita niin monta muuttuneessa CNV näytettä per geeni kuin mahdollista). Tämä tiukat kriteerit 20% TCGA kasvainnäytteestä jää 21 geenejä (taulukko S3). Nämä 21 geenejä, kuten CCNE1 ja GSTT1 edustavat kaikkein muuttuneen CNV geenit kasvaimen näytteiden ero ilme verrattuna kudoksen normaaliin näytettä TCGA keräämiseen. Kuitenkin tämä lähestymistapa on suuresti riippuvainen normaali geeni keskimääräinen ekspressiotasoja. For TCGA, aikaan meidän analyysi ilmaisun oli saatavilla vain 8 näytettä nimetty normaali. Näin ollen, geeni, kuten MYC (useimmiten yli ilmaistaan ​​kasvaimen solut), jossa on keskimäärin näytteen ilmaisu arvo 8,93 kahdeksan TCGA normaalia näytettä (kuvio S4), ja keskimääräinen kasvaimen näytteen ilmentymistä arvo 7,75 (339 kasvainnäytteet) ei havaita tällä menetelmällä. Suorittamalla kasvain näytteen analyysin emme täysin poistaa nämä vaihtelut mutta toivottavasti rajoittaa suuruusluokkaa.

Jottei luottaa pienten normaalia kudosta näytteenotto ilmaisun arvojen, teimme Wilcoxonin testi vain ilmaisun arvot on vähintään 20% tuumorin näytteitä hyvin matala ja korkea-geenin kopioluku seg.mean kynnysarvot. Vuonna TCGA kasvain datasarjan tämä tuotti joukon 54 geenien väärä löytö korko 5% seg.mean arvoihin 1,25 ja -0,50 korkean ja matalan kopioluvun vaihtelu, vastaavasti (taulukko 2, taulukko S4). Määrä geenejä jää riippuu suuren kopiomäärän segmentointi keskiarvo käytetään suodatus kynnys (säilyttäen joukko matalan kopio kynnyksen -0,50 siten vähintään pyydystää Heterotsygotian menetys per geenin [8]; kuva S5). Kaikkiaan 1114 geeneistä kiinni (FDR 0,05) alemmissa CNV kynnys 0,8 seg.mean (kuva S5). Kun Wilcoxonin testi löydämme geenejä, kuten MYC, CCNE1, KRAS, NDRG1, MLL4 ja MTSS1, joista tietoja asetetaan erityisiä normaalia kudosta ilmentyminen voi olla merkittävästi erilainen kuin kaikki kasvain näytteissä, mutta vaihtelee välillä matala ja korkea kopioluku kasvainnäytteestä. Konservatiivinen kynnys rajoitukset 20% kasvaimen näytteen sisällyttäminen tuloksena tunnistettiin geenien äärimmäisestä CNV loci kuten kromosomien 1, 8, ja 19. Mielenkiintoista, transkriptiotekijä CEPBG havaittiin hyvä CNV ilmaisuun korrelaatio ja myös ilmaisun ja metylointi korrelaatiota MSKCC keräämiseen. Samoin suorittamista Wilcoxonin testi MSKCC kasvainnäytteestä korkealla kopiomäärä kynnys ≥0.5 ja alhaisen kopioluvun ROMA alustakohtaisia ​​kynnyksen 0,0 (katso menetelmät) me jää 62 geenien väärä löytö korko ≤0.05 (taulukko 2 , taulukko S4). Geenit tunnistettu MSKCC tietojoukon olivat samantyyppisiä genomisesta loci kuin löytyy TCGA keräämiseen. Viisi geeniä ennustettiin sekä aineistoja: CCNE1, POP4, UQCRB, PHF20L1 ja C19orf2 (taulukko 2). Olemme integroineet ekspressiotietojen kanssa CNV määrittää geenejä, jotka ovat todennäköisemmin ehdokkaita toiminta syövän geenien mahdollisten tuumorisuppressoriproteiinia ja onkogeenisten CNV-ilmaisun ominaisuuksia. Tämä tekee joukko geenejä jatkotutkimuksissa enemmän lähestyttävissä toiminnallinen validointi geenien vaikuttaa geneettinen poikkeavuuksia.

analysoitiin myös klassisen riippuvuus DNA metylaatio geeni- promoottori alueille että geenien ilmentymisen. Metylointi data osoittaa huonompi korrelaation ilmaisun kuin kopioluvun vaihtelu (kuva S6). Määritimme Pearson korrelaatioita DNA metylaatio ja geenien ilmentymisen sekä MSKCC ja TCGA munasarjojen primaarikasvaimen aineistoja. Pearsonin korrelaatio arvot 0,5 (p-arvot 2,0 x 10

-4, alhainen metylaatio ja korkea ilmaisun korkea metylaation ja heikkoa ilmentymistä) havaitaan 86 geenien välillä aineistoja. Näkyvästi, koodaavan geenin ubikitiinipromoottori B (UBB) esittää korkea korrelaatio metylaatio ja ilmaisun sekä tietomääriä ja RAB25 tunnetun munasarjasyöpään epäilty on myös löydetty TCGA datajoukon [31], [46] (taulukot S2A ja S2B)

Vastaa