PLoS ONE: Discovery analyysi TCGA Data paljastaa Association between Ituradan genotyypin ja Survival munasarjasyövässä Potilaat

tiivistelmä

Background

Munasarjasyöpä on edelleen merkittävä kansanterveydellinen taakka, jolla on korkein kuolleisuus kaikista naistentautien syöpiin. Tämä johtuu myöhään, jossa suurin osa munasarjojen syöpiä diagnosoidaan yhdistettynä alhainen ja vaihteleva vaste kehittyneiden kasvaimia standardin chemotherapies. Tähän mennessä kliinisesti käyttökelpoinen ennustajia hoitovasteen edelleen puuttuu. Tunnistaminen perintötekijöistä munasarjasyöpä selviytymisen ja hoitovaste on avainasemassa kehitettäessä prognoosi- biomarkkereita ja yksilöllisiä hoitoja, jotka voivat parantaa tuloksia varten myöhäisvaiheen potilailla, jotka koostuvat useimmissa tapauksissa.

Methods

tunnistamiseksi perustuslaillinen geneettistä vaihtelua edistävät munasarjasyöpä kuolleisuus, me selvitetty systemaattisesti assosiaatiot ituradan polymorfismien ja munasarjasyöpä selviytymisen tietojen avulla Cancer Genome Atlas Project (TCGA). Käyttäen vaihe-ositettu Coxin suhteellista riskiregressioanalyysiä, tutkimme 650000 SNP loci varten yhdessä selviytymisen. Olemme lisäksi tutkittiin, yhdistys merkittäviä SNP pelastautumiskoulutukseen muutettiin somaattisia muutoksia.

Tulokset

Ituradan polymorfismeja rs4934282 (AGAP11 /C10orf116) ja rs1857623 (DNAH14) liittyivät vaiheessa oikaistu selviytyminen (= 1.12e-07 ja 1.80e-07, FDR = 1.2E-04 ja 2.4e-04, tässä järjestyksessä). Kolmas SNP, rs4869 (C10orf116), oli lisäksi todettu merkittäviksi exome sekvenointitulosten; se on lähes täydellinen LD kanssa rs4934282. Yhdistykset pelastautumiskoulutukseen pysynyt merkittävänä, kun somaattisten muutoksia.

Johtopäätökset

Discovery analyysi TCGA tietojen paljastaa ituradan geneettisiä variaatioita, jotka voivat olla merkitystä munasarjasyövän selviytymisen jopa kesken myöhäisvaiheen tapauksissa. Merkittävä loci sijaitsevat lähellä geenejä aiemmin raportoitu olevan mahdollinen yhteys platinaa ja taksolin vastaus. Koska variantti alleelien merkittävät loci ovat yhteisiä (taajuudet rs4934282 A /C alleeleista = 0,54 /0,46, vastaavasti; rs1857623 A /G-alleelit = 0,55 /0,45, vastaavasti) ja ituradan variantit voidaan analysoida noninvasiivisesti, meidän havainnot tarjoavat mahdollisia kohteita lisäselvitysten kuin prognostisia biomarkkereita ja yksilöllisiä hoitoja.

Citation: Braun R, Finney R, Yan C, Chen QR, Hu Y, Edmonson M, et al. (2013) Discovery analyysi TCGA Data paljastaa Association between Ituradan genotyypin ja Survival in munasarjasyöpää sairastavilla potilailla. PLoS ONE 8 (3): e55037. doi: 10,1371 /journal.pone.0055037

Editor: Amanda Ewart Toland, Ohio State University Medical Center, Yhdysvallat

vastaanotettu: Marraskuu 9, 2011; Hyväksytty: 21 joulukuu 2012; Julkaistu: 21 maaliskuu 2013

Tämä on avoin-yhteys artikkeli, vapaa kaikki tekijänoikeudet, ja saa vapaasti jäljentää, levittää, välittää, modifioitu, rakennettu, tai muuten käyttää kuka tahansa laillista tarkoitusta. Teos on saatavilla Creative Commons CC0 public domain omistautumista.

Rahoitus: Kirjoittajat tukee Intramural tutkimusohjelma National Cancer Institute, Yhdysvaltojen National Institutes of Health, Bethesda, MD. Ei ollut ulkoisia rahoituslähteitä tätä tutkimusta varten. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Munasarjasyöpä osuus on noin kolme prosenttia kaikista naisten syöpätapausta ja on viidenneksi suurin syy syöpään liittyvät kuolemat naisten Yhdysvalloissa, jossa ikävakioitu esiintyvyys 12,8 prosenttia 100000 naista vuodessa ja kuolleisuus 8,6 prosenttia 100000 naista vuodessa (2003-2007) [1]. Naistentautien syöpiin, munasarjasyöpä on korkein kuolleisuus, joiden kokonaispituus viiden vuoden eloonjäämisaste 43,7% valkoisen naisilla ja 34,9% mustien naisten [1]. Köyhät selviytyminen tilastot johtuvat myöhään vaihetta, jossa munasarjojen syöpiä diagnosoidaan johtuen niiden oireeton luonteen: vaikka vaiheen I kasvaimet ovat 92,4% suhteellinen eloonjääneitä, niiden osuus on vain 15% munasarjasyövän diagnooseista; sitä vastoin vaiheen III ja IV syövät ovat eloonjäämislukuja 34% ja 18%, tässä järjestyksessä, ja yhteenlaskettu osuus 65,4% diagnooseista [1]. Vastauksena tavanomaisen kemoterapian (platina plus taksaani) vaihtelee suuresti [2], [3], ja yleensä se on huono edenneiden [2]. Ymmärtäminen geneettiset taustatekijät munasarjasyöpä selviytymisen ja hoitovastetta voi parantaa näitä tilastoja, erityisesti vaiheen III ja IV potilaat, jotka muodostavat enemmistön tapauksista. Erityisesti tunnistaa vaihtelut, jotka ennustavat vastaus kemoterapiaa mahdollistaa mahdollisuudesta käyttää vaihtoehtoista hoitoja, jotka voivat parantaa tuloksia.

Aiemmat tutkimukset ovat tutkineet rooli geneettistä vaihtelua munasarjasyövän alttius, etenemisen, hoitovasteen ja eloonjäämisen . On osoitettu, että BRCA1 /2 ituradan mutaatioita edistää 10-15%: ssa tapauksista [4], ja tietojen analysointi The Cancer Genome Atlas Project (TCGA [5]) on myös osoittanut, että BRCA1 /2 ituradan mutaatio, somaattinen mutaatiot ja promoottori metylaation vaikutusta munasarjasyövän säilymiseen [5]. Lisäksi ehdokas geeni tutkimukset ovat osoittaneet, että polymorfismeilla MDM2 yhdessä TP53 asema ja SULF1, liittyy munasarjasyöpä selviytymisen [6] – [8]. Äskettäin Huang ja työtoverit raportoitu geneettinen vaihtelu liittyy karboplatiinin sytotoksisuus in vitro ja in vivo [3], toteaminen mikä saattaa selittää ero vastaavuus standardiin platinapohjaiseen munasarjasyövän hoidossa. Samat tutkijat myöhemmin osoitti, että tunnistetut lokus säätelee miRNA jotka edistävät platina herkkyyden, mikä viittaa vaikutusmekanismi [9].

Toistaiseksi kuitenkin kliinisesti käyttökelpoinen genomista markkeri munasarjasyövän selviytymisen edelleen heikko. Platina-liittyvä SNP tutkimien Huang ei todettu merkittävästi liittyvän selviytyminen validointi kohortin [3]. Samoin Bolton ja työtoverit onnistuneesti tunnistettu useita loci liittyvät munasarjasyövän alttius, mutta ne ne alun perin todettu liittyvän selviytymisen ei päässyt merkitys validointi set [10], vaikka on toivottavaa, että tulevissa tutkimuksissa tämän kohortin tulee tuloksena perustettiin yhdistysten kliinisten tutkimusten tulosten kanssa [10]. Vaikka kasvaimen geeniekspression allekirjoitukset ennustavan hoidon vasteen ja uusiutuminen on raportoitu (esim [11], [12]), niiden kliininen hyödyllisyys rajoittavat kustannukset, invasiivisuus ja vaihtelevuus luontainen arvioitaessa kasvaimen geeniekspression. Samoin somaattiset kopioluvun muutoksia tiettyjen geenien on viime aikoina raportoitu vaikuttavan eloonjäämiseen [13], mutta hyödyllisyys mitata CNV ennustetyövälineenä testi on samalla tavoin rajoitettu.

Cancer Genome Atlas Project (TCGA [5] ) tarjoaa kokoelma genomista ja kliiniset tiedot, jotka yhdistysten välillä genetiikan ja selviytymistä voidaan perusteellisesti tutkittu. Täällä me toteuttaa genominlaajuisia analyysi systemaattisesti tutkia assosiaatioita

ituradan

geneettistä vaihtelua ja yleisen selviytymisen TCGA potilailla diagnosoitu munasarjasyöpä (serous kystadenokarsinooma) [14]. Potilailla oli iän ja jakelu tyypillinen munasarjasyövän, kuten on esitetty taulukossa 1. Käyttäen kliiniset ja Affymetrix SNP6.0 ( ”SNP6”) genotyypin data, olemme määritelleet kaksi yhden nukleotidin polymorfismi (SNP), lokusten jossa ituradan genotyyppi ennustaa kokonaiselinaika munasarjasyöpää sairastavilla potilailla. Liitot edelleen merkittäviä säätämisen jälkeen vaiheessa ja ne liittyvät selviytymisen vaikkapa vain vaiheen III potilaille. Tämä viittaa siihen, että perustuslaillinen geneettinen vaihtelu voi olla merkitystä hoitovasteen ja tarjoaa mahdollisen avenue ei-invasiivisia ennustetekijöiden biomerkkitesti.

Tulokset

Täällä raportoimme yhdistyksen välillä ituradan SNP ja potilaan eloonjääminen käyttäen TCGA munasarjasyöpä tiedot. Suodatettu data koostui yhteensä 662521 SNP analysoitiin 489 kliinisesti selityksin munasarjasyöpä näytteitä, vaiheen ja ikäjakauma taulukon 1. Kumpikin 662521 SNP täyttävät suodatus kriteerit testattiin yhdessä selviytymisen käyttämällä Coxin suhteellista riskiregressioanalyysiä oikaistu vaiheessa käyttäen summautumattomat malli. Kaksi SNP, rs4934282 (A /C) geenissä AGAP11 (aikaisemmin yhdistetty C10orf116) ja rs1857623 (A /G) ennen DNAH14, tilastollisesti merkitsevä univariate yhdessä yleisen munasarjasyövän säilymiseen, jotka esitetään taulukossa 2. juoni n-arvot saatu esitetään kuviossa 1. Olemme lisäksi laskenut per-alleeli riskisuhteita näiden SNP käyttämällä lisäainetta mallia saaminen HR = 0,599 (= 1.28e-08) varten alleelin rs4934282 ja HR = 1,425 (= 1.70e-05) varten alleelin rs1857623. On huomattava, että johtuen pienestä näytteen koosta, valta havaita SNP kanssa MAF = 0,45 (koska nämä ovat), jossa = 1e-06 on 32% HR = 0,6 ja 3,5% HR = 1,4; sen vuoksi on todennäköistä, että muut SNP vaikutuksiltaan vastaavia kokoja luultavasti ollut sattumalta tässä analyysissä.

rikvantiilin-kvantiili kuvaaja havaittujen arvojen todennäköisyyttä osamäärätesti lavan korjattu Cox malleja vs. odotettu jakelu arvojen itsenäisillä nollahypoteesi. Pisteet yläpuolelle osoittavat arvot, jotka ovat merkittävämpiä kuin odotettiin; suuri systemaattinen poikkeama tästä linjan olisi osoitus väestön alusrakenteen ajo tuloksia. Kaksi SNP tunnistettu merkittäviä, rs4934282 ja rs1857623, sijaitsevat reilusti rivi ja sen ulkopuolella pieni järjestelmällistä poikkeamista.

vaikutuksen valaisemiseksi rs4934282 (AGAP11 /C10orf116) ja rs1857623 (DNAH14 ) ituradan genotyypin selviytymisen keskuudessa potilailla, joilla on samankaltaisia ​​kasvaimen vaiheesta, Kaplan-Meier käyriä 372 vaiheen III potilaille annetaan kuvioissa 2 ja 3. on huomattava, että CC genotyyppi rs4934282 in AGAP11 /C10orf116 antaa suojaava vaikutus, lähes kaksinkertaistaa mediaani elinaika yli AA genotyyppi ryhmä. Lisäksi potilailla, joilla on homotsygoottinen CC rs4934282 on viiden vuoden eloonjäämisaste 45%, vs. 34% kaikkiaan vaiheen III potilaille [1].

Kaplan-Meier selviytymisen tontteja vaiheen III potilaille, stratifioituna ituradan genotyyppi rs4934282 (AGAP11): AA, musta; AC, sininen; CC, punainen. Luottamusvälit on esitetty varjostettuna alue ympärille Kaplan-Meier käyrä. Sensuroitu havainnot on merkitty pystysuora punkkeja. Katkoviivalla vaaka- ja pystysuorat viivat merkitsevät 50% eloonjääneitä viisi vuotta (1825 päivää) vastaavasti.

Kaplan-Meier selviytymisen tontteja vaiheen III potilaille, stratifioituna ituradan genotyyppi rs1857623 (DNAH14): AA, musta; AG, sininen; GG, punainen. Luottamusvälit on esitetty varjostettuna alue ympärille Kaplan-Meier käyrä. Sensuroitu havainnot on merkitty pystysuora punkkeja. Katkoviivalla vaaka- ja pystysuorat viivat merkitsevät 50% eloonjääneitä viisi vuotta (1825 päivää) vastaavasti.

lisätutkimuksia vaihtelua genomialuetta ympäröivä nämä SNP, tutkimme exome /kaapata sekvensoinnin tietoja (375 potilaalla on käytettävissä ituradan data) 100 kiloemäsparin ikkunat on keskitetty kahteen SNP tunnistettu merkittäviksi SNP6 tiedot, erityisesti CHR 10: 88672456-88772455 ja chr1: 223081228-223181227. Kymmenen näytteiden saatavilla koko genomin data, pystyimme vertailemaan introni rs4934282 ja rs1857623 Affymetrix SNP6.0 puhelut niitä kokonaisuudesta-Genomikartoituksen, joissa vahvistetaan SNP6 puhelut. Niistä 29 exome /talteenotto SNP testattu (katso taulukko 3), 375 näytettä, vain rs4869 vuonna C10orf116 jäi merkittävä oikaisun jälkeen useita hypoteeseja (FDR = 9.89e-03). rs4869 sijaitsee kp ylävirtaan rs4934282 ja on lähes täydellinen kytkentäepätasapainossa rs4934282 (A /C rs4934282 korreloi C /T: rs4869, vastaavasti). rs4869 koodaa samaa mutaatio C10orf116 (Ile68Ile). Tutkimme myös, onko muunnos alleeleissa tahansa näistä 29 loci johtivat vahingollisia nonsynonymous proteiinin muutoksiin; vain viisi SNP oli mis-sense alleelivaihtelujen, joista yksikään ei ennustettiin olevan haitallisia (taulukko 4).

Lopuksi käytimme tiedot on johdettu normaalista-pariksi kasvainnäytteestä arvioida, voimakas vaikutus ituradan genotyypin eloonjäämiseen merkitsevästi välittämä tai valvottu kasvaimen geeniekspression voitto tai tappio kopioluvun kasvaimessa tai heterotsygotian menetys (ks File S1) testata hypoteesia, jonka vaikutus ituradan genotyypin munasarjasyöpä selviytyminen saattaa vaikuttaa somaattisen tapahtumia. Löysimme mitään merkittävää yhdistyksen kasvaimen geeniekspression, kopioiden määrä vaihtelua, tai Heterotsygotian menetys näiden alueiden kanssa selviytymisen (katso File S1). Pikemminkin suuri vaikutus ituradan genotyypin klo loci potilaan eloonjääminen ei riipu näiden somaattisten muutosten, ja näyttää viittaavan siihen, että perustuslaillinen geneettinen vaihtelu näillä alueilla on tärkeä rooli hoitovastetta.

Keskustelu

Viimeaikaiset tutkimukset ovat osoittaneet, että yhteinen geneettisiä variantteja liittyy munasarjasyövän riskiä [15], [16]. On kuitenkin vielä vaikea ennustaa munasarjasyöpään selviytymisen riippumaton vaiheessa; Nykyinen kliiniset havainnot osoittavat, että kasvaimen vaste ja äärimmäisen lääkeresistenssin in vitro eivät ole hyviä ennustajia munasarjasyövän selviytymisen [17], [18]. Tutkimuksessamme olemme kattavasti testattu SNP analysoidaan niin, että TCGA SNP6.0 tiedot yhdessä selviytymisen, ja analysoidaan lisäksi koko genomin ja exome /kaapata SNP genomialuetta ympäröivä merkittävä SNP6.0 SNP. Havaitsimme kolme SNP kaksi genomialuetta että oli tilastollisesti merkittävää yhteyttä selviytymisen. Kuten taulukosta 2, vaaran suhdeluvut homotsygoottinen pieniä alleelien saavutetaan tai ylitetään kaksijakoinen vaiheessa-ositettu Coxin suhteellisen vaaran malleja, ja per-alleelin vaikutus koot näiden SNP käyttäen vaiheessa ositetut lisäaine genotyypin malli olivat HR = 0,599 ja HR = 1,425 varten rs4934282 ja rs1857623, vastaavasti. Mielenkiintoista, mikään somaattisen vaihtelut selvitimme (kasvain geenien ilmentymisen, kopioluvun vaihtelua, ja Heterotsygotian menetys) liittyivät joko ituradan genotyyppi näissä loci tai eloonjääminen huolimatta uskottavaa hypoteesia, että somaattisia muutoksia kasvain saattaa olla vaikutus genotyyppi-selviytymisen -alueella. Pikemminkin nämä SNP: t ovat voimakkaasti ennustava selviytymisen riippumaton somaattisia muutoksia, jotka oli jo tapahtunut kasvain (katso File S1).

Kaksi selviytymisen liittyvän SNP: t sijaitsevat 2200 emäsparin alue kromosomissa 10 ( rs4934282 at CHR 10: 88732476 ja rs4869 osoitteessa CHR 10: 88730312) ja ovat lähes täydellinen LD tässä aineistossa. Tämä genominen alue liittyy C10orf116 (CHR 10: 88727949-88730672) ja AGAP11 (CHR 10: 88730498-88769960), jotka ovat päällekkäin; biologista merkitystä vaihtelun luotaamaa rs4934282 ja rs4869 voi liittyä joko. AGAP11 on jäsenenä ankyriiniproteiinista toista ja GTPaasina verkkotunnuksen Arf GTPaasia aktivoiva proteiini geeniperheen [19]. C10orf116 (kutsutaan myös APM2) on proteiini, jonka toimintaa ei tunneta, joka on homologinen keskipitkän ketjun nisäkkään clathrin liittyvä proteiini monimutkainen ja on mukana vesicular liikenteen hiivassa. Genominen alue, joka sisältää rs4934282 ja rs4869 on esitetty kuviossa 4.

Yksityiskohtainen kuvaus genomisen alueen kromosomin 10 sisältävät rs4934282 (toinen SNP oikealta) ja rs4869 (näkyy vihreänä). Huomaa päällekkäisyys AGAP11 ja C10orf116.

Vaikka vähän ennen näyttöä on yhdistää AGAP11 syöpään alttius, selviytymisen tai hoitovaste, jonkin verran näyttöä olemassa roolin C10orf116. C10orf116 /APM2 ilmentyminen on osallisena muissa gynekologiset syövät; Esimerkiksi, on on osoitettu voimakkaasti erottaa BRCA1 liittyy rinta- kasvaimen alaluokkien ESR1-positiivisia ja ESR1-negatiivinen [20], ja on todettu vaimentua in utering syövän useissa tutkimuksissa [21]. Viime aikoina, C10orf116 on osoitettu olevan erilainen ekspressio eri patologisissa laadut munasarjasyövän [22] ja vasteen rintasyövän kemoterapia [23], [24].

Vielä tärkeämpää on, on olemassa kohteesta solulinjat osoittaa C10orf116 välittäjänä sisplatiinin vastarintaa. Munasarjasyöpä on käsitelty platinayhdisteille monta vuotta [25], [26], sisplatiinin ja karboplatiinin (joka on enemmän acceptible toksisuusprofiili) kuin tavanomaista hoitoa vastikään todetun vaiheen III munasarjojen syöpiä [26], [27 ]. Vaikka monet potilaat reagoivat ensimmäiseen hoitoon, viiden vuoden eloonjäämisluvut edelleen huonot (34% kokonaisuudessaan vaiheen III [1]). APM2 (C10orf1116) on osoitettu edistävän sisplatiinin vastusta yliekspressoituu HCT116 solulinjoja, jotka olivat herkkiä kemoterapiaa ja säteily [28], mikä viittaa mahdollisen mekanismin, jolla rs4869 ja rs4934282 vaikuttaa eloonjäämiseen. Hiljentäminen APM2 mukaan shRNA on osoitettu lisäävän sytotoksisia vaikutuksia sisplatiinin kasvaimen ksenografteja kasvatettiin CD-1-nude-hiiriin. Lisäksi, APM2 havaittiin olevan yli-ilmentynyt sisplatiinin resistenttien mahasyövän soluja, mutta ei mahasyövän resistenttejä soluja 5-FU tai doksorubisiini [29]. Viime aikoina on havaittu, että rs1649942, SNP sijaitsee 5 Mb ylävirtaan rs4934282 /rs4869 ollut vaatimaton yhdessä karboplatiinin aiheuttama sytotoksisuuden ja selviytymisen munasarjasyöpä potilaista karboplatiinia kemoterapian [3]. Vaikka tämä SNP ei päästy merkitystä heidän vaiheessa 2 validointi analyysi (ja myöskään merkittävää tutkimuksessamme), se lisää kehon todisteita siitä tämän genomin alueella platinaa herkkyyteen.

Kolmas merkittävä SNP, rs1857623 , löytyy käytettäessä intergeenisessä kromosomi 1, 53 Kb ylävirtaan DNAH14 ja 136 Kb alavirtaan CNIH3. DNAH14 kuuluu dynein raskaan ketjun perhe, moottori proteiinia, joka kiinnittyy mikrotubuleiksi ja kävelee pitkin cytoskeletal mikrotubuleiksi [30]. Mekanismi, jolla vaihtelu DNAH14 saattaa vaikuttaa selviytyminen on epäselvempi. Yksi mahdollinen avenue tuleville tutkimuksia on mahdollista asemaa yhteydessä taksolin hoito: DNAH14 sisältää mikrotubuleihin sitova varsi dynein moottorin (pfam12777 at Sijainti: 2910-3244 viittaus proteiinia NP_001364.1), ja se on osoitettu, että taksoli sitoo mikrotubulusten [28]. DNAH14 on myös todettu olevan säädellään eri tavalla vastauksena taksaania hoidon mahasyövistä [31] ja Doksorubisiinihoitoon endometriumin soluissa [32].

Nämä havainnot viittaavat siihen, että perustuslaillisen geneettistä vaihtelua näillä alueilla voi olla merkitystä munasarjasyövän selviytymisen jopa kesken myöhäisvaiheen tapauksissa. On kuitenkin syytä huomata, että tässä esitetyt tulokset muodostavat löytö perustuva analyysi, joka ei sisältynyt validointi kohortti. Sinänsä havainnoilla olla väärä vääriä positiivisia, ja vaativat vahvistusta seurantatutkimuksia. Jos validoitu, nämä SNP voi olla merkittäviä kliinisiä potentiaalia prognostisia biomarkkereita koska ituradan genotyyppi voidaan määrittää eiinvasiiviseen koska variantti alleelien merkittävät loci ovat yhteisiä (taajuudet rs4934282 A /C alleeleista = 0,54 /0,46 vastaavasti; rs1857623 A /G-alleelit = 0,55 /0,45, respectvely; molemmat verrattavissa alleelifrekvenssit Kaukasian CEPH väestön HapMap [33]). Merkittävä lokuksen sijaitsevat geenit aikaisemmin tunnistettu olevan mahdollinen yhteys kemoterapia-vaste, mikä viittaa siihen, että niiden ja selviytymisen voi johtua niiden vaikutusta hoitovasteen. Tutkimuksemme osoittaa potentiaalisia prognositic testejä ja yksilöllisiä hoitoja, ja tarjoaa perustan jatkotutkimuksen.

Materiaalit ja menetelmät

Data

Data keräsi TCGA projekti kuten muualla on kuvattu [14]. Follow-up kertaa, elintärkeä asema, kasvain vaiheessa ja ituradan genotyyppitietoja saatiin TCGA hanke [14] kautta tietoja portaaliin 06/03/2011.

SNP6 genotyyppejä.

genotyyppi kehottaa 906600 SNP koettimet testattiin käyttämällä Affymetrix GenomeWide SNP6.0 alustalla ja käsitellään käyttäen Linnunsiemenet saatiin TCGA. Näytteitä, jotka eivät läpäise TCGA laadunvalvonta (per TCGA kopiomäärä Datojen Relationship Format tiedosto) poistettiin. Kaikkiaan 496 munasarjojen vakavien kystadenokarsinooma potilaalla oli elinaika ja ituradan (verta tai kasvaimeen vieressä normaali) genotyyppitietoja. Genotyyppi puhelut koodattiin 0, 1 tai 2 mukainen määrä variantin alleelien ja suodatetaan mukaan Linnunsiemenet luottamusta kynnys 0,05.

genotyyppitietoja joutuivat ylimääräistä laadunvalvontaa suodatus kriteerit seuraavasti. SNP kanssa puhelun hinnat tai vähäinen alleelifrekvenssit suljettiin, koska olivat SNP ulos Hardy Weinberg tasapainon kanssa. Kaikki näytteet, joiden puheluun keskimäärin alle 80% suljettiin pois. Identity valtion laskettiin käyttäen R GenABEL paketti, ja liittyy läheisesti näytteitä IBS poistettiin. SNP ja näytteen suodatus perusteita sovellettiin toistuvasti, kunnes kaikki näytteet ja SNP täyttänyt asetetut kynnysarvot. Kaikkiaan 489 näytettä ja 662521 SNP läpäissyt pidettiin analyysiin.

Kasvain vaiheessa.

Stage alaluokkia olivat coalesced varten tämän analyysin yhteenveto vaiheessa luokkiin tuotti neljä vaihetta luokituksia (ts , Stage IA, IB, IC käsiteltiin Stage I, jne.). Näytteiden määrä kussakin vaiheessa luokassa on esitetty taulukossa 1.

Exome /kaapata tiedot.

Seuraava sukupolvi exome /kaapata sekvenointitulosten myös noutaa 375 potilaalla, joiden ituradan tietoja. Analyysi rajattiin 100 kiloemäsparin ikkunat on keskitetty kahteen SNP tunnistettu merkittäviksi SNP6 tiedot, erityisesti CHR 10: 88672456-88772455 ja chr1: 223081228-223181227. Graafinen kuvauksia näistä genomialueiden annetaan kuvioissa 5 ja 6.

Kuva cgwb.nci.nih.gov valittujen raitojen genomin rakentaa NCBI36 (hg18) varten ympäröivällä alueella kaksi ituradan vaihtelut liittyvät eloonjäämisen munasarjasyövän C10orf116 /AGAP11 kromosomi 10. kappaleet ovat mukautetun raita osoittaa SNP rs4869 ja rs4934282, RefSeq geeni, mRNA, saumattu EST ja mapability.

Kuva cgwb.nci.nih gov valittujen raitojen genomin rakentaa NCBI36 (hg18) alueelle ympäröivä ituradan vaihtelu liittyy selviytyminen munasarjasyövän ylävirtaan DNAH14 kromosomissa 1. kappaleet ovat mukautetun raita osoittaa SNP rs1857623, RefSeq geeni, mRNA, saumattu EST ja mapability.

binäärisekvenssijoukot Tasaus /kartta (BAM) tiedostoja ladattu dbGAP käyttäen kutakin näytettä suurimman käytettävissä normaalin BAM tiedosto. ”Mpileup” ja ”bcftools” piirteitä SAMtools [34] käytettiin tuottamaan variantti puhelutiedot, jossa kutsuvan kriteerit seuraavasti: jos kattavuus tietyllä näyte tietyssä lokuksessa oli vähemmän kuin peitto kynnysarvoa (katso seuraava kappale ), ei soitettiin; muuten, jos ei-viite alleelin taajuus oli alle 10%, puhelu oli ”homotsygoottinen viittaus,” jos ei-ohjetaajuus oli yli 90%, puhelu oli ”homotsygoottinen nonreference,” jos se oli välillä 10% ja 90 %, puhelu oli ”heterotsygoottinen.”

Jos haluat asettaa kattavuus kynnystä exome /tallentamaan tietoa, vertasimme exome /kaapata puhelut SNP6 ituradan genotyyppi vaatii 41 tag SNP sijaitsee näillä alueilla. Käsittelemällä SNP6 puheluun kultakantaan tarkkuutta, me määrittelemme ”epäsuhta”, jota on määrä vaatii exome /talteenottoon ja SNP6 tiedot poikkeavat jaettuna kokonaismäärä exome /kaapata soitetuista tuohon kattavuus syvyys. Koska kattavuus kynnystä on kasvatettu ja exome /kaapata tiedot ovat luotettavampia, epäsuhta pienenee, mutta vähemmän exome /talteenotto voi soittaa puheluja. Me vaihteli kattavuutta kynnys 5-30, valitaan pienin kattavuus tuotti epäsuhta nopeudella pienempi kuin 0,05. Optimaalinen kattavuus oli 9 (jossa on epäsuhta nopeudella 0,045).

pidetään locus informatiivinen (toisin sanoen se on riittävä vaihtelu) jos vähintään 20 ituradan näytettä oli heterotsygoottinen puhelun että kattavuus kynnys; nämä kriteerit saadaan 29 yhteensä informatiivinen SNP 100 kiloemäsparin alueita ympäröivän rs4934282 ja rs1857623, esitetään taulukossa 3, jota pidetään analyysissä.

Survival analyysi

Survival analyysi suoritettiin R [35] käyttäen ”Survival” paketti [36]. Jokaisen SNP edustettuina tiedot, Coxin suhteellista riskiregressioanalyysiä mallintamiseen käytettiin selviytymisen funktiona genotyypin. Koska merkittävää yhteyttä vaiheen selviytymisen, kaikki mallit olivat ositettu vaiheessa. Genotyyppi puhelut käsiteltiin kategoriseksi muuttujiin 0 kuin vertaisverkko ryhmä välttää asettamasta lineaarisuuden määrää variantin alleeleja. Jokainen malli tuotti kaksi riskisuhteita per SNP (yksi genotyypin = 1 suhteen genotyypin = 0 ja toinen genotyypin = 2 w.r.t. genotyyppi = 0). Merkitys yhdistyksen arvioitiin käyttäen logrank (Score) testi [37]. Testi on Schoenfeld jäännösten käytettiin tarkistaa, onko suhteellisten riskien oletus täyttyy; ainoastaan ​​malleja, joissa pidettiin voimassa. 639510 SNP testattu täyttänyt suhteellisten riskien oletusta.

Koska suuri määrä SNP merkitsee lukuisia hypoteeseja testataan useita testaus tehtiin oikaisuja arvoja. Tämä tehtiin kahdella tavalla. Raportoimme sekä väärien löytö korko [38] () varten saadut arvot muuttujen edellä esitetyt testit. Lisäksi raportoimme permutaatio käyttämällä saatuja arvoja 600000 riippumaton resamplings datan. Permutation testejä, kun taas laskentaintensiivisiä, pidetään vahvin ja sopivin valvonnan tyypin I virhenopeuksia genominlaajuisten tutkimuksia [39] – [41].

tutkimiseksi olemassaolo ja vaikutus arvioita populaation kerrostuneisuus R paketti GenABEL [42] käytettiin tutkimaan väestön alusrakenteeseen. Genominen inflaatiotekijä arvioitiin, mikä osoittaa, että väestö alusrakenne, jos läsnä, ei pitäisi olla mitään merkittävää vaikutusta tuloksiin. Käyttämällä satunnaisesti valittu joukko 12000 riippumattomia (pareittain LD) SNP kanssa MAF, väestö alusrakenne tutkittiin käyttäen pääkomponenttianalyysi. Pairwise käyrät neljän ensimmäisen komponentit annetaan Tiedosto S2. Sopeutimme malleja kahdella tavalla: käyttämällä neljän ensimmäisen PC, ja käyttää klusterin toimeksiantoja tunnistaa PCA käyttämällä R paketti mclust [43]. Kuten odotettua perustuen, havaitsimme mitään huomattavaa muutosta Cox Mallitulosten (tuloksia ei ole esitetty). Tässä esitetyt tulokset eivät siten ole oikaistu väestön alusrakenteen.

Sekvensointitiedot analyysi

Vertasimme SNP6 genotyypit on merkittävä loci (CHR 10: 88722456 ja chr1: 223131228) lähtöisin oleviin kokonaisessa Genomikartoituksen tiedot 10 käytettävissä näytteitä; kaikki 10 Hyväksytty SNP6 vaatii merkittäviä SNP, tukemalla SNP6 genotyypin puhelut.

kaksi SNP osoittaa merkittävää yhteyttä selviytyminen SNP6 data, me tutki tarkemmin ympäröivään genomialuetta käyttäen yhdistettynä koko genomin ja exome /kaapata sekvenointitulosten. Olemme tutkineet 29 SNP genomisessa alueiksi, jotka ympäröivät rs4934282 ja rs1857623 on esitetty taulukossa 3, ja on valittu edellä kuvatulla tavalla. Vaihe-ositettu Coxin suhteellisen vaarat mallit sitten rakennettu ituradan genotyyppien kuten edellä on kuvattu. On huomattava, ei rs4934282 eikä rs1857623 sisällytettiin riittämättömän exome /tallentamaan tietoa (rs4934282 on introni- alueella ja näin ollen ei analysoitu, että exome /tallentamaan tietoa; rs1857623 ollut mitään puheluja ei ole useimpien näytteiden).

on huomattava, että kaikki genomialuetta edistää näitä tietoja ovat ainutlaatuisia sekvenssejä. Tämän arvioimiseksi käytimme ”mapability” perusteiden toteutettu CGWB [44]: kunkin lokuksen harkitaan, pidämme liukuva 75 emäsparin sisältävä ikkuna että lokus ja yrittää sovittaa sen muille alueille genomissa; uran on merkitty ainutlaatuinen, jos jokaisen aseman liukuvan ikkunan, sekvenssi vain kartoittuu sijainti ikkunan eikä muita genomin alueella. Loci joille jotkin (tai kaikki) asennoissa liukuvan ikkunan sisällä sekvenssejä, jotka kartoittavat useisiin genomialuetta, on merkitty ristillä taulukossa 3, joka osoittaa, että lukee edistää puhelut että lokus voi olla epäspesifinen.

ennustaminen aminohapon substituutiot

tutkinut SNP taulukossa 3 mis-sense vaihdot käyttäen ohjelmaa ANNOVAR [45] ja ennusti niiden toiminnalliset vaikutukset proteiinisekvenssien kanssa logRE ja SIFT. LogRE on, että suhde HMMER-arvot, että sovitettiin PFAM motiivi domeeni Kahden aminohapposekvenssin, jotka eroavat aminohapposubstituution. LogRE pisteet, jonka absoluuttinen arvo on suurempi tai yhtä suuri kuin 1 osoittaa, että aminohappo muutos on omiaan vaikuttamaan proteiini [46]. SEULOA on sekvenssihomologia-pohjainen työkalu, joka lajittelee Intoleranssi alkaen Suvaitsevainen aminohapposubstituutioita ja ennustaa haitallisia aminohapposubstituutioita. SIFT arvot ennustetaan olevan haitallisia [47]. SNP pitää yllä viiden mis-sense-SNP: t tunnistettiin: kolme MMRN2 (rs3750823, rs4934281, rs34587013), yksi SNCG (rs9864), ja yksi AGAP11 (rs2641563). Ei ole kuitenkaan mitään todisteita siitä, että nämä aminohappo muutokset ovat toiminnallisia vaikutuksia proteiineihin (taulukko 4).

Analyysi somaattisten muunnelmia

Sen hypoteesin testaamiseksi, että somaattiset muutokset saattavat olla lisäaineen tai hillitsevä vaikutus yhdistyksen välillä ituradan genotyypin ja munasarjasyövän selviytymisen, käytimme TCGA saatujen tietojen pariksi kasvainnäytteestä arvioida, onko kasvain geenin ilmentymistä, voitto tai tappio kopioluvun kasvaimessa tai heterotsygotian menetys liittyi merkittävästi selviytymistä. Täydellinen kuvaus menetelmistä ja tulokset tämä analyysi on annettu File S1. Mikään näistä ylimääräisiä kovariantteja olivat merkittäviä.

tukeminen Information

Tiedosto S1. Tool Menetelmät ja tulokset analyysin somaattisten muunnelmia.

doi: 10,1371 /journal.pone.0055037.s001

(PDF)

Tiedosto S2. Tool Menetelmät ja tulokset väestön alusrakenteen analyysin.

doi: 10,1371 /journal.pone.0055037.s002

(PDF) B

Vastaa