PLoS ONE: Cancer Gene priorisointi kohdennettuja resequencing käyttäminen FitSNP Scores

tiivistelmä

Background

Vaikka välityskykyä seuraavan sukupolven sekvensointi lisääntyy ja samalla kustannuksia vähenee huomattavasti, sillä suurin osa laboratorioiden koko Genomikartoituksen suurten ikäluokkien syövän näytteitä ei ole vielä toteutettavissa. Lisäksi pieni määrä genomit ovat sekvensoidaan on usein ongelmallista loppupään tulkinnan merkityksen variantteja. Kohdennettu resequencing voi osittain kiertää tämän ongelman; keskittymällä rajoitettuun määrään ehdokkaan syövän geenien järjestyksessä, lisää näytteitä voidaan sisällyttää seulonta vuoksi ja siksi huomattava parannus tilastollinen voima. Tässä tutkimuksessa onnistuneen strategian priorisoimiseksi kandidaattigeenit kohdennettua resequencing syövän genomien on esitetty.

Tulokset

neljä priorisointia strategiat arvioitiin kuudella eri syöpätyyppejä: geenit luokittelun näitä strategioita ja positiivinen ennustearvo (PPV) tai mutaatioaste sisällä kärkipään geenien verrattiin lähtötilanteeseen mutaation määrä jokaisessa kasvaimen tyyppi. Onnistunut strategiat tuottavat geeni luetteloita, jossa yläosa on rikastettu tunnettujen mutatoituja geenejä, mistä on osoituksena kasvu PPV. Selkeä esimerkki tällaisesta parannus näkyy paksusuolensyöpä, jossa PPV on kasvoi 2,3-kertaiseksi verrattuna lähtötasoon, kun 100 top fitSNP geenejä sekvensoitiin.

Johtopäätökset

Geeni priorisointi strategia perustuu fitSNP tulokset näyttää olevan menestynein tunnistamaan mutatoitunut syövän geenien eri kasvain yhteisöjä, joissa varianssi geeniekspressiotasot hyvänä toiseksi paras.

Citation: Fieuw A, De Wilde B, Speleman F , Vandesompele J, De Preter K (2012) Cancer Gene priorisointi kohdennettuja resequencing käyttäminen FitSNP tulokset. PLoS ONE 7 (3): e31333. doi: 10,1371 /journal.pone.0031333

Editor: Giuseppe Novelli, Tor Vergata University of Rome, Italy

vastaanotettu: 14 heinäkuu 2011; Hyväksytty: 06 tammikuu 2012; Julkaistu: 01 maaliskuu 2012

Copyright: © 2012 Fieuw et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Dr. Fieuw ja Dr. De Wilde ovat predoctoral kaverit tukee apurahan Tutkimussäätiön – Flanders (https://www.fwo.be/). Tohtori De Preter on jälkeisten Fellow Research Foundation – Flanders. Tutkimus tukee tieteellisen tutkimuksen rahasto (lupanumeroon G.0198.08), liittovaltio Institution (lupanumeroon NKP_29_014) ja koordinoivan Research Actions (lupanumeroon 01G01910). Tämä työ tehtiin osittain käyttäen Stevinin Supercomputer Infrastructure Gentin yliopistossa rahoittama Gentin yliopisto, Hercules Foundation ja Flanderin hallitus – Department of Economy, Science and Innovation. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

tällä hetkellä syöpä exome ja Genomikartoituksen on teknisesti mahdollista seuraavan sukupolven sekvensointiteknologioihin jotka tarjoavat suuren läpimenon ja alhaiset kustannukset per base verrattuna klassiseen Sangerin sekvensointia [1]. Kuitenkin, johtuen valtava määrä sekvenssidatamäärät syntyy molemmissa koodaus ja ei-koodaavat genomiset alueet, haaste tunnistamiseksi taudin asiaan mutaatioita tai variaatioita syntyy. Lisäksi koska korkeat kokonaiskustannukset nämä uudet tekniikat, niin genomin laajakuva suoritetaan tyypillisesti rajallinen määrä näytteitä, mikä vähentää tilastollista tällaisten tutkimusten. Siksi kohdennettu resequencing on vielä suoritettu ja edelleen asianmukainen ja voimassa oleva menetelmä, jota voidaan kiertää näitä kysymyksiä [2]. Keskittymällä erityisiä kandidaattigeenit, suurempi kohortti näytteitä voidaan seuloa, mikä lisää tilastollinen voima tietojen analysointia ja mahdollistavat paremman syrjiä kuljettajan ja matkustajan mutaatiot. Myöhempi väheneminen määrän syntyy sekvenssi-informaation, liittyy usein korkeampi kattavuus syvyys, helpottaa huomattavasti käsittelyä ja tietojen tulkintaa.

Ratkaisevaa tällaisen kohdennettu lähestymistapa vaatii menetelmän priorisoida ja rationaalisesti valita sopivat kandidaattigeenit sisällyttää sekvensointi vaivaa. Tutkimuksen tavoitteena oli arviointia neljän eri strategioita priorisoida kandidaattigeenit kohdennettua resequencing syövän genomien.

Ensimmäinen lähestymistapa perustuu fitSNP (toiminnallisesti interpoloimalla yhden emäksen monimuotoisuus) tietokanta, joka sisältää differentiaalikaavojen suhde (DER ) arvot yli 18000 ihmisen proteiinia koodaava geeni [3]. Nämä DER arvot lasketaan mRNA geeniekspression opintoja GEO (geenien ilmentymisen omnibus) tietokanta [4] ja edustavat suhde useita tutkimuksia, joissa geeni on todettu ekspressoitua eri ja useita tutkimuksia, joissa geenin ilmentymisen on arvioitu. Geenit Der arvot yli 0,55 näyttävät liittyvän taudin esiintyminen liittyy variantteja [3]. Tässä oletamme, että DER geenin arvoa voidaan käyttää ennustamaan mutaatioiden läsnäolon syövän genomien.

Toinen priorisointi strategia liittyy fitSNP lähestymistapaa, ja se perustuu todellisen varianssin geenin ekspressiotasot yhden kasvain kokonaisuuden (laskettu keskihajonnan eräässä tietokokonaisuus). Tämä hypoteesi perustuu siihen ajatukseen, että varianssi geeniekspression on aiheuttanut yksi tai useampi häiriön mekanismeja, mukaan lukien geenien mutaatiot.

korrelaatiokerroin geeni-ilmentymisen tasojen ja geenin kopioluvut arvioitiin kolmasosa strategia, voidaan tunnistaa annoksen herkkien geenien. Meidän hypoteesi toteaa, että annostus herkkiä geenit ovat alttiimpia hankkia mutaatioita, jotka voivat purkamaan niiden ilmentymistä ja toimintaa.

Lopullinen strategia liittyy Knudson kaksi osuma hypoteesi, että todetaan, että tuumorisuppressorigeeneille ovat biallelically inaktivoitu [5 ]. Siksi tutkitaan onko geenien kanssa tiheä kopioluvun tappio (ensimmäinen osuma) poikki Tietueen todennäköisemmin mutaatio (toinen osuma).

Tässä tutkimuksessa olemme erityisesti tutkittu, onko ylhäältä sijoittui geenien priorisoitu geeni luettelot ovat todennäköisesti kuljettaa somaattisesti hankittu mutaatioita. Sen lisäksi kandidaattigeenillä ranking perustuu yhteen priorisointi strategian, meillä on myös tutkittu, jos yhdistelmiä voitaisiin parantaa alkuperäisen tuloksia. Julkisesti saatavilla aineistoja käytettiin, joka koostuu kopioluvun, geenien ilmentyminen ja mutaatiostatuksesta tietojen kuudelle eri kasvainten tyyppiä: rintasyöpä, paksusuolen syöpä, haimasyöpä, munasarjasyöpä, glioblastooma ja varhaissolukasvaimessa. Taulukossa 1 esitetään yleiskatsaus eri tutkimusten ja näytteiden määrä käytettävissä erilaisia ​​tietoja kerrosten.

Tulokset

vertailu yhden priorisoinnin strategiat

Neljä single priorisointi strategioita verrataan keskenään ja perustason PPV kuuden eri kasvaintyypeissä erikseen. Käyrät esitetty graafisesti kuvassa 1 edustavat useita geenejä, jotka on sekvensoitu, jolloin saadaan tietty määrä mutatoituja geenejä. Käyrät perusviivan alapuolelle pisteen rikastumista mutaatio geenien sijoilla geenit ja osoittavat arvokkaita strategian kohdennettuja resequencing.

Mutaatio tontteja osoittavat määrä geenejä, jotka on ratkaistava asteittain (y-akseli), jotta löytää tietty määrä mutatoituja geenejä (kuvattu x-akseli), kuudelle eri kasvaintyypeissä. V: paksusuolensyöpä; B: haimasyöpä; C: rintasyöpä; D: munasarjasyöpä: E: glioblastooma; F: medulloblastoma.

fitSNP käyrä paksusuolensyöpä osoittaa selvästi, että priorisointi perustuu fitSNP DER arvoihin johtaa valtava parannus löytö mutatoitujen geenien verrattuna satunnaisessa geenien (kuvio 1A) . Kun 100 top fitSNP geenit sekvensoitiin, PPV tai mutaatio nostetaan 2,3 kertaiseksi verrattuna lähtötilanteeseen PPV (11% verrattuna 4,7%) (taulukko S1). Tämä näkyy myös määrä geenejä, jotka on ratkaistava asteittain löytää 10 mutatoituja geenejä; enemmän kuin kaksinkertainen määrä satunnaisesti valittujen geenien (213) olisi sekvensoitiin verrattuna 93 top fitSNP geenejä. Vaikka fitSNP ylittää selkeästi muiden priorisointia strategiat paksusuolensyöpä, muut kolme myös menestyksekkäästi priorisoida muuntunut geenejä, vaikka sillä ilmaisun varianssi tämä parannus on nähnyt vain top 100 geeneistä (kuvio S1A). Suurin PPV, joka voidaan saada paksusuolen syöpä on 50% top 4 fitSNP geenejä (taulukko S1).

Myös haimasyöpä, fitSNP strategia päihittää muut strategiat ja satunnaisessa (kuvio 1 B). Sekä ilmaisua varianssi ja taajuus kopioluvun menetys ei merkittävää parannusta havaittiin. Riittämättömän vastaavia geenien ilmentyminen ja kopioluku tietoja haimasyöpä, annosta ei herkkyys arvot voitiin määrittää. Lisääntyminen PPV alkaa suurempien geenin luetteloiden haimasyöpä verrattuna paksusuolen syövän ja on jo selvää alkuun 250 geenejä. Yksitoista mutatoitunut geenit löytyvät kun top-100 fitSNP geenit sekvensoidaan (PPV: 11%), verrattuna 6 geenien mutaatioita varten satunnaisessa 100 kandidaattigeenejä (PPV: 6,5%), mikä on lähes 2-kertainen lisätä (taulukko S1). Top 7 fitSNP sijoittui geenien enintään PPV 28,6% saatiin (taulukko S1, kuva S1B).

rintasyöpää sairastavaa fitSNP strategia näyttää jälleen parannusta verrattuna lähtötasolle, mutta tämä parannus on melko vaatimaton. Esimerkiksi löytää 10 mutatoitunut geenit, 164 random geenien tulisi sekvensoida verrata 150 alkuun fitSNP geeneistä (kuvio 1 C, taulukko S1). Ilmaisu varianssi strategia osoittautuu parempi kuin satunnainen geeni valinnan vain, kun ylimmän 50 geenit sekvensoitiin. Geeni annostus herkkyys ei johda paranemiseen tuloksia tällä kasvaimen tyyppi. Jotta top-100 fitSNP geenien ja top-50 ilmentyminen varianssi geenien jyrkkä nousu PPV on läsnä, mahdollisimman PPV 25% (top-4-geenit) ja 16% (top-6 geenejä) (taulukko S1, kuva S1C ).

Koska perustason PPV munasarjasyöpä on hyvin alhainen (0,73%), yli 1300 satunnaisesti geenejä olisi ratkaistava asteittain löytää 10 geenien mutaatiosta (kuvio 1 D). Kuitenkin, kun keskitytään alkuun fitSNP geenejä, vain noin puolet vähemmän on sekvensoitu (651), joka vahvistaa, että fitSNP strategia on myös pätevä strategia tämän kasvaimen tyypistä. Vähemmässä määrin geeni annostus voisi myös lisätä useita mutatoituja geenejä löytynyt saman määrän sekvensoitiin geenejä.

Jäljellä olevien kahden kasvaintyypeissä, glioblastooma ja medulloblastooma, ilmaisu varianssi sijaan fitSNP strategia näyttää näyttämään parhaat tulokset (kuvio 1 E, 1F). Glioblastoma ilmaisu varianssi on paras strategia parantaa mutaatio geenin valinta verrattuna lähtötasoon, mutta kun tarkastellaan ylhäältä 100 paremmuusjärjestykseen geenien lisääntyminen PPV näkyy erityisesti varten fitSNP (kaavio S1E).

Perustaso PPV vuonna medulloblastoma voitaisiin parantaa käyttämällä kaikkia kolmea strategioita. Esimerkiksi löytää 10 mutatoitunut geenien näytön, yli 1600 satunnaisesti geenit on sekvensoitu, jota voidaan pienentää 321, 416 ja 445 top-geenien ilmentämiseen varianssi, taajuus kopioluvun menetyksen ja fitSNP DER arvot, vastaavasti. Tarkasteltaessa PPV tontin medulloblastoma nopea lasku voidaan nähdä kärkipään geenit kaikkiin strategioihin, mikä osoittaa, että yksikään mutatoitunut geenien löytyy jompikumpi kärkipään geenin listoja (kuva S1F).

priorisointi käyttämällä yhdistettyjä strategioita

ajoittain havaittu huomattavia parannuksia PPV kun yhdistetään eri strategioita (taulukko S1, kuva S2). Yksi selvä esimerkki on rintasyöpä, jossa keskimääräinen PPV arvo saavuttaa 26,9%, että top-25 geenien kun geeni annostus herkkyys arvojen (0% PPV huippu-25 käytetään yksinkertaista menetelmää) ja taajuus kopioluvun tappio (9,2% huippu -25 käytetään yksinkertaista menetelmää) yhdistetään (taulukko S1, kuva S2C).

Toinen esimerkki on medulloblastoma jos yksikään kolmesta arvioitiin parametrit oli PPV arvo suurempi kuin 0%, että top-50. Yhdistelmät fitSNP DER arvosta ja ilmaisun varianssi tai ilmaisun varianssi ja taajuus kopioluvun tappio kasvoi selvästi vuonna PPV arvon kärkipään geenejä (taulukko S1, kuva S2F).

glioblastooma, fitSNP arvot yhdessä ilme varianssi selvästi suoriutui parhaiten; löytää 10 mutatoituja geenejä 120 top-geenien tulisi sekvensoida, kun yhdistetty strategiaa käytetään, verrattuna 259 tai 157 geenit fitSNP tai ekspressiota varianssi yhden strategioita, vastaavasti (taulukko S1, kuvio S2E). Nämä tulokset osoittavat, että parannuksia PPV-arvo voidaan saada käyttämällä yhdistelmiä kahdesta eri strategioita. Kuitenkin joidenkin yhdistelmien arvonalentumista sijaan parantamisen tuloksista saatiin, jotka osoittavat, että yhdistämällä eri priorisointi strategioita ei sinällään johtaa parempaan kandidaattigeenifragmenttikloonien rankingissa.

vertailu kaikkiin strategioihin sekä eri kasvain yksiköt

Jos haluat vertailla eri tärkeysjärjestykseen menetelmiä poikki kuusi kasvain yksiköiden painotettu ranking menetelmä levitettiin keskiarvo PPV arvosta 100 kärkipään geenejä, tuottaa paremmuusjärjestykseen priorisoinnin menetelmistä (Taulukko S2, Kuvio S3). FitSNP DER arvo strategiaa yhdessä ilmaisun varianssi, sijoittui paras yleinen tapa priorisoinnin syövän geenien kohdennettujen uudelleenjärjestely, jonka jälkeen fitSNP DER arvot yksin. Vastaavia tuloksia saatiin käyttäen monenlaisia ​​erilaisia ​​raja-arvot suhteessa määrä kärkikastiin geenien otettu huomioon (taulukko S2).

Geeni annostus herkkyysarvon sijoittui viimeiseksi ja oli ainoa strategia että sijoittui alapuolella perusarvosta, mikä osoittaa, että tämä strategia ei sinänsä ole hyötyä priorisoida mutatoitujen geenien testattu syöpää yhteisöjä. Sen sijaan, kun se yhdistetään joko fitSNP tai taajuutta kopioluvun tappio strategiaa, geeni annostus herkkyysarvon sijoittui kolmanneksi ja neljänneksi vastaavasti.

erot mutaatiotapahtumaa taakka sekä eri kasvaintyypeissä

Kun tarkastellaan mutaatiofrekvenssi käyrät kuudesta eri kasvaintyypeissä (kuvio 1A-F), huomaamme, että sekä munasarjasyöpään ja varhaissolukasvaimesta perustason PPV tai mutaatio on hyvin alhainen verrattuna neljä muuta kasvain yksiköt (taulukko S1 ). Perustason PPV haimasyöpä (6,5%) on yli 10 kertaa suurempi kuin medulloblastooma (0,6%). Tämä tarkoittaa sitä, että löytää 10 geenien mutaatioita noin 150 satunnainen geenejä olisi sekvensoitiin haimasyöpä, mutta yli 1500 medulloblastoma (kuvio 1 C, 1 F). Perustaso PPV rintasyövän, paksusuolen syövän ja glioblastooma ovat verrattavissa haimasyöpä ja valhe välillä 4,1 ja 6,1%, kun taas munasarjasyöpä on lähtötilanteessa PPV 0,7%.

Keskustelu

Koska nykyinen korkeat kustannukset exome ja koko genomin sekvensointi, me arvioi kohdennettua resequencing ensisijaisista geenien on kustannustehokas vaihtoehto tutkia rajallinen mutta asiaa osajoukko otaksuttu syövän geenien. Neljä lähestymistavat etusijalle geenejä arvioitiin a geenin fitSNP DER arvo, varianssi geeni-ilmentymisen tasojen kasvaimen tyyppi, geeniannoksen herkkyys ja taajuus-geenin kopioluvun menetys.

Jos priorisointi strategia pätevä, ansiokkaimmille geenien tilatun geenissä luettelo olisi rikastettu mutatoitunut geenejä. Arvioimme tämän väkevöimistä laskemalla positiivinen ennustearvo (PPV), joka edustaa sekvensointi saannolla osa mutatoituja geenejä suhteessa kokonaismäärään geenien analysoitiin. Jos mutatoituja geenejä rikastettu kärkipään geenejä, PPV kasvaa varten pienempi määrä kärkipään geenejä. PPV-arvot laskettiin vähentämällä määrä kärkipään geenejä, ja keskimääräinen PPV-arvot laskettiin useita määritellyn kokoisia kärkipään geenin luetteloita. Lisäksi kasvua PPV suhteessa pienempiin geeni luetteloihin, voimassaoleva strategia olisi myös vaadittava korkeaa PPV verrattuna perustason, sillä tämä osoittaa, että suuri määrä mutatoituja geenejä voidaan odottaa suoritettaessa kohdennettu resequencing kokeilu.

tulokset osoittavat selvästi parantamisen mutaatioaste valitun geenien kun priorisointi strategioita käytetään verrattuna perustasolle. Nämä parannukset ovat nähneet useita kasvaimen käytetään eri tärkeysjärjestykseen strategioita, joidenkin vaihtelua eri kasvaintyypeissä. Tämä vaihtelu osoittaa, että ei ole olemassa yleistä menetelmää etusijalle geenien kaikissa kasvaintyypeissä, vaikka paras parannuksia ja suurin yleisen PPV-arvot, jotka on saatu fitSNP strategiaa.

Nämä välillä kasvaimen yksiköiden erot ovat todennäköisesti heijastaa raportoitu monimuotoisuus mutaatiotapahtumaa maiseman eri kasvaimen yhteisöjä, sekä mutaation taustalla yksittäisten kasvaimen genomit [6], [7]. Esimerkiksi huomasimme hyvin pieni mutaatio taajuus lasten syöpä medulloblastoma, joka on yhdenmukaiset raportin Parsons

et al.

Kuvaavat, että tämä kasvain näyttää hyvin erilainen mutaatiotapahtumaa maisema aikuisiin verrattuna kasvaimiin [7 ]. Alhainen mutaatio taajuudet eivät rajoitu lapsipotilailla syövät vain, kuten tässä nimenomaisessa tutkimuksessa löysimme mutaatio oli ainoastaan ​​0,7% munasarjojen selvä karsinooma näytteitä, mikä oli huomattavasti alhaisempi kuin muissa tutkittu aikuisten kasvain tyypit (4,1-6,5%) .

jotta voidaan arvioida eri menetelmien kaikissa kasvain aineistoja, painotetun ranking menetelmää käytettiin, huomauttaa, että paras yleinen esittävien strategia perustui fitSNP ilmentyvät eri suhde (DER) arvot. Vaikka se oli aikaisemmin hypoteesi Chen ja työtovereiden että syöpä geenit on korkeammat fitSNP DER arvot, kirjoittajat eivät vahvista tätä vertaamalla fitSNP arvot mutaatiostatuksesta riippumatta geenien [3]. Meidän tulokset, voimme päätellä, että cut-off fitSNP DER arvot määritetty alkuperäisessä tutkimuksessa (eli 0,55 [3]), ei ole optimaalinen priorisoida mutatoitunut syöpä geenit, koska sillä yksikään kasvainten huomattavasti enemmän PPV voisi löytyä käytettäessä tämän rajan. Suosittelemme käyttämään korkeampi kynnys 0,65 ennustamiseen varianttien syövän geenien (kuten voidaan päätellä kuviosta 2, joka edustaa yleistä PPV yhdistyvät kaikki elimissä).

PPV tontilta fitSNP strategiaa, suoritetaan on mutaatio tiedot kaikista yhdistetyn kasvain yksiköiden funktiona eri tärkeysjärjestykseen arvo cut-off.

geeni annostus herkkyyttä ei näytä olevan mitään priorisoinnin arvoa, kun taas ilmaisun varianssi ja taajuus kopio määrä tappio oli jonkin verran parempi kuin geeni annostus herkkyys mutta huonompi kuin fitSNP. Huomattavaa on, että taajuus kopioluvun tappion osoittautui ole kovin hyödyllinen käytännössä, koska vähäinen määrä raja-arvot estää tehdä erillisiä geenin valintoja, jolloin ilmaus varianssi edullinen toiseksi paras strategia.

Yhdistämällä kaksi erilaista strategiaa, se oli joskus mahdollista parantaa tuloksia yksittäisten strategioita. Vaikka parannuksia voitaisiin joskus olla valtava, se taas näytti olevan erittäin riippuvainen datajoukon heijastaa eri mutaatiostatuksesta mekanismien eri kasvaimissa. Esimerkiksi yksikään kolmesta priorisointia menetelmiä arvioitiin olivat hyödyllisiä medulloblastooma, kun taas yhdistelmiä kahdesta eri parametrien ei onnistunut priorisoida geenejä.

Vaikka eri syövän geeni priorisointi menetelmiä osoitettu pystyvän tuoton lisäämiseksi mutatoidun syöpä geenit eri testattiin syövän yksiköt, mikään menetelmistä erityisesti rikastettu geenejä, mutatoitiin useampi kuin yksi näyte (tuloksia ei ole esitetty). Tämä johtuu todennäköisesti rajallinen määrä syövän genomien tutkittiin kunkin yksikön sekä se, että suurin osa geeneistä on todettu mutatoitunut vain yksi näyte (90-91%) (taulukko S3).

on joitakin rajoituksia tämän tutkimuksen, joka on otettava huomioon, esimerkiksi otoskoko joidenkin tietokokonaisuuksien oli melko rajallinen, varsinkin suurten Genomikartoituksen tutkimukset (7-24 näytettä per yksikkö). On kuitenkin tässä vaiheessa vaikea löytää suuria syövän Genomikartoituksen tutkimuksia suoritetaan riittävä määrä näytteitä, vahvistaa Lähtökohtana työmme joka sekvensointi on tällä hetkellä liian kalliiksi.

rajallisen tietoa, joka on nykyisin saatavissa kuljettajan ja matkustajan geenit, emme voineet kunnolla tutkia, onko fitSNP strategia pystyy erottamaan kuljettajan ja matkustajan mutaatiot. Kuitenkin top-10 fitSNP geenit sisältävät 30% of Cancer Gene Census geenit [8] eli RUNX1, TRA @ ja NF1, kun taas kaksi muuta geenejä pois top-10, CTNNA1 ja Smad3, on vakiintunut rooli syövän kehittymisen sekä [9], [10], mikä osoittaa, että tämä strategia auttaa tunnistamaan geenejä, joilla on todistettu rooli syövän synnyssä (taulukko S4, kuva S4).

lisäksi pätevyyttä ehdotetun strategian kohdennettuja uudelleenjärjestely, geeni priorisointi voi myös olla lisäarvoa exome tai kokonaan Genomikartoituksen. Kun tällainen sekvensoinnin ponnistelut rajalliseen kohortin, variantit, joita löytyy mitä todennäköisimmin on validoitu suuremmassa kohortissa. FitSNP strategia voisi olla avuksi priorisointi ja suodatus syövän geenien tällaisessa validointitutkimusta.

Materiaalit ja menetelmät

Listat mutatoitujen geenien syövän

Kuusi laajamittaisesti sekvensointi tutkimuksia käytettiin uuttamiseen mutaation tietojen kuuteen eri kasvaimen yksiköt (rintasyöpä, paksusuolen syöpä, haimasyöpä, munasarjasyöpä, glioblastooma, medulloblastooma) [7], [11] – [15] (taulukko 1). Nämä tiedot sarjaa koostuvat sekvenssitiedot arviolta 18000 21000 geenejä, joiden näytekoko vaihtelee 7-24, ja käytettiin vahvistamaan eri tärkeysjärjestykseen strategioita. Hypermutated näytteitä, koska kemoterapeuttisen hoidon, kuten on kuvattu vastaavissa asiakirjoissa [11], [13], jätettiin analyysin ulkopuolelle.

Kopioi numero ja geenien ilmentyminen tietomääriä

kuuden kasvaimen yhteisöt kopioluvun ja geenien ilmentyminen tietoja ladataan GEO [4]. Olemme erityisesti valitut näytteet, joilla on kasvaimen histologia, joka vastaa näytteiden suuren mittakaavan sekvensointiin näytöt mahdollisimman tarkasti (taulukko 1). Sillä haimasyöpä ja varhaissolukasvaimesta mitään vastaavia geenien ilmentyminen ja kopioluvun tiedot olivat saatavilla. Otoskoot näissä tutkimuksissa vaihteli 9 77.

Tietojen analysointi

Kaikille kopiomäärä aineistoja, pyöreä binary segmentointi (CBS) arvot [16] määritettiin ja uutetaan kustakin geenistä sijainti. Jos CBS arvo oli saatavilla tietyn geenin sijainti, lähin arvo määrättiin geeniin. Nämä CBS arvoja käytettiin määrittämään taajuuden kopioluvun menetys kunkin geenin kasvaimen kohortin, ja korreloivat geenin ekspressiotasoja (Spearmanin). Määrittämisessä kopioluvun menetys, erilaisia ​​raja-asetuksia käytettiin mukaan tietojen alkuperäisen paperin datajoukon (taulukko S5). Ilmaus varianssi kunkin geenin kussakin kasvaintyyppi laskettiin keskihajonnan kirjautunut ekspressiotasoja.

Perustuen niiden vastaavat priorisointi arvo, joko fitSNP DER arvo [17], ilmentyminen varianssi, geeni annostus herkkyys tai taajuutta kopioluvun menetys, geenejä rankattiin alenevassa järjestyksessä.

yhdistetyn menetelmissä kärkipään geenin luetteloista määritettiin ottamalla risteyksessä kärkipään geenit määrittelemiä kaksi erillistä parametreja.

kunkin syöpä kokonaisuus, määrä mutatoituja geenejä piirrettiin (y-akseli) suhteessa tietty määrä kärkipään geenejä, jotka pitäisi sekvensoida (x-akseli). Yhtä priorisointia strategioita näiden käyrien verrattiin sitten perustason mutational taso kasvaimen yksikön, joka edustaa suhdetta mutatoitujen geenien lukumäärän suhteen geenejä sekvensoitiin, jolloin saatiin tietty määrä mutatoituja geenejä, jos ei priorisointi strategiaa käytetään.

lisäksi positiivinen ennustearvo (PPV), tai mutaatio korko, laskettiin kaikille eri strategioita. Tämä arvo edustaa lukumäärän välinen suhde geenien mutaatioita ja kokonaismäärä geenien tietyn geenin alaryhmä. Nämä arvot laskettiin eri cut-off tasoa kärkipään geenejä (500-400 – 300-200 – 150-100 – 75-50 – 25-10), jolloin muutos PPV lähtötasoon verrattuna arvoon arvioitiin.

jotta voitaisiin tunnistaa parhaiten toimiviin strategia useissa eri kasvaintyypeissä, tarkoittaa PPV-arvot määritettiin useita kärkipään geenien cut-off, ja perustason PPV, (taulukko S1) analysoitiin raakaa voimaa painotettua sijoitusta analyysi. Tämä analyysi tuotti paremmuusjärjestykseen eri tärkeysjärjestykseen menetelmiä useissa eri kasvaintyypeissä (taulukko S2). Sillä painotettua sijoitusta analyysi 10 eri tärkeysjärjestykseen strategiat (4 yhden strategiat ja 6 yhdistetty strategiat), The medulloblastoma ja haimasyöpä aineistoja jätettiin pois, koska puuttuminen geeniannoksen herkkyys arvoja.

Koska arviointi n fitSNP cut-off määräytyy Chen et al. [3], mutaatioprosessiin tiedot kaikista eri syöpätyyppien yhdistettiin ja PPV määritettiin eri fitSNP cut-off-arvot (kuva 2).

Kaikille analyysit, tilastollinen alusta R käytettiin (paketit GEOquery , DNAcopy, RankAggreg) [18] – [20].

tukeminen Information

Kuva S1.

Katsaus PPV tontteja funktiona lukumäärän sekvensoitiin geenien kuuden syövän yhteisöjä.

doi: 10,1371 /journal.pone.0031333.s001

(TIF) B Kuva S2.

visualisointi painotetun ranking tulokset top-100 paremmuusjärjestykseen geenejä. Harmaa viivat edustavat sijoitusta neljän eri kasvaintyypeissä varten 10 priorisoinnin strategiat (4 yhden strategiat ja 6 yhdistetty strategiat) ja perustasolle. Punainen, tulos raa’an voiman -sijoitusalgoritmilla näkyy. Musta viiva on, jos lähtötasoon sijoittuu useissa eri aineistoja. EV: ilmaus varianssi; DS: annostus herkkyys; FCNL: taajuus kopioluvun menetyksen

doi: 10,1371 /journal.pone.0031333.s002

(TIF) B Kuva S3.

Tontit lukumäärän mutatoitujen geenien suhteen tietty määrä kärkipään geenien kuuden syövän yksiköt, mukaan lukien yhdistelmä strategioita.

doi: 10,1371 /journal.pone.0031333.s003

(TIF) B Kuva S4.

Tontit prosenttiosuus mutatoidun fitSNP geenejä, joiden on todettu olevan kuljettajia. Paksusuolen syöpä, glioblastooma, haimasyöpä ja rintasyöpä, PPV piirretään alkuun 500 fitSNP geenejä (musta viiva). Harmaa viiva edustaa prosentteina mutatoidun fitSNP geenejä, jotka tunnistetaan kuljettajan geenejä kulloisenkin julkaisuihin. Rikastaminen tunnistettu kuljettaja geenejä voidaan nähdä ylhäältä fitSNP geenit sekä paksusuolen syövän ja glioblastooma, kun taas haimasyövän ja rintasyövän tätä ei voitu vahvistaa.

Doi: 10,1371 /journal.pone.0031333.s004

(PDF) B Taulukko S1.

Katsaus analyysien kohti syöpä kokonaisuus ja priorisointia strategiaa. Yhteenveto luetellaan PPV, määrä sekvensoitiin geenejä ja useita mutatoituja geenejä lähtötilanteen PPV, maksimi PPV, eri määrä kärkipään geenejä ja 1-20 mutatoituja geenejä. Punaisella, arvot näkyvät jotka eivät vastaa määrää kärkipään geenien katsotaan, koska katkaisun rajoituksia priorisoinnin menetelmän.

Doi: 10,1371 /journal.pone.0031333.s005

( XLS)

Taulukko S2.

Sijalla luettelot eri tärkeysjärjestykseen menetelmillä. Nämä sijoittui luettelot perustuvat raaka voima painotettu -sijoitusalgoritmilla, suoritetaan useissa eri syövän yhteisöjä. Ranking on suoritettu yhden priorisointia strategioita yksin tai yhdessä yhdistetyn strategioihin.

Doi: 10,1371 /journal.pone.0031333.s006

(XLS) B Taulukko S3.

Katsaus mutatoidun geenien eri tutkittu syövän yhteisöjä.

doi: 10,1371 /journal.pone.0031333.s007

(XLS) B Taulukko S4.

Katsaus mutatoidun geenien top-500 fitSNP geenejä.

doi: 10,1371 /journal.pone.0031333.s008

(XLSX) B Taulukko S5.

Cut-off käytetään eri syövän yhteisöjä määrittämään kopioluvun menetys.

doi: 10,1371 /journal.pone.0031333.s009

(XLS) B

Kiitokset

Haluamme kiittää Filip Pattyn hänen syöttää painotettuun ranking analyysiä.

Vastaa