PLoS ONE: Genome Wide tunnistaminen Peittyvä Cancer Genes yhdistelmämutageneesillä Mutaatio Analysis

tiivistelmä

kehitetty uusi menetelmä tunnistaa ihmisen syövän geenien toimivat resessiivinen tavalla. Strategiamme oli yhdistää panokset erityyppisten geneettisiä muutoksia lakkaa toimimasta: aminohapon substituutioita, runko-vuorossa, geeni poistot. Tutkimme yli 20000 geenejä 3 Gigabases koodaavien sekvenssien ja 700 joukko vertailevaa genomista hybridisaatioita. Resessiivinen geenejä pisteytettiin mukaan nukleotidin epäsuhta alla positiivisen valikoivan paineen, runko-siirtymät ja genomisia deleetioita syöpä. Neljä erilaista koetta yhdistetään saatiin syöpää väistyvä p-arvo kullekin tutkittu geeni. Sataviisikymmentä neljää ehdotettua resessiivinen syöpä geenit (p-arvo 1,5 x 10

-7, FDR = 0,39) havaittiin. On silmiinpistävää, prototyyppiseen syöpä resessiivinen geenejä

TP53

,

PTEN

ja

CDKN2A

kaikki sijoittuu alkuun 0,5% geenejä. Toiminnot vaikutti merkittävästi syövän mutaatioita täsmälleen päällekkäin niille tunnettujen syövän geenien kriittisen poikkeus tyrosiinin puuttuessa kinaasien, odotetusti varten resessiivinen geeni-set.

Citation: Volinia S, Mascellani N, Marchesini J, Veronese A, Ormondroyd E, Alder H, et al. (2008) Genome Laaja tunnistaminen Peittyvä Cancer geenien Kombinatoriset Mutation Analysis. PLoS ONE 3 (10): e3380. doi: 10,1371 /journal.pone.0003380

Editor: Mikhail V. Blagosklonny, Ordway Research Institute, Yhdysvallat

vastaanotettu: 3. heinäkuuta 2008; Hyväksytty: 17 syyskuu 2008; Julkaistu: 10 lokakuu 2008

Copyright: © 2008 Volinia et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Program Project Grant nro P01CA76259 National Cancer Institute (CMC) ja avustuksia AIRC, PRRIITT Regione Emilia Romagna ja MIUR (SV).

kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä olemassa.

Johdanto

erilaisia ​​lähestymistapoja on sovellettu tunnistamiseksi syövän geenien [1]. Menettelyjä on kehitetty, että sallittu geenien tunnistaminen aiheuttavan solujen transformaatio [2], [3], ja monimutkaisia ​​prosesseja, kuten invasiivisuus ja etäpesäkkeiden [4]. In vitro ja in vivo menetelmillä käyttäen solu- tai eläinmalleissa, johti yleisesti on paljastunut hallitseva syövän geenien tai onkogeenien. Toisaalta, tuumorisuppressorit on löydetty pääasiassa molekyyligenetiikan lähestymistapoja. Sellainen on tarve tunnistaa uusia tuumorisuppressorien tai resessiivinen syöpä geenit, että uudet testit menettämisestä toiminnon kehittämistä jatketaan [5].

Monet hyvin tunnettu syövän geenien satama somaattisten emässubstituutiota tai pieniä lisäys /poistot. Esimerkiksi koodausalue runko-siirtymät ja pistemutaatioita osuus 75% somaattisten mutaatioiden

CDKN2A

ja

TP53

, kaksi suurta tuumorisuppressorigeeneille [6], [7], [ ,,,0],8]. Onkogeenin

B-raf

, ensimmäinen kuvattu yli 20 vuotta sitten, oli myös osoitettu olevan mutatoitunut joissakin ihmisen syövissä [9], ohella

PI3K

ja jotkut tyrosiinifosfataasien [10]. Samaan aikaan muut syöpä geenit on löydetty kautta ilmiö perinnöllinen taipumus. Perinnöllinen syöpä on harvinainen verrattuna ei-perinnöllinen syöpä, mutta useat resessiivinen geenejä on tunnistettu käyttäen kytkentäanalyysilla [11], [12]. Laajamittainen super-perheen sekvensointi hankkeisiin, eli kinome ja phosphatome projekteja, jonka jälkeen ja osoitti, että vaikka missensemutaatioita löytyy joidenkin jäsenten nämä kaksi superperheiden, ne eivät ole yhteisen perustan somaattisten syöpään mutaatioita. Greenman ja työtoverit [13] sitoutui kattava sekvensointi 518 proteiinikinaasi-koodaavat geenien 210 syövissä. Kinaasit ovat sekaantuneet monessa tumorigeneesin ja useat ovat nyt validoitu kohteina lääkehoidon [14]. Niiden analyysi kokoelma solukinaasien, The kinome, Greenman et al. [13] tunnistettiin 1000 mutaatioita. Mutaatiot olivat suhteellisen yleisiä keuhko-, vatsa, munasarja-, paksusuoli- ja munuainen ja harvinaisia ​​syöpiä kivesten ja rintojen ja karsinoidikasvaimissa, joita yleensä löytyy ruoansulatuskanavassa. Kasvaimet vikoja DNA-yhteensopimattomuuden korjauksen tunsivat paljon mutaatioita, kun taas muunlaisia ​​kasvain ei paljastanut mitään havaittavaa mutaatioita. Erottaa kuljettajan matkustajan mutaatiot, Greenman et al. käytetyt tilastollinen malli vertaamalla havaittua-to-odotettua suhde synonyymi (ei aminohapon muutos) mutaatioita kanssa kuin synonyymi (muuttunut aminohappo) mutaatioita. Osuuden kasvu ei synonyymejä mutaatioita merkitsee valinta painetta tuumorigeneesin. Kaiken tunnistettiin 158 ennustivat kuljettajan mutaatioita 120 kinaasi geenejä. Toisin kuin toistuvia mutaatioita

BRAF

pahanlaatuiset ihosyövän [15] useimmat kinaasi mutaatioita tunnistettiin eri kasvaintyypeille olivat siis yksi osumia. Viime aikoina Puu ja työtoverit [16] käytetään erilaista strategiaa, mutta vastaavat päätelmät, joissa täydellinen sekvensointi 20857 selostukset 18191 geenejä rajoitettu määrä kasvaimia (11 rinta- ja 11 paksusuolen). Suuri määrä havaitaan automaattisesti DNA mutaatiot edellyttäen heti seuraavan kysymyksen: miten tunnistaa mistä on mahdollisesti suuri määrä järjestyksessä epäsuhta jotka ovat aiheuttajaa syövän synnyssä. Sarja myöhemmin suodattimien paljasti, että suurin osa heistä oli hiljaisia ​​(ei aiheuttanut aminohapon muutos) ja vastaavan määrän olivat yhden emäksen monimuotoisuus (SNP). Lopullinen määrä mutaatioita, jotka määriteltiin todella somaattisten vaikutti yli 1000 geenit. Mielenkiintoista, muutamia yhteisiä kuljettaja mutaatiot tunnistettiin joukossa kinaasi geenit näissä tutkimuksissa. Tämä on johdonmukaista, esimerkiksi sen toteamuksen kanssa, että vain 1 ulos 18 jäsentä

PI3K

perhe oli somaattisia mutaatioita syöpä [17].

Mielenkiintoisia havaintoja voidaan tehdä tarkka maailmanlaajuinen tutkimus mutaatioiden raportoitu syöpää. Futreal et ai. [18] teki tällaisen laajennetun laskenta alkaen kirjallisuusluettelo osoittaa, että peräti 299 geenit edistävät ihmisen syöpään. Kuitenkin 70% näistä geeneistä liittyy leukemiat, lymfoomat ja mesenkymaaliset kasvaimet, jotka muodostavat vain 10% syövän esiintymisen. Lisäksi noin 75% näistä geeneistä liittyy toiselle siirtäminen, ja vähintään 90% lueteltu syövän geenien ovat hallitseva solutasolla (toisin aktivoitu onkogeenien, fuusio onkoproteiineja). Kuitenkin on yleisesti tunnettua, että valtaosa ituradan mutaatioita, jotka johtavat syövän taipumus ovat väistyvä [18]. Näin ollen vaikuttaa siltä, ​​että suurin osa syöpä geenit ovat väistyvä ja pysyvät edelleen havaitsematta.

Näistä syistä kehittäneet uuden menetelmän tunnistamiseksi ehdokas resessiivinen syövän geenien genomin mittakaavan aineistot. Käytimme myös uusi menetelmä louhia tietoja sekvenssit ja vertailevaa genomista hybridisaatioiden. Meidän menetelmä ottaa huomioon eri geenin toiminnan lopettamisesta tilat, jotka vaihtelevat pistemutaatioita kokonaisiin geenin deleetioita. Käsite perustuu tutkimuksemme oli, että tutkimalla syöpä geenit eri mutaatiostatuksesta näkökulmista ja yhdistetään vastaaviin todennäköisyydet, sekvensointi melu ja polymorfismien voitaisiin suodattaa pois ja bona fide resessiivinen syöpä geenit tunnistettaisiin.

Tulokset

Pyynniltä ehdokas mutaatiot EST

tässä asiakirjassa, uutta menetelmää sovellettiin tunnistamiseen geenien mutatoitunut periytymättömiä ihmisen syövissä (kuvio 1). Menettely koottu sekvenssi tietoja ekspressiosekvenssiä (EST) tietokannasta ja sopivaa algoritmia räätälöitiin poimia tietoja ”heikkolaatuinen” järjestyksessä tiedot. Menettelyn analysoitiin yli 3 x 10

9 nukleotidia ihmisen koodaavan sekvenssin yli 5600000 EST on peräisin sekä terveillä ja syöpä- kudoksissa ja solulinjoissa. EST ovat potentiaalisesti hyvin arvokasta mutaatio tutkimuksiin, koska ne edustavat kloonattu yhden alleelit, mutta ovat myös vahvistamaton sekvenssit, joissa on korkea sekvensointivirheitä [19], [20]. Näin ollen, jotta voitaisiin hyödyntää täysimääräisesti mahdollisuuksia EST meidän piti kehittää menetelmä havaitsemiseksi bona fide ”syöpä” mutaatioiden yhteydessä usein sekvensointivirheitä tai parhaimmillaankin polymorfismit. Aiemmissa tutkimuksissa [19] pyrkinyt arvioimaan sekvensointi virheiden määrä EST, seurasimme vaihtoehtoinen reitti. Meidän menettely perustuu oletukseen, että korko sekvensointivirheitä oli vakio jokaiselle ihmisen geeniä, jokaisessa nukleotidin asemassa. Tästä seuraa edelleen, oletimme, että ”geeni /asema-spesifinen sekvensointi virheprosentti” oli vakio yli normaalin ja syövän EST kirjastoissa. Koska pohja kokoonpano, konteksti ja järjestys ovat määritelmän samat kummassakin eri ihmisen geeniä, uskoimme nämä oletukset olivat turvassa. Ainoita poikkeuksia johtua kasvaimia kätkeminen DNA korjaus vikoja.

Kaaviossa jälkeen menettely arvioimiseksi mutaation todennäköisyyksien ja tiedonvirta tunnistaminen ehdokas väistyvä syövän geenejä. Molecular tiedot poimittiin julkisia tietokantoja (dbEST ja GEO klo NCBI, ja Stanford Microarray Database). Hyvin suuri määrä linjaukset (yli 4,5 miljoonaa) saatiin yli 24000 ihmisen geenien BLAST analyysiin 3 Gbases EST-sekvenssien. Lähentämisiä jäsennetään poimia epäsuhta jotka talletettiin Cancer Mutome paikallisen SQL-tietokannan. Epäsovituksiin Sitten arvioitiin erityisiä menettelyjä liittää mutaatiostatuksesta p-arvot kullekin ihmisen geeniä. Samanaikaisesti lähes 20.000 ihmisen geenit analysoitiin alkaen 744 array CGH määrittelemään taipumusta poisto syövän. Erityinen mutaatiotutkimukset p-arvot yhdessä tuottaa väistyvä syöpä p-arvo. Genomi osajoukko 154 geenejä, joista

TP53

,

PTEN

,

CDKN2A

ja

CDKN2B

olivat läsnä, valittiin (syöpä p-arvo 1,5 x 10

-7).

korkea sekvensointi melu odotettiin olevan läsnä heterogeenisessä EST-tietokanta ja syöpä on monimutkainen monitahoinen geneettinen sairaus, siis yksi tilastollinen testi olisi johda luotettava valinta syövän geenien. Lisäksi halusimme keskittyä resessiivinen geenejä, inaktivoida esiintyvät tapahtumat. Siten koetta eri mutaatiostatuksesta liikennemuotojen peittyvästi syövän geeni, me vastaavasti kehitetty useita mutaatiostatuksesta testejä. Tilastollinen Kokeet lopulta yhdistettiin tunnistamaan geenejä, jotka usein inaktivoituu syöpää.

Lähtien RefSeq ihmisen mRNA arkistoon, 27184 sekvenssit (määritelty kyselyt) linjattu yli 5,6 miljoonaan ihmisen EST-sekvenssit, alkaen 7574 eri EST kirjastot, yhteensä lähes 3,0 Gbases of koodaavan sekvenssin. Räjäytykset [21] ajettiin kunkin kyselyn verrattuna EST ja 3.839.543 onnistunut linjaukset tuotettiin (tallennettu Alignments SQL taulukko Cancer Mutome tietokanta) ja 24932 ihmisen kyselyitä (Tilastot tietokanta taulukko). Keskimäärin 150 osumia (paljon pisteitä paria, HSP. Tai sekvenssit) tuotettiin kullekin kyselyn (ihmisen geeniä tai silmukoivat). Laadunvalvontaa BLAST linjaukset oli etummaista tärkeää strategian. Jotta minimoidaan kaivos teknisten virheiden määrittelimme tiukkaa kynnyksen linjaus laadun (expect≤1E-21) ja huonolaatuisia päihin rinnastuksia heitettiin pois. Kaikki (43965904) nukleotidiin epäsuhta, ja aukkoja /insertioita, kirjattiin tietokantaan mutaatioiden pöydän. Aminohapon (AA) substituutiot ja ennenaikaisen pysähtyy (33614754 epäsuhta) on valitaan sitten rinnastuksia (AA_Mutation taulukko). Vähentää monimutkaisuutta, ja odotettu määrä vääriä positiivisia, päätimme arvioida vain ne geenit, joilla on suuri määrä epäsuhta (riippumatta näytteiden syövän tila). Ennalta käsittely perustuu väliseen neljännekseen alue (IQR) oli siis sovellettu ja 8972 geenit (IQR yli 0,5) säilyivät edelleen syövän mutaatio määrityksissä. Nämä geenit ovat riittävän runsaasti otaksuttu mutaatioita (epäsuhta) täyttää roolia mahdollisten syöpää geenin ehdokkaita.

Ensimmäinen osa strategiamme oli tunnistamisesta geenien kätkeminen inaktivoivat pistemutaatioita. Olemme arvioineet pistemutaatiot mukainen taajuus, sijainti, kykyyn muuttaa aminohapposekvenssiä, ja seurauksia lukukehyksen. Meidän menettely oli siis räätälöity harkita tilastollisesti kaikki edellä mainitut ominaisuudet pistemutaatio.

Data mining for aminohapon substituutiota ja ennenaikaisen päättämisen

määritellään pAA kuin todennäköisyys, että geeni näyttää ylimäärä aminohapposubstituutiot syövän verrattuna muun kuin syöpään näytteitä. pNSSR, sen sijaan, osoittaa todennäköisyyttä, että merkittävä aminohappojen substituutioita syövän näytteet ovat alla positiivisen valinnan paineessa. Havaita lyhyen kantaman klusterointi syövän mutaatioita, yleinen syöpä resessiivinen geenejä, ja tasapainottaa melua, eli sekvensointivirheitä, päätimme pariksi t-testi kytketty liukuvan ikkunan. Me normalisoi laskee epäsovituksiin kahteen luokkaan, syövän ja valvontaa, käyttämällä geenispesifistä sijaintia kerroin. Null epäsuhta määrä säädettiin yhtenäisyyttä, ennen normalisointia. Normalisoituminen arvot saatiin, kullekin geenille, ja kussakin nukleotidiasemassa, kuten paikallinen suhteet sekvensoitu nukleotidien syövän ja kontrollinäytteestä. Parittaiset t-testi (syöpä vs. kontrolli, pariksi varten kodoneja) pantiin liukuva ikkuna, jonka pituus on 25 kodonien. Suorittaa vankka määritys kodoni arvioitiin vain silloin, kun linjassa on vähintään 10 kertaa kunkin luokan (syöpä ja ohjaus). Gene erityinen luottamus rajat T tulokset, joissa syntyy bootstrap analyysi ja kynnysarvon p-arvo 0,05 käytettiin valitsemaan merkittävää aminohappojen kantoja. Kunkin ihmisen geenin, joka on p-arvo (pAA) lopulta liittyvät summa vastaavien piikkien merkittävä T-tulokset. Sekvenssi epäsuhta kirjattiin vain kerran EST kirjaston.

Liian arvio pAA voi johtua matkustajan mutaatioiden, kuten tuotettu muuttunut DNA korjaus-, esiintyy joissakin syöpään. Koska matkustaja mutaatioiden tulisi satunnaisesti jakautunut genomin, ylimääräinen koe siis toteutettu tarkentaa pAA. Suhde ei-synonyymi (NS) ja samaa (S) DNA mutaatioita on mitta selektiivisen paineen aikana kasvaimen etenemisen, koska samaa muutokset ovat todennäköisesti aiheuttavat kasvua etu ja ne selektiivisesti menetetään [17]. Lisäksi epäsuhta johtuu sekvensointivirheitä sekä ero edustus (syöpä normaaliin differentiaalikaavojen), kaikkien odotetaan olevan neutraali suhteessa NS S-suhde. Kodonit merkittävä aminohapposubstituutioita (p 0,05) on siis määritettiin ylipainetta. Koska proof-of-concept, NS /S-suhteet

TP53

mutatoitunut alue analysoitiin pariksi t-testiä (p 0,033, FDR = 0,092) ja paljasti suurempia arvoja syövän kuin verrokeilla. Niinpä me soveltanut NS S-suhde testi kunkin geenin, kaskadiin jälkeen paikallisen Mutaatiofrekvenssi (pAA) edellä kuvatulla tavalla. Bootstrap käytettiin jälleen määrittämään p-arvot. Todennäköisyys syövän proteiinin, jolla on usein aminohapon muutoksia (pAA), joka on kytketty valikoiva positiivisen paineen syöpä (pNSSR), kaksi tapahtumia, jotka eivät ole riippumattomia, määriteltiin keskiarvo kahden vastaavan p-arvot (pAA-NSSR).

Data mining for frame-muutoksia syövän EST

Kun määritellään kunkin ihmisen geeniä p-arvo syy aminohapposubstituutioita satunnaista syövissä, tarvitsimme vastaava indeksi geenin toiminnan takia avoin lukukehys siirtyy eksoneissa. Syöpä geenit voidaan hajottaa mikro-insertioita tai -deletions niiden koodaavan sekvenssin, jolloin tuloksena on muuttunut kantavan rakenteen. Genomi laaja tutkimus meidän epäsuhta tietokannasta osoitti, että yhden nukleotidin muutokset olivat ylivoimaisesti yleisin insertiot /deleetiot EST. Olemme merkitty pFrameshift todennäköisyys, että geeni oli ylimäärä runko siirtyy, koska yhden nukleotidin deleetioita /insertioita syövän, verrattuna kontrolliin kudoksiin. Testasimme hypoteesia, että nämä mutaatiot olivat usein syövän geenien, tutkimalla jälleen

TP53

. Meidän testi osoitti, että yhden nukleotidin runko-siirtymät liittyvät syöpään korotonta satunnaisesti rikastunut

TP53

. Kun etsit runko-vuorossa aiheuttama 1 nukleotidin insertioita /deleetioita, analoginen testi että pAA suunniteltiin, kuten esitetään yksityiskohtaisesti Koejärjestelyt, tuottaa pFrameshift.

tunnistaminen poistetut geenit syövän korkean erotuskyvyn array vertaileva genominen hybridisaatio

Syöpä geenejä voidaan vaikuttaa niiden genomista rakennetta suurten monistukset ja poistot. Resessiivinen syöpä geenit odotetaan poistettava tai muuten passiivinen ja tämä osa on sisällytettävä Mutaatioanalyysiemme mallissa. Siksi kullekin ihmisen geeniä p-arvot poisto syövän. Saadakseen p-arvoja, me koottu tietoja korkearesoluutioisia vertaileva genominen hybridisaatio 744 kasvainten osaksi GEOSOFT tietokantaan. Käytimme array CGH (aCGH), saatu GEO (NCBI) ja SMD (Stanford Microarray Database), jossa on riittävän korkea resoluutio erottaa ihmisen geenit (tiedot näytteiden ja tietojoukkoja täydentävien taulukossa S1). Jokainen kasvain näyte verrattiin terveisiin näyte on kaksikanavainen oligonukleotidi-pohjainen. Ihmisen geenit arvioitiin kussakin näytteessä käyttämällä normalisoitua log2 suhde (kasvain yli kontrolli). Eri koettimet, jotka liittyvät saman geenin laskettiin keskiarvo. Gene symboleita käytettiin avaimet yksiselitteisesti tunnistaa geenin sisällä ja eri ympäristöissä. Data normalisoitiin mukaan tarjoajille. Koska esikäsittelyvaiheissa vähensimme määrityksessä monimutkaisuutta säilyttämällä vain ne geenit, joilla on korkea vaihtelevuus (standardipoikkeama log

2 suhde 0,2). Sitten kutakin geeniä olemme lasketaan persentiili tukin

2 suhteet (vain geenien mitattuna vähintään 300 näytettä). Geeni vaikuttaa poistoista kasvaimissa olisi hallussaan alhainen (negatiivinen) log

2-suhde 5

thpercentile, kun taas toisessa monistuksissa voisi näyttää korkea (positiivinen) 95

persentiili.

bootstrap-analyysi (random swap välillä kasvain ja ohjauskanavilla) käytettiin simuloimaan geenispesifisistä 5

th ja 95

th persentiilit. Sitten geeni erityinen p-arvot poistot (pDeletion) lopulta lasketaan prosentteina simuloitu 5

th persentiilit ylittää todellisen 5

th persentiilit. Tässä vaiheessa meidän piti ottaa huomioon kaksi ilmiötä, liittyy aCGH mutta ei yhdistetty syöpään: sukupuolikromosomeiksi ja polymorfiset rakenteellinen kopioluvun vaihtelut (CNVs). Ohjaus näyte aCGHs oli usein peräisin uros (yli 50% aCGHs), kun taas noin puolet kasvaimet olivat naisten alkuperästä ja siten puuttui Y-kromosomi. Siksi Y-kromosomin geenien odotetaan ilmestyvän poistettu tai parempi ”pseudo-poistettu”. Käänteisesti, odotimme X-kromosomi geenit, paitsi ne, jotka kuuluvat pseudo-peittyvästi alue, esiintymään ”pseudo-monistettu”. Geenit sijaitsevat sukupuolikromosomeiksi todellakin käyttäytyi oikein, kuten on esitetty yksityiskohtaisesti pseudo-peittyvästi alue 1 (PAR1) in Xp22 (täydentävä kuva S1). Polymorfinen CNVs, normaalista väestöstä vaihtelusta eikä yhdistetty syöpään, pitäisi myös johtaa suuriin taitettava muutoksia, mikä johtaa korkeisiin 95

th tai matala 5

th persentiilit. Kuitenkin odotimme, että polymorfiset CNVs, ei liity syöpään, se ei näkyisi merkittäviä pDeletion arvoja. Itse asiassa niiden 5

th persentiilit ei katsota merkittävästi sen jälkeen, kun satunnainen swap simulointi.

CDKN2A

ja

CDKN2B

tunnistettiin kaikkein poistetut geenit ihmisen syövissä;

PTEN

,

ATM

, ja

TP53

todettiin myös poistetaan (p-arvot 0,001). Kolmetuhatta ja kolmesataaseitsemänkymmentäneljä geenit merkittävästi poistettu (p 0,001).

yhdistelmä mutaation analyysit: ehdokas resessiivinen syöpä geenit

Syöpä geenit vaikuttavat erityyppisten pistemutaatioiden ja kromosomi muutoksia. Me määritelty ehdokas syöpää geenin väistyvä kun vaikuttavat mutaatiot mikä saattaa johtaa lakkaa toimimasta; eli kun se oli usein mutatoitunut sen koodaavan alueen ja usein muuttaa sen genomista rakennetta, erityisesti Poistetaan. Yhdistelmä eri genomin laaja-testit p-arvo resessiivinen syövän geenien. Resessiivinen syövän geeni (pRecessiveCancer) p-arvo määriteltiin tuotteen kolmen p-arvot (PAA-NSSR, pFrameshift, pDeletion). Sata ja viisikymmentäneljä ihmisen geenit sisällytettiin lopulliseen kandidaattigeeni lista jälkeen kombinatorisista mutaation analyysi suoritettiin (pRecessiveCancer 1,5 x 10

-7). Määrä syövän resessiivinen geenien simulaation satunnaisesti yhdistys neljän mutaation testeissä oli 60,5 (väärien havaitsemismäärä 0,39). Valinta yhdistelmämuta- lähestymistapa näytti olevan erityinen, koska kolme klassista resessiivinen syöpä geenit,

TP53

(16

sijalle),

PTEN

(92

nd) ja

CDKN2A

(135

th) havaittiin. Kun vertasimme kandidaattigeeni-asennossa koko genomista, ei suuria bias ilmennyt kohti geenin koko ja rakenteelliset polymorfismien, odotetusti hyvin käyttäytyviä tilastollisella menettelyllä. Resessiivinen syöpää geeni koot eivät poikkea merkittävästi koko ihmisen genomin (täydentävä kuva S2). Kun katsotaan kopioluvun vaihtelut, syöpää geeni-set sisälsivät 15 polymorfisen CNVs (15/154 eli 10%), kun taas 13,6% kaikista geeneistä laukauksellaan pDeletion sisälsivät ainakin yhden CNV. Tämä ero osuus ei ollut merkittävä (p 0,05), mikä viittaa siihen, ettei vääriä rikastamiseen CNVs meidän menetelmällä, odotetusti suunnittelun algoritmin.

Gene ontologian ja toiminnallinen analyysi

mekanismit ja toiminnallinen reitit liittyvät syöpään resessiivinen geenejä arvioitiin tilastollisesti. Virikkeellistämisstrategioita in Gene ontologia (GO) ehdot arvioitiin käyttämällä EASE kello https://david.abcc.ncifcrf.gov. Biologisia prosesseja vaikuttanut merkittävästi syövän geeniperimä on lueteltu täydentävää taulukossa S2. Merkittävä GO termejä ryhmitellään EASE toiminnallinen ryhmittely olivat: ATP /nukleotidin sitova, solukuolema /apoptoosin, solusykliä, mitokondrioissa, RNA sitova, metylaatio, tuumorisuppressorin, DNA aineenvaihduntaa ja DNA korjaus (EASE rikastamiseen pisteet 2, EASE P- arvo 1 x 10

-4, Benjamini p-arvo 0,01). Erittäin päällekkäisiä toiminnallinen spektri saatiin varten Cancer Census geenit [18]. Merkittävin poikkeuksia päällekkäisiä ontologiat kahden syöpää geeni-setit liittyi ”proteiinityrosiinikinaasit”, poissa ehdokas väistyvä luettelosta. Nämä proteiinit ovat yksi edustaa luokkien onkogeenien tai määräävän syöpägeenit. Toimiva luokitus samanlainen kuin EASE saatiin bingo ja Cytoscape (tuloksia ei esitetty), joissa jotkut merkittävimmistä soluprosesseihin tunnistettu olivat osallisina syövän synnyssä, kuten solusykliä, solukuolema /apoptoosi (korjattu p-arvo 1 x 10

-3). Lopuksi me tuotti ohjaus asettaa ihmisen geenien satunnaisotannalla liittämällä p-arvot neljästä mutaatiosta testit. Kun EASE ja bingo levitettiin tämän valvonnan asettaa mitään merkittäviä GO kannalta tunnistettiin.

Keskustelu

kehitetty ja sovellettu moniportainen genominlaajuisten data mining määritys kohti geenien tunnistaminen altis ja ”resessiivinen-tyyppinen” mutaatioita syöpä. P-arvot on saatu kunkin tason yhdistettiin tuottaa ”resessiivinen syöpää geeni” p-arvo (taulukko 1 ja 2). Kolme merkittävintä syöpä resessiivinen geenejä, eli

TP53

,

PTEN

ja

CDKN2A

, sijoittui 16

th, 92

nd ja 135

th vastaavasti kaikkien testattujen ihmisen geenejä. Lohkokaaviossa meidän perusteet ja tietovirta on esitetty kuviossa 1. Testit voidaan jakaa kahteen ryhmään: yksi havaitsemiseksi pistemutaatioiden (aminohapposubstituutioita ja runko-siirtymät) ja toinen rakenteellisia muutoksia (suuria deleetioita). Periaatteessa olisimme voineet myös käyttää testi osittain geenin deleetioita, mutta EST sisäisessä geenin uudelleenjärjestäytymistä voidaan häpeään vaihtoehtoisilla eksonin silmukoinnin.

Todennäköisyys omaavan proteiinin aminohappo mutaatioita ja runko-muutoksia syöpää, tapahtumia, jotka ovat itsenäisiä, määriteltiin tuotteen vastaavien p-arvojen. Vain näillä kaksi testiä, prototyyppiseen

TP53

ja

PTEN

syöpägeenit sijoittui 205

th ja 233

rd pois 27184 arvioitiin ihmisen transkriptit (p-arvo 1 × 10

-4). Lisäksi kaksi muuta tunnettua resessiivinen syöpä geenit,

CDKN2A

ja

CDKN2B

, oli myös merkittävä p-arvot, vaikkakin alempi rankingissa (p 0,0025 ja FDR = 0,019, tässä järjestyksessä). Tämä toiminta odotettiin geenien pienten koodaavia alueita, joita voitaisiin yleisemmin poistaa kuin mutatoitunut [6]. Niiden läsnäolo merkittävä pistemutaatiot syöpää geeni-set, jo tässä välivaiheessa, vakuutti meille valinnan valmiuksia meidän algoritmin. Tästä huolimatta Luokittelujärjestelmässä, joka perustuu kokonaan pistemutaatioita, koottiin vain kahdesta mutaatiosta testeissä; Näin tukeutuen EST sekvenointitulosten, se ei vieläkään luotettavia mukaan mallimme johon sisällytetään ylimääräinen mutaation tilassa. On huomattava, että emme ole asetettu tunnistamaan toiselle siirtäminen, muutokset arvioidaan olevan määräävässä solutasolla ja sen vuoksi sovellu pyrkimyksiämme resessiivinen geenejä.

Viimeinen testi, joka perustuu aCGH analyysiin, vahvisti, että hyvin suuren osan ihmisen genomin on usein poistettu syöpä. Kuten odotettua meidän 2-kanavaa aCGH menettely, me tunnistettu oikein sukupuolikromosomi geenejä differentiaalisesti edustettuina genomin näytöissä. Erityisesti vuoksi resoluutiota rakenteellisen määrityksen, geenit pseudo-peittyvästi alue 1 tunnistettiin normaalisti diploidi (täydentävä kuva S1). Mikä tärkeintä, voimme odottaa, että polymorfiset CNVs ei ollut suodatetaan aCGH määrityksessä. Itse asiassa vain pieni osa syövän geenien samaan aikaan Monimuotoinen CNVs ja osuus on jopa pienempi kuin sattumalta odotettua (taulukko 2).

määrä poistot havaitsemien aCGH syövän genomi on hyvin korkea (enemmän yli 10% ihmisen geenit poistettiin syövässä). Tästä huolimatta poistetaan ylimäärä, kun kaikki mutaatio tilat ovat mukana määrä kandidaattigeenien on vähemmän kuin 0,5% analysoitiin ihmisen genomin.

syövän geenituotteet osallistuvat biologisiin prosesseihin, kuten solusykliä, DNA: n korjaukseen ja apoptoosin suostumuksella kirjallisuudessa. Samat toiminnalliset ehdot liittyvät myös sen geenien COSMIC Cancer Census [18]. Silmiinpistävän, tyrosiinikinaasit, hallitseva onkogeenien, läsnä Cancer Census, olivat poissa meidän syöpään geeni-set, yhteisymmärryksessä valinta resessiivinen geenejä.

Jotkut vahvat rajoitukset ominaisia ​​lähestymistapamme. On epätodennäköistä, että tallennettu kehys-muutokset ovat polymorfismit, sillä ne eivät muuta ensisijaista rakennetta geenin tuotteita. Toisaalta, he saattavat olla hyvin usein seurauksena on sekvensointivirheitä. Tästä syystä päätimme suodattaa pois niin paljon kuin mahdollista sekvensointivirheitä käyttämällä pariksi t-testi yli liukuvan ikkunan. Toinen kiista saattaa liittyä somaattisten luonnetta havaittu mutaatioita. Koska ei käytännössä ole ituradan sekvenssit vastaavat kasvain kirjastojen EST-tietokantaan, ei voi olla mitään virallista osoitus siitä, että valitut geenit vastaavat somaattisen mutaation tavoitteita. Emme voi luoda kuinka monta havaitun epäsuhta ovat todellisia mutaatioita, eikä kuinka monet heistä ovat todella somaattisten alkuperää. Voisimme vain liittää jokaiseen ihmisen geeniä p-arvo ylittää epäsuhta kanssa geenin inaktivoivat potentiaalia syöpänäytteissä. Läsnäolo

TP53

,

PTEN

ja

CDKN2A

vuonna kandidaattigeenin-set ja sen toiminnalliset ominaisuudet ovat todisteita hyväksi oletusta, että mittasimme ylimäärä somaattisten syöpä mutaatioita. Pystymme kumoamaan tämän hypoteesin käyttämällä erilaisia ​​kokeellisia protokollia. Toisaalta on mahdollista, että jotkut kandidaattigeeneihin kantaisi ituradan mutaatioita ja ovat näin ollen taipumus piirteet syövän insurgence.

Kun Vertasimme tuloksia kuin äskettäin julkaistuun massiivinen sekvensointiprojektista, joissakin eriäviä. Käytimme suuremman määrän sekvenointitulosten, vaikkakin huonompilaatuista koska emme käytä toisessa läpiviennissä sekvenointitulosten. Saimme dbEST: stä useita epäsuhta noin 5 kertaa suurempi kuin genomin leveä sekvensointi näyttöjä. Tämä ylimääräinen voi johtua heikommasta laadusta sekvensointi tietoja EST tai suurempi herkkyys lähestymistapamme verrattuna PCR perustuu suoralla sekvensoinnilla. Detection of aliedustettuina mutaatiot usein heterogeenisiä syövän koepaloja voi olla tekninen haaste suoralla sekvensoinnilla, mutta ei kloonattu EST.

EST käytettiin aiemmat yritykset tunnistaa syöpään liittyvät geenit. Lähes poikkeuksetta nämä lähestymistavat perustuivat ilmentymisen profilointi, joka Tuumorinäytteissä lienee korreloi ja myöhään tapahtumia, joukossa johtavat vaiheet kasvainten kehittymiseen ja etenemiseen. Hyvin eri tiedonlouhinta ponnistuksia EST-sekvenssejä syövän, Qiu ja työtoverit [20] mitattiin SNP-kasvain -alueella. Heidän analyysi erittäin keskittynyt yhden nukleotidin epäsuhta, ja rajoitettu tunnettuihin mutaatiot kuvattu SNP tietokantaan ja läsnä vähintään 50 EST osumaa. He tunnistivat 4865 SNP yleisempää kasvaimet (p 0,05), joista 327 aiheuttama aminohapposubstituution (cSNP). Monet suuret histocompatibility complex (MHC) luokan II molekyyleihin olivat läsnä Näistä koodaus SNP, kun mikään ei ollut läsnä meidän resessiivinen syöpää geeni-set. Tärkeintä on, ei maamerkki syöpää geenejä, kuten

TP53

,

PTEN

ja

CDKN2A

olivat läsnä cSNPs. Lopuksi, mikään SNP geenien havaita Qiu et ai. [20] olivat läsnä meidän ehdokas resessiivinen syöpää geeniperimä.

minuutin syöpä resessiivinen sub-genomin ( 0,5%) tunnistimme voisi edustaa virstanpylväs kohti tunnistaminen uusia merkkiaineita varhaisen diagnoosin ja ennusteen. Lisäksi meidän kaivos- strategiaa voidaan soveltaa tietoihin, jotka ovat käytettävissä heti, sekvensointi syövän genomien [22]. Lopuksi työmme saattaa johtaa erilaiseen tasapainoon poolin sisällä syövän geenien, tällä hetkellä epätasapainossa kohti hallitseva onkogeenien.

Materiaalit ja menetelmät

EST data mining

Kaikki ihmisen koodaus

Vastaa