PLoS ONE: tunnistaminen ja karakterisointi Cancer Mutaatiot Japani keuhkoadenokarsinooma ilman sekvensointi Normaali Tissue Counterparts

tiivistelmä

Analysoimme koko-exome sekvensointi tietoja 97 Japani keuhkoadenokarsinooma potilasta ja havaittiin useita otaksuttu syöpään liittyvien geenien ja polkuja. Erityisesti havaitsimme, että syöpään liittyvien mutaatio kuviot olivat merkittävästi erilaiset eri etnisten ryhmien välillä. Kuten aikaisemmin ilmoitettiin, mutaatioita EGFR geeni oli ominaista Japani, kun taas KRAS-geeni olivat yleisempiä valkoihoisilla. Lisäksi aikana tämän analyysin, olemme huomanneet, että syöpä-spesifinen somaattiset mutaatiot voidaan havaita ilman sekvensoimalla normaalin kudoksen kanssa. 64%: n ituradan muunnelmia voitaisiin jättää käyttäen yhteensä 217 ulkoisen Japani exome aineistoja. Samalla osoitetaan, että samanlaista lähestymistapaa voidaan käyttää muihin kolmen etnisen ryhmän, vaikka erotteleva virta riippuu etninen ryhmä. Osoitamme, että ATM-geeni ja PAPPA2 geeni voitaisiin tunnistaa syöpään ennuste liittyviä geenejä. Ohittamalla sekvensointi normaalin kudoksen kollegansa, tämä lähestymistapa on hyödyllinen keino paitsi vähentää aikaa ja kustannuksia sekvensoinnin lisäksi analysoimalla arkisto näytteitä, joille normaalista kudoksesta kollegansa eivät ole käytettävissä.

Citation: Suzuki A, Mimaki S, Yamane Y, Kawase A, Matsushima K, Suzuki M, et al. (2013) tunnistaminen ja karakterisointi Cancer Mutaatiot Japani keuhkoadenokarsinooma sekvensoimatta normaalin kudoksen kanssa. PLoS ONE 8 (9): e73484. doi: 10,1371 /journal.pone.0073484

Editor: H. Sunny Sun, Institute of Molecular Medicine, Taiwan

vastaanotettu: 22 maaliskuu 2013; Hyväksytty: 19 heinäkuu 2013; Julkaistu: 12 syyskuu 2013

Copyright: © 2013 Suzuki et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat JSPS KAKENHI Grant numero 24300345. Tätä työtä tukivat myös MEXT KAKENHI Grant Number 221S0002. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

kynnyksellä seuraavan sukupolven sekvensointi teknologia on helpottanut suuresti havaitsemista ja geneettisten vaihteluiden ihmisen genomin. Useimmat huomattavasti, tämäntyyppinen tutkimus on ajanut 1000 Genomes Project [1,2], jonka tarkoituksena on tarjota kattava kartta ihmisen perimä politiikan eri etnistä alkuperää. Kuitenkin, koska koko genomin sekvensointi on vielä kallista, sekvensointi koko eksonin alueiden käyttäen hybridisaatio-capture menetelmiä (exome sekvensointi) [3-5] on laajalti käytetty seuloa geenejä, jotka liittyvät perinnöllisiin sairauksiin. Sekvensoimalla exomes terveistä ja sairastuneiden yksilöiden ja verrataan niitä, geenejä, jotka ovat vastuussa monista sairaudet on määritelty [6], mukaan lukien Miller oireyhtymä [7,8] ja familiaalinen hyperkalemic hypertensio [9]. Yhdessä edistystä, joka on tapahtunut exome sekvensointi volyymi ituradan yhden emäksen monimuotoisuus (SNP) tiedot, jotka on rekisteröity dbSNP laajentaa nopeasti eri populaatiot [10].

Exome sekvensointi tarjoaa tehokkaan työkalu syövän tutkimuksiin samoin. Itse asiassa useat papereita on julkaistu kuvaavat tunnistamiseen ja yhden nukleotidin variantteja (SNVs) että somaattisesti esiintyvät syövät ja epäillään olevan vastuussa syövän synnyn ja sairauksien kehittymisestä [11]. Kansainvälinen Cancer Genome Consortium (ICGC) on kerännyt exome tietoja somaattisia SNVs jotka ovat läsnä yli 50 syöpien osana kansainvälistä yhteistyönä [12-14]. Cancer Genome Atlas (TCGA) on kehittänyt laajan genomista aineisto, kuten exomes korkealaatuisesta munasarjasyövän, jota on käytetty havaitsemaan merkittävästi mutatoitunut geenejä, mukaan lukien TP53, BRCA1 ja BRCA2 [15]. Ne ovat myös tunnistaa erilaisia ​​genomista poikkeavuuksien vapautuneilla polkuja, jotka voivat toimia terapeuttisina kohteina.

Useimmissa meneillään syöpä exome tutkimuksia, normaali kudos kollegansa on sekvensoitu rinnakkain syöpäkudoksessa [15-19]. Tämän oletetaan olevan tarpeen, koska ituradan variantteja on jätettävä täydelliset SNVs havaita somaattisia SNVs jotka ovat ainutlaatuisia syöpiä. Kuitenkin sekvensointi normaalin kudoksen kollegansa lisää kustannuksia ja aikaa analyysin. Lisäksi, joissakin tapauksissa, se on vaikea saada normaalin kudoksen kanssa. Lisäksi on epäselvää, kuinka tarkasti ituradan SNVs voidaan sulkea pois käyttämällä normaalia kudosta exomes. Konservatiivisesti sulkea ituradan SNVs, niiden järjestys syvyyksiin ja tarkkuudet saattavat tarvitse olla suurempi kuin ne, jotka saadaan syöpään exomes.

Tässä tutkimuksessa me luodaan ja analysoidaan 97 syöpä exomes alkaen Japani keuhkoadenokarsinooma potilaille. Osoitamme myös, että somaattisen SNVs voidaan rikastaa tasolle, joka on riittävä edelleen tilastollisia analyysejä jopa ilman, että sekvensointi normaalin kudoksen kanssa. Erottamaan ituradan somaattisista SNVs, ensin verrataan vaihtelu kuviot välillä syövän exome kanssa 96 muiden potilaiden normaalia kudosta exomes. Olemme myös yrittäneet tehdä samanlainen keskinäinen vertailu pelkästään hyödyntämällä syöpä exomes ilman huomioon exomes normaalin kudoksen kanssa. On totta, että jos me jätetty kokonaan pois normaalia kudosta sekvensointi, olisimme alustavasti piittaamattomuutta somaattisten mutaatioiden joka esiintyy täsmälleen samassa perimän asemaa useissa syövissä. Kuitenkin viime aikoina paperit ovat selvitetty, että tällaisia ​​yhteisiä SNVs ovat hyvin harvinaisia ​​[15,20-22]. Lisäksi monet näistä rekursiivisesti mutaatioita on rekisteröity syövän somaattinen mutaatio tietokantoja kuten Sangerin COSMIC [23,24], ja ne toistuvat SNVs voidaan talteen seurantatutkimuksia osittain käyttämällä tietoja normaaleista kudoksista. Ymmärtää ainutlaatuisuus kunkin syöpä, tilastollinen analyysi erillisten SNVs oletetaan olevan olennaisen lisäksi analyysin yhteisen SNVs.

Tässä tutkimuksessa osoitamme, että on mahdollista tunnistaa ensimmäinen ehdokkaita syöpään liittyvien geenien ja reitit, jopa ilman sekvensointi normaalista kudoksesta vastine. Osoitamme, että tämä lähestymistapa on käyttökelpoinen paitsi vähentää kustannuksia sekvensoinnin, vaan myös parantaa Fidelity tietoja. Sen pitäisi olla myös hyödyllinen analysoitaessa vanha arkisto näytteitä, joille normaali kudos kollegansa eivät ole aina käytettävissä. Tässä kuvaamme käytännöllinen ja kustannustehokas menetelmä nopeuttaa syövän exome sekvensoinnilla.

Tulokset ja keskustelu

karakterisointi SNVs käyttäen 97 exome aineisto

Ensinnäkin luodaan ja analysoidaan koko-exome sekvenssit 97 Japani keuhkoadenokarsinooma potilaille. Exome kerättiin sekä syövän ja normaali-kudoksessa kollegansa erotettuna laser kaapata mikrodissektion. Puhdistimme eksoni DNA (exomes) ja tuotetaan 76-base pariksi-end lukee käyttäen Illumina GAIIx alustalla. Noin 30 miljoonaa kartoitettu sekvenssit saatiin kustakin näytteestä, joka tarjoaa 74 x kattavuus kohdealueiden; 93% kohdealueiden oli 5 x peitto (Kuva S1 File S1). Burrows-Wheeler Aligner (BWA) [25] ja Genome Analysis Toolkit (GATK) [26,27] käytettiin tunnistamaan SNVs (kuva S2 File S1). Vain SNVs että havaittu syövän kudoksissa ja ei havaittu vaihtelua normaaleissa kudoksissa valittiin lisäanalyysiä.

Saatu aineisto käytettiin luonnehtimaan syöpää erityinen mutaatio kuviot (taulukko S3 File S1). Laskimme rikastuminen SNVs sisällä tiettyjen geenien, proteiinien verkkotunnuksia, toiminnalliset luokat, ja polkuja. Etsimme geenien kanssa somaattisten SNVs merkittävästi rikastettu japanilainen keuhkoadenokarsinooma. Kuten taulukosta S4 File S1, useiden geenien havaittiin merkittävästi mutatoitunut. Erityisesti etsittiin verkkotunnusten on rikastunut SNVs ja satama tunnetaan syöpään liittyvien mutaatioita COSMIC tietokantaan. Kaikkiaan, 11 geeniä tunnistettiin (P 0,02, taulukko 1). Esimerkiksi KH homologia (DH) verkkotunnus PREX1 geenin [28] rikastettiin SNVs (

P

= 0,00071). Kuitenkin PREX2 geeni [29] Pleckstrin homologia (PH) domain rikastettiin SNVs (

P

= 0,011) (Kuva 1A ja B). Sekä PREX1 ja PREX2 geenien aktivoida vaihto BKT GTP varten Rho perheen GTPaaseja ja DH /PH domeenit ovat välttämättömiä nukleotidin vaihtamiseksi GTPaaseja ja sen sääntely [30-32]. Lisäksi olemme analysoineet ekspressiokuvioita näiden geenien käyttää syövän geenien ilmentyminen tietokanta, GeneLogic (kuva S3 File S1). Ekspressiotasot PREX1 ja PREX2 ei parannettu keuhkoadenokarsinooma mutta parannettiin vuonna monenlaisia ​​syöpiä, joka on osittain aiemmissa tutkimuksissa [33]. SNVs vuonna PREX1 ja PREX2 geenit, jotka olivat keskittyneet sen keskeinen signalointidomeenien, saattaa parantaa toimintaa näiden geenien ja siten toiminnallisesti jäljittelee lisääntynyt ilmaisuja tämän geenin joidenkin eri syöpiä. Syöpä liittyvä geeni ehdokkaita tunnistettu tästä aineisto on lueteltu taulukossa 1.

määrä SNVs

Gene

Domain

Domain

Gene

P-value

*

EGFR

†IPR001245:Serine-threonine/tyrosine-protein kinase34374.4e-21KRAS

† IPR001806: Ras GTPase678.0e-6TNNIPR003961: fibronektiinin, tyyppi III455.2e-5TP53

† IPR008967: p53 kaltainen transkriptiotekijä DNA-binding20239.5e-5PREX1IPR000219: KH homologia (DH ) domain450.00071DNAH7IPR004273: Dynein raskas chain570.0025FSTL5IPR011044: kinoproteiinista amiini dehydrogenaasi, beeta-ketju-like770.0043NRXN3IPR008985: konkanavaliini A: lla kaltainen lektiini /glucanase570.0063PREX2IPR001849: Pleckstrin homology370.011FER1L6IPR008973: C2 kalsium /lipidiä sitovan domeenin, CaLB360.013COL22AIPR008985: konkanavaliini A-kaltainen lektiini /glucanase360.015Table 1. Luettelo tunnistetuista mahdollisista syöpään liittyvien geenien.

*

P

0.02

† Raportoitu Cancer Gene Census [11]. Huomaa, että geenit huipulla luettelossa aiemmin raportoitu liittyvän tähän syöpätyypin, vaikka useimmat niistä ovat uusia mahdollisia syöpään liittyvien geenien. CSV Lataa CSV

SNVs vuonna PREX1 (A) ja PREX2 (B) geenit ovat edustettuina ruutuihin. Proteiini aloja, joilla rikastusta on SNVs olivat tilastollisesti merkitseviä ovat edustettuina oranssi laatikot (myös katso materiaalit ja menetelmä). DH-domain: KH homologia (DH) domain; PH: Pleckstrin homologiadomeeni; D: DEP domain; P: PDZ /DHR /GLGF.

Samoin polku rikastamiseen analyyseistä Kegg tietokantaa [34] myös havaittu useita otaksuttu syöpään liittyvien reittejä. Tunnistetut reitit on lueteltu taulukossa 2. On mielenkiintoista, että kohdun limakalvon syövän reitti [35] on havaittu tässä rikastus analyysi (

P

= 3.1e-15, kuvio 2A). Tämä reitti sisältää tärkeimmistä syöpään liittyviä reittejä, esimerkiksi MAPK signalointireitin ja PI3K /AKT-reitin. Tämän reitin, vertasimme mutaatio kuvioita välillä Japani datan ja ne edellisen tutkimuksen keuhkoadenokarsinooma valkoihoisilla [21]. Huomasimme, että SNVs että EGFR geenissä oli neljä kertaa yleisempää Japanin väestöstä kuin keskuudessa valkoihoinen väestö (kuvio 2B, vasen paneeli). EGFR mutaatioita esiintyvä ei-tupakoitsija, naisten ja Aasian potilaiden keuhkojen adenokarsinooma [36], joka on molekyylitasolla syövän huumeiden,

gefitinibi

[20,37,38]. Toisaalta, KRAS mutaatioita, jotka ovat myös hyvin tunnettuja syöpään liittyvien mutaatioiden [39], olivat yli neljä kertaa yleisempiä valkoihoisten (kuvio 2B, keskellä paneeli). Kuitenkin kaikki mutaatiokaavojen eri populaatioiden välillä. Esimerkiksi TP53 tunsivat mutaatiot molemmissa aineistoja kanssa yhtä paljon (kuvio 2B, oikea paneeli).

Kegg ID

Pathway määritelmä

määrä syöpiä SNVs

P-arvo

*

hsa05213Endometrial cancer723.1e-15hsa04320Dorso-akselitasoon formation484.4e-15hsa05219Bladder cancer624.9e-14hsa05223Non-pienisoluinen keuhkosyöpä cancer667.1e-12hsa05214Glioma706.5e-11hsa05218Melanoma701.3e-9hsa05212Pancreatic cancer686.9e-9hsa05215Prostate cancer714.3e-7hsa05216Thyroid cancer361.1e -6hsa04520Adherens junction593.7e-6hsa05210Colorectal cancer531.8e-5hsa04012ErbB signaloinnin pathway642.6e-5hsa05120Epithelial solun signalointia

Helicobacter pylori

infection534.8e-5hsa04540Gap junction600.00024hsa04912GnRH signalointi pathway610.0011hsa05217Basal solun carcinoma410.0020hsa05222Small keuhkosyövän cancer520.0069hsa05220Chronic myeloidinen leukemia460.010hsa05160Hepatitis C670.012hsa05014Amyotrophic (ALS) 360.014hsa04977Vitamin ruoansulatusta ja absorption200.015hsa05416Viral myocarditis400.028hsa04512ECM-reseptorin interaction470.034hsa02010ABC transporters290.035hsa04510Focal adhesion780.037hsa05412Arrhythmogenic oikean kammion kardiomyopatia (ARVC) 400.039Table 2. Luettelo tunnistetuista mahdollisista syöpää liittyviä reittejä.

*

P

0.05 CSV Lataa CSV

(A) Mutation kuvioita kohdun limakalvon syövän polku, joka havaittiin rikastamiseen analyysissä esitetään. Koko ympyrän edustaa väestön syövistä kätkeminen SNVs vuonna vastaavan geenin (prosenttiosuus näkyy myös marginaali). SNVs tässä tutkimuksessa ja ulkoinen aineisto valkoihoisilla populaatioiden näkyvät punainen ja sininen ympyröitä, tässä järjestyksessä. Tieto puuttuu .: mutaatio taajuuksia ei ollut saatavilla. (B) vertailu mutaation suhteen EGFR, KRAS ja TP53 geenien keskuudessa aineistoja. P-arvot laskettiin kahden otoksen testi yhdenvertainen mittasuhteet.

epäselvyydet SNV tunnistaminen normaalin kudoksen kollegansa

Edellä mainitussa analyysissa syrjinyt ituradan variantit käyttämällä normaalia kudosta kollegansa. Useita SNVs alunperin tunnistettu somaattinen todettiin myös olevan läsnä normaaleissa kudoksissa, mikä olivat vääriä positiivisia puhelut alla vahvistusten silmämääräisesti on kartoitettu sekvenssit ja Sanger sekvensoinnilla. Tutkia syynä tähän ongelmaan, me tarkastetaan virheet satunnaisesti valitun 26 syöpien ja niiden normaaleissa kudoksissa. Keskimäärin kullakin syöpää, kaksikymmentäviisi prosenttia somaattisten SNV ehdokkaita todettiin olevan vääriä positiivisia (kuva 3). Näissä tapauksissa, sekvenssi kattavuutta ja laatua normaalin vastapuolen eivät ole riittäviä. Todellakin, sekvenssit tukevat kunkin SNV ja näitä ominaisuuksia merkittävästi poikennut välillä syövän ja normaalit kudokset. Vaikka lisäsimme kokonaismäärä lukee normaaleissa kudoksissa, oli vaikea käytännössä kattaa kaikki genomisen kantoja (kuva S4 File S1). Yhteenveto ituradan SNV vahvistukset on esitetty taulukossa S5 File S1.

Somaattiset SNV ehdokkaat tunnistettiin käyttäen 26 syöpä exomes ja jokainen normaali vastine. Oikeat somaattiset SNVs ja vääriä positiivisia näytettiin vaaleanpunainen ja sininen baareja, vastaavasti. 26 syöpiä käyttää analyysiin lajiteltiin lisääntyvä kokonaismäärä SNVs (x-akseli).

Huomasimme kuitenkin, että jotkut tunnistettiin oikein kuin ituradan SNVs ulkoisen viite exomes. Kaksikymmentäviisi exomes pystyimme jättää kahdeksan vääriä positiivisia puheluita kussakin syöpä. Tämä toi esiin mahdollisuuden, että SNVs muista potilaista voidaan käyttää malleina lisätä syvyyttä ja laatua sekvensointi.

Ilman ituradan SNVs tarkastelemalla keskinäistä päällekkäisyyksiä muiden henkilöiden exomes

edelleen testata tätä mahdollisuutta, tutkimme onko syöpä exome analyysejä olisi mahdollista ilman sekvensointi normaalia kudosta vastine kunkin syöpä. Ensin arvioidaan, missä määrin ituradan SNVs voitaisiin syrjiä käyttämällä ulkoisia exomes. Tätä varten käytimme 97 pariksi syövän normaalia exome aineistoja validoimiseksi aineisto. Olemme havainneet, että voimme havaita 54%: n ituradan SNVs käyttämällä 96 normaalista kudoksesta exomes ulkoisesta viite (kuvio 4A). Laajeni entisestään suodatuksen aineisto käyttäen ulkoisesti käytettävissä 73 Japani exome tiedot ja 48 talon Japani exome aineistoja. Kaikkiaan pystyimme poistamaan 64% ituradan SNVs käyttäen yhteensä 217 Japani exome aineistoja muilta henkilöiltä, ​​sekvensoimatta jokaisen syövän normaalia vastine (kuvio 4A). Ekstrapolointi kuvaaja osoitti myös, että 1350 ja 2000 näytettä vaadittaisiin poistamaan 90% ja 95%: n ituradan SNVs, vastaavasti. Odotamme, että tällainen otoskoko on saatavilla lähitulevaisuudessa harkitsee nykyinen nopea laajeneminen exome analyysin.

(A) Teho havaita ituradan SNVs huomioon keskinäinen päällekkäisyys muiden japanilaisten henkilöitä. Herkkyys kuvaa osuus ituradan SNVs tunnistettu oikein. Aineistoja käytetään sulkea ituradan SNVs näkyvät x-akselilla. Insertti edustaa ekstrapolointi kuvaajan. Sovitus käyrä kaavion on myös esitetty. (B) erotteluärsykeominaisuuksi- valtuudet kolmen eri etnisten ryhmien ituradan SNVs 97 Japani syövissä. Herkkyydet havaitsemiseksi ituradan SNVs esitetään seuraavat värit; vihreä: Kiinalainen; violetti: Yoruba; oranssi: valkoihoinen.

Arvioimme lisäksi jos sama suodatus voitaisiin tehdä ainoastaan ​​käyttämällä syöpä exomes. Saimme pääosin samat tulokset (kuva S5 File S1). Ilmeinen varoitus tässä lähestymistavassa on, että se jättää noin 3% somaattisten SNVs toistuvasti esiintyviä (kuva S5 File S1, sininen). Kuitenkin, kuten edellä mainittu, huomasimme, että nämä toistuvat SNVs olivat hyvin harvinaisia ​​[15,19] ja useimmat niistä olivat peräisin kyseenalainen somaattinen SNVs, jotka unohdetaan normaaleissa kudoksissa. Katsomme myös, että suurin osa näistä toistuvista SNVs mahdollisesti voidaan analysoida erikseen sekvensoimalla rajoitettu määrä normaaleissa kudoksissa.

suodattaminen ituradan SNVs harkitsemalla keskinäistä päällekkäisyyksiä eri etnisten ryhmien ja harvinaisia ​​SNP

tutki SNVs muissa etniseltä taustaltaan voitaisiin käyttää ulkoista aineistoja suodatukseen. Saimme exome tietoja henkilöitä eri etnisten taustoja 1000 Genome Project. Käytimme nämä exome aineistoja jättää ituradan SNVs jotka tunnistettiin Japanin syövissä. Huomasimme, että erotteleva teho oli huomattavasti pienempi verrattuna exomes alkaen Japani väestö. Näin ollen, nämä aineistot eivät sovellu tähän tarkoitukseen (kuvio 4B). Olemme myös tutkittu ja todettu, että exomes jokaisessa etninen ryhmä olivat hyödyllisiä erottamaan ituradan SNVs vastaavassa ryhmässä (kuva S6, S7 ja taulukko S6 File S1).

siis tutkittava, missä määrin vähäisiä ituradan muunnelmia voitiin peittää tätä lähestymistapaa Japanin väestöstä. Arvioimme herkkyys suodatuksen prosessin SNVs että 97 syövissä (Kuva S8 File S1). Olemme havainneet, että 88%: n ituradan SNVs esiintyy yli viisi prosenttia 97 exomes voitiin havaita käyttäen 73 ulkoista Japani aineistoja. Sillä SNVs esiintyy 1% 97 syöpiä, 19% voitiin sulkea pois.

käyttäminen raakaöljyn aineisto luonnehtimaan syöpään liittyvät SNVs ja reitit

Yhdessä kanssa 217 Japani exomes käytetään suodatus, 36%: n ituradan SNVs pysyi suodattamaton. Olemme kuitenkin katsoi, että se voi olla silti mahdollista käyttää raakaa SNV aineisto on alustava arvio tunnistetaan ja analysoidaan syöpään liittyvien geenien ja polku ehdokkaita. Validoida tätä ajatusta, vertasimme tuloksia rikastamiseen analyysien välillä raakaöljyn aineisto ja hienostunut somaattisen SNV aineistoja, jotka syntyvät pariksi syöpää normaalia exomes.

Useimmat Oletetun syöpään liittyvien geenien ja reitit jotka tunnistettiin puhdistettu aineisto oli läsnä myös raakaa aineisto (taulukot S7 ja S8 File S1). Esimerkkinä TNN geenin, joka oli raportoitu markkerina kasvaimen strooman [40-42], on esitetty kuvassa S9 Tiedosto S1. Tässä tapauksessa vaikka ituradan SNVs, jotka olivat suodattamaton raa’assa aineisto (merkitty mustalla kuvion S9 Tiedosto S1), rikastamista somaattisten SNVs tällä alalla oli tilastollisesti merkitsevä. Kaikkiaan yhdeksän geenit, jotka tunnistettu jolla syöpään liittyvien SNVs päässä puhdistettu aineisto havaittiin myös raakaa aineisto. Toisaalta, kaksi geeniä päässä puhdistetut aineisto eivät olleet edustettuina raakaa aineisto. Kun polku analyysissa tunnistettiin 26 syöpään liittyvien reittien, joka tunnistettiin puhdistettu aineisto. Lisäksi 19 polut olivat myös edustettuina raakaöljyn aineisto sekä puhdistettu aineisto. Yhtymäkohdista aineistot on koottu taulukkoon 3. On huomattava, että tilastollisesti rikastaminen analyysit olivat mahdollisia jopa nykyistä kattavuutta suodattimen aineisto. Kun laajennettu ulkoinen aineisto, se olisi käytännöllisempää alistaa ehdokkaita tulosten Sangerin sekvensointia vahvistusten sekä poistamalla jäljellä ituradan SNVs.

Lukumäärä tunnistettu genes/pathways

Crude

*

Refined

Overlap

Genes16119Pathways232619Table 3. tulosten vertailu on rikastamisen analysoi välisen raakaöljyn ja hienostunut aineisto.

* Tunnistetut käyttämällä raakaa aineisto.

† Tunnistetut avulla puhdistettu aineisto.

‡ Merkittävää sekä raakaöljyn ja jalostettujen aineistot. CSV Lataa CSV

tunnistaminen ennusteen liittyvien geenien käyttämällä raakaa aineisto

Yhtenä tärkeimmistä tavoitteista syövän exome tutkimuksissa, tutkimme vaikuttavia mutaatioita syöpä ennusteet voidaan tunnistaa käyttämällä raakaa aineisto ( Taulukko S9 ja kuvion S10 File S1). Vuonna Kaplan-Meier-analyysi, seitsemän potilasta joka kantoi SNVs ATM-geeni (kuvio 5A) osoitti tilastollisesti merkitsevä huono ennusteita (

P

= 9.6e-6, kuvio 5B). Kolme SNVs ATM geenissä merkittävästi rikastettu fosfatidyyli 3- /4-kinaasin katalyyttinen domeeni (

P

= 0,014). ATM havaitsee DNA-vaurioita ja fosforyloi TP53, mikä puolestaan ​​vetoaa eri soluvasteita, kuten DNA: n korjaus, kasvun pysähtymiseen ja apoptoosiin, ja yhdessä estää syövän etenemisen (kuvio S11 File S1) [43,44].

(A) SNVs ATM-geeni. SNVs, jotka määriteltiin alkuperäisessä seulonnassa ja niitä jää jäljelle, kun Sangerin sekvensoinnin validointi normaali kudos vastine näytettiin musta ja punainen, vastaavasti. TAN: Telomeeri pituus huolto- ja DNA-vaurioiden korjaus; PI3_PI4 kinaasi: fosfatidyyli-inositoli-3- /4-kinaasin, katalyyttinen. (B) Survival analyysi potilaille ja ilman ATM SNVs. Aineistot ennen ja jälkeen Sangerin sekvensointia validointi edustaa musta ja punainen viivoja. Tilastollinen merkittävyys laskettiin käyttäen log-rank-testi (

P

0,05). Huomaa, että selviytyminen erot yksilöiden SNVs ei-Sanger-validoitu aineisto olivat merkittäviä ennen Sanger validointi. (C, D) Tulokset samanlainen analyysi kuin on kuvattu A ja B varten PAPPA2 geenin. Tällöin potilaat jossa SNVs osoitti parempia ennusteita. ConA kuten sub: konkanavaliini A-kaltainen lektiini /glukanaasia, alaryhmä; N: Notch dimain; Peptidaasi M43: peptidaasi M43, raskauteen liittyvä plasma-A.

Meillä on myös tutki muut usein mutatoituja geenejä liittyi parempi tai huonompi ennusteet. Olemme havainneet, että potilailla, joilla on PAPPA2 mutaatioita osoitti pitkäaikaista eloonjäämistä kertaa (

P

= 0,026, kuvio 5C ja D). PAPPA2 proteolyzes IGFBP5 [45,46], joka on inhiboiva tekijä IGF [47]. Mutaatiot PAPPA2 geeni voi johtaa kertyminen IGFBP5, ja tuloksena väheneminen IGF signalointi voi heikentää syöpäsolujen lisääntymistä [48]. Jälleen on huomattava, että sekä ATM ja PAPPA2 geenit, tilastollista merkitystä ennustetekijöiden ero säilyi sekä ennen (musta viiva) ja jälkeen (punainen viiva) loput ituradan mutaatioita poistettiin, joka validoitiin Sangerin sekvensoinnilla (kuva 5B, D ja taulukko S10 File S1).

Johtopäätökset

Olemme tunnistaneet ja ominaista SNVs keuhkojen adenokarsinooma on japanilainen väestöstä. Lisäksi biologisia arviointeja löydetty SNVs kuvataan muualla. Erityisesti tietoa transcriptome ja epigenome olisi tärkeää jatkotutkimuksiin syövän genomien, koska ne irtoa uusia valot syövän biologian (taulukko S1) [49]. Tässä tutkimuksessa olemme myös esittäneet käyttökelpoinen lähestymistapa analyysi syövän exomes, ilman tarvetta sekvensoida normaalia kudosta vastine. Uskomme, että lähestymistapa ei ainoastaan ​​alentaa esteitä rahaa, aikaa ja tietojen uskollisuus on exome analyysissä, mutta myös mahdollistaa exome analysointi arkisto näytteitä, joille normaali kudos kollegansa eivät ole aina käytettävissä.

Materiaalit ja menetelmät

Ethics selvitys

Kaikki näytteet kerättiin seuraamalla protokollaa (ja kirjallinen suostumus), jotka on hyväksytty eettinen komitea National Cancer Center, Japan (kirjeenvaihto: Katsuya Tsuchihara; [email protected]).

Case valinta ja DNA: n valmistus

Kaikki kudoksen materiaalien saatiin Japani keuhkoadenokarsinooma potilaiden kanssa tarkoituksenmukaista tietoon perustuva suostumus. Kirurgisesti lei- kattu ensisijainen keuhkoadenokarsinooma näytteitä pituussuunnassa mitoiltaan yli 3 cm valittiin. Tiedot 52 potilasta, joilla oli pahenemisvaiheita ja muut kliiniset tiedot 97 tapausta on esitetty taulukossa S11 File S1. Kaikki 97 syöpä ja normaaleissa kudoksissa uutettiin metanolilla kiinnitettyjen näytteiden laserilla talteenotto mikrodissektion. DNA: n puhdistus suoritettiin käyttäen EZ1 Advanced XL Robotic työasema EZ1 DNA Tissue Kit (Qiagen).

Whole-exome sekvensointi

Käyttämällä 1 ug eristettyä DNA, valmistimme exome-sekvensointi kirjastot käyttämällä SureSelect Target Enrichment System (Agilent Technologies) mukaan valmistajan protokollaa. Siepattu DNA sekvensoidaan Illumina Genome Analyzer IIx platform (Illumina), jolloin saatiin 76-base pariksi-end lukee.

Somaattiset SNV havaitseminen

Menetelmiä, joita käytettiin havaitsemaan SNVs, kuten BWA, SAMtools [50] ja GATK, on ​​esitetty kuvassa S2 File S1. Käyttämällä tietoja NCBI dbSNP rakentaa 132 ja yksi japanilainen genomin [51], suuret ituradan SNVs suljettiin pois. Lisäksi harvinaisissa ituradan SNVs heitettiin pois käyttämällä 97 exomes normaalista kudoksesta kollegansa, 73 Japani exomes tarjoamia 1000 Genomes Project (jäljempänä vaihe 1 exome data, 20110521) ja 48 talon Japani exomes. Olemme myös validoitu osan SNV aineistojen Sangerin sekvensoinnilla syövän kudosten ja niiden normaalia kudosta kollegansa (kuva S12 File S1).

tunnistaminen erittäin mutatoitujen geenien

Olemme havainneet geenien merkittävästi rikastettu SNVs laskemalla odotettu määrä syöpiä SNVs geenissä. Pituus yhteensä CDS alueiden edusti

N

(noin 30,8 M emästä). Kun yksi potilas tunsivat yhteensä

m

SNVs, todennäköisyys sille, että potilas satamat SNVs geenin

t

(pituus:

n

) laskettiin

P

:

P

m

,

t

,

n

=

1

(

1

m

N

)

n

The summa

P

97 syövissä edusti odotetun määrän syöpiä SNVs geenissä

t

. P-arvot todettu määrä laskettiin Poissonin todennäköisyys funktion R ppois.

Tilastollinen lähestymistapa rikastamiseen analyysien

tarkastella rikastumista mutaatioiden funktionaalisen proteiinin domeeneja, me kartoitettiin SNVs ja tunnuksia käyttäen InterProScan [52] ja osoitetaan ne Luettelon Somaattiset mutaatiot Cancer (COSMIC). Analysoimme rikastusta SNVs samassa verkkotunnuksia kuin mutaatiot, jotka toimittivat COSMIC. P-arvot havaitut mutaatiot näillä aloilla laskettiin niiden hypergeometrisen jakaumat (R phyper). Lyhyesti, aloja, joilla SNVs rikastettiin tilastollisesti merkitsevästi kuin odotettu määrä SNVs annetussa pituus toimialueen valittiin. Arvioimiseksi odotettavissa numero, kokonaismäärästä SNVs kuuluvat geeni jaettiin geenin pituuden. Tätä analyysiä varten käytimme geenejä kätkeminen viisi tai enemmän SNVs koodaavalla alueella ja kolme tai useampia SNVs toimialueella.

osoitettu SNVs polkuihin kuvatulla Kioton Encyclopedia of Genes and Genomit (Kegg) ja laskettu rikastuksissa että SNVs että reittejä. Mutaationopeus

M

edustaa suhde keskimäärin mutatoitujen geenien kokonaismäärä geenejä (17175), joita käytettiin tutkimukseen. Odotusarvo määrän syöpiä SNVs in koulutusjakson

t

nimettiin

λ

ja lasketaan mutaatiovauhtia

M

ja määrän geenien reitin

n

kuin follows:

λ

t

,

n

=

{

1

(

1

M

)

n

}

×

97

The p-arvo todettu määrä syöpiä SNVs in koulutusjakson

t

laskettiin Poissonin todennäköisyys funktion R ppois.

Arvio syrjiviä voimaa poissulkemisen ituradan SNVs harkitsemalla keskinäistä päällekkäisyyksiä

arvioineet syrjivä valtaa ottamatta ituradan SNVs harkitsemalla tarkoin muista ei-syöpä exomes. Ituradan SNVs 97 pariksi kasvaimeen normaali exomes käytettiin viitteenä aineistoja. Jopa 217 näytettä (96 normaalista kudoksesta exomes muilta ja 121 lisäksi japanilainen exomes) valittiin satunnaisesti, ja niiden herkkyydet ja spesifisyydet havaitsemiseksi ituradan SNVs havaittiin ottamalla keskiarvot joko kaikki yhdistelmät tai osan noin 10000 yhdistelmät . Olemme myös arvioitu erotteleva teho tiedoilla 1000 Genomes Project neljälle etnisten ryhmien (73 JPT, 90 CHS, 81 YRI ja 64 CEU) käyttämällä samanlaisia ​​kokeita. Koko-exome sekvenssit (jäljempänä vaihe 1 exome data, 20110521) saatiin FTP vuonna 1000 Genomes Project.

Kaplan-Meier -käyrät

Kaplan-Meier menetelmää käytettiin testaamaan suhteet havaittu mutaatioita elinaika, ja laskelmat suoritettiin käyttäen R ohjelmistopaketti. Muutokset selviytymisasteet jotka korreloivat SNVs tutkittiin käyttäen log-rank-testi (R survdiff).

Tiedonsaantijärjestelyt

Koko raaka aineistot jaetaan tutkijoiden pyynnöstä. Tiedot somaattisten mutaatioiden kulloisellakin genomista koordinaattien on esitetty taulukossa S2.

tukeminen Information

Tiedosto S1.

Kuviot S1 S12 ja taulukot S3 S11 ovat mukana.

doi: 10,1371 /journal.pone.0073484.s001

(PDF) B Taulukko S1.

vertailu meidän aineisto muiden eri tutkimuksessa. Annoimme vertailun meidän aineisto kanssa geenien tunnistettu muita eri tutkimuksessa transcriptome ja epigenome tietoja keuhkosyövässä.

Doi: 10,1371 /journal.pone.0073484.s002

(XLSX) B Taulukko S2 .

lista somaattisten mutaatioiden tunnistaa puhdistettu aineisto.

Vastaa