PLoS ONE: Integroidun Perimän analyysi paljastaa Extended Ituradan homotsygootista keuhkosyöpä riski PLCO Cohort

tiivistelmä

Alttius yleisimmistä syövistä on multigenic johtuvat matalan ja korkean penetrance alttius-tekijöiden ja ympäristön altistumista. Genominen tutkimukset viittaavat ituradan homotsygootista uutena alhaisen penetraation tekijä yleisimmistä syövistä. Oletimme, että pitkä homotsygoottinen alueet (kirjoitusten-of-Homotsygoottikartoituksen [TOH]) satama tupakka-riippuvainen ja riippumaton keuhko-syövän alttiuden (tai suojaus) geenejä. Suoritimme i

n silico

genominlaajuisten SNP-array perustuva analyysi keuhkojen-syöpäpotilaille eurooppalaista syntyperää päässä PLCO seulonta-tutkimus kohortti tunnistamiseksi TOH alueille keskuudessa 788 syöpää tapauksissa ja 830 syntyperä yhteensopivat valvontaa. Association analyysit suoritettiin sitten välillä läsnäolon keuhkosyövän ja yleinen (c) TOHs (toiminnallisesti määritelty 10 lisää ihmisiä jakamalla ≥100 identtinen homotsygoottista puhelut), aTOHs (allelically toisiaan ryhmien sisällä cTOH), demografiset ja tupakka-altistuksen. Lopuksi, integrointi merkittävä c /aTOH kanssa transcriptome suoritettiin toiminnallisesti-kartan keuhko-syöpäriski-geenejä. Sen jälkeen kontrolloiden väestötiedot ja tupakointi, tunnistimme 7 cTOHs ja 5 aTOHs liittyvän keuhkosyövän (oikaistu p 0,01). Kolme cTOHs olivat yliedustettuina tapauksissa kontrolleihin (OR = 1,75-2,06, p = 0,007-,001), kun taas 4 olivat aliedustettuina (OR = 0,28-0,69, p = 0,006-0,001). Vuorovaikutus tupakoinnista ja cTOH3 /aTOH2 (2p16.3-2p16.1) havaittiin (oikaistu p 0,03). Loput merkittävä aTOHs on syrjäisimmät alueet 0,23-0,50 (p = 0,004-0,006) ja 2,95-3,97 (p = 0,008-0,001). Integroiduttuaan merkittävä cTOH /aTOHs kanssa julkisesti saatavilla keuhko-syöpä transcriptome aineistoja seurasi perustuva suodatus keuhkosyöpää ja sen asiaan polkuja paljasti 9 otaksuttu altistavia geenejä (p 0,0001). Lopuksi differentiaalisesti hajautettu cTOH /aTOH genomista variantit tapausten ja kontrollien välillä satama sarjaa uskottavaa differentiaalisesti ilmentyvien geenien osuus monimutkaisuuden keuhko-syövän alttiuden.

Citation: Orloff MS, Zhang L, Bebek G, Eng C (2012) Integrative Perimän analyysi paljastaa Laajennettu Ituradan homotsygootista keuhkosyöpä riski PLCO Cohort. PLoS ONE 7 (2): e31975. doi: 10,1371 /journal.pone.0031975

Editor: Amanda Ewart Toland, Ohio State University Medical Center, Yhdysvallat

vastaanotettu: 10 lokakuu 2011; Hyväksytty: 16 tammikuu 2012; Julkaistu: 27 helmikuu 2012

Copyright: © 2012 Orloff et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: CE omistaa Sondra J. ja Stephen R. Hardis Endaumentin puheenjohtaja Cancer Perimän lääketieteen Cleveland Clinic, ja American Cancer Society Clinical Research Professuuri. Nämä Tuoli varat ovat osittain tukevat joidenkin kirjoittajien FTE suorittaa tämän tutkimuksen (mukaan lukien MO ja CE: n aika). Ei ylimääräistä ulkoista rahoitusta saanut tätä tutkimusta varten. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

on olemassa kaksi pääasiallista histologista ryhmittymien keuhkosyöpä, pienisoluinen keuhkosyöpä (SCLC) ja ei-pienisoluinen keuhkosyöpä (NSCLC). Jälkimmäinen sisältää adenokarsinooma (AC) ja okasolusyöpä (SCC), sekä harvinaisempia alatyyppejä. On yleisesti hyväksyttyä, että keskimäärin 5-10% kaikista pahanlaatuisia kasvaimia aiheuttavat korkeat penetrance alttius geeni [1] – [3]. Esimerkiksi on 10 korkea penetrance geenejä, kuten

BRCA1 /2

ja

PTEN

, osuus ~ 10% kaikista rintasyövistä [3]. Vaikka aerodigestive ruoansulatuskanavan syöpien uskotaan olevan harvinainen osa neoplastisten spektrin

BRCA2

, ei muita korkea penetranssi keuhko-syöpä-alttius-geeni on tunnistettu, ja viime aikoihin asti, keuhkosyöpä on annettu lähes kokonaan ympäristön altistuminen pääasiassa tupakkaa. Viime vuosina on kuitenkin käynyt ilmi, että suurempi, mutta vaihteleva, osuus kaikista pahanlaatuisten kasvainten on genomista komponentti, annetaan heikompi taipumus (matala penetrance). Esim genomin laajuinen yhdistys tutkimuksessa (GWAS) ilmaisseet tiettyjä yhden nukleotidin polymorphims (SNP: t), johon liittyy vaara AC tupakoitsijoilla ja ei-tupakoitsijoilla [4]. Tähän mennessä, ei-pienisoluisen keuhkosyövän, erityisesti AC-liittyvän genomisen-loci on tunnistettu 15q25, 5p15, ja 6p21 [5] – [10]. Vaikutusten analysointi tupakoinnin keuhkojen-syöpäriski osoittivat, että tupakointi ei täysin selitä riskiä sairastua keuhkosyövässä ja että jäljellä genomista-tekijöiden vuorovaikutuksessa tupakointi ovat todennäköisesti [4]. Genominen variantit, kuten niihin liittyvät SNP, ei voi täysin selittää heterogeenisuus liittyy histologiset alatyyppejä joko [11], [12]. Tähän mennessä saadut tulokset viittaa tarpeeseen löytää muunlaisia ​​genomista vaihtelua, jota selittää suhteellisen suuri jäljellä riskejä keuhkosyövän.

karjanhoito ja eläinten malli kokeilu, in-jalostus mikä johtaa yhä homotsygoottisia loci on hyvin tunnustettu johtavan lisääntyneestä erilaisten häiriöiden, mukaan lukien lisäämällä kasvaimen esiintymistiheys [13]. Ihmisillä, ituradan homotsygootista kuin genomista tekijä liittyy sairauden riski on suhteellisen uusi käsite. Esim ituradan homotsygootista, eräänlainen genomista vaihtelua, on osoitettu liittyvän lisääntynyt riski ihmisen kohdunkaulan syövän. Tunnistaminen Homotsygoottisen loci riskitekijät voivat auttaa tavoitteen kohonnut kohdunkaulan korkean riskin naisilla [14] – [18]. Tähän liittyen suhteellisen tuoreessa tutkimuksessa paljastui huomattavasti korkeampi taajuus iturataan homotsygootista sarjassa liity valkoinen yksilöiden invasiivisen rintakarsinoomia, eturauhaskarsinoomien ja pää kaulan okasolusyöpä caricinomas by genominlaajuisten mikrosatelliittimerkkien genotyypitys [19]. Tämä yhdistys validoitu tutkimus AC tapausten ja Hyväksytty-valvonta, joka genotyypattiin kanssa tiheämpi SNP-pohjainen paneelit (Illumina HumanHap550v3_B array), mikä tukee suuri todennäköisyys tunnistaa homotsygoottisia genotyypit, jotka liittyvät monenlaisia ​​yhteisiä kiinteitä kasvaimia [ ,,,0],19]. Tutkimuksessa havaittiin, että homotsygootista sekä microsatallite- ja SNP-pohjainen analyysit osoittivat erityisiä, yhteisiä loci homotsygootista kaikille kolmelle kasvaintyypeissä tutkittu. Lisäksi oli myös hyvin homotsygoottisia loci, jotka ovat ominaisia ​​kullekin kasvaintyypeissä. Itsenäisesti, Bacolod ja työtovereiden [20] todettiin, että pitkät kirjoitusten homotsygootista (TOH), toiminnallisesti määritellään virittävä vähintään 4 Mb, olivat yliedustettuina peräsuolen syöpäpotilailla kontrolleihin.

Täällä arveltu, että ituradan alueelliset-homotsygootista liittyy erityisiä kromosomi loci on uudenlainen genomista tekijä laitteista matalissa keskivaikea penetrance alttius (tai suojaa) keuhkosyöpään. Sen sijaan tunnistaa yksittäisten geenien, meidän hypoteesi otetaan huomioon subsets geenien näillä alueilla, jotka ilmentyvät eri lainata monimutkaisia ​​alttiutta keuhkosyöpään. Me pyrittiin tähän hypoteesin järjestelmällisesti Yhdistämällä tietoja eri tavalla edustettuna TOH alueille genominlaajuisten ekspressiotietojen paikallistaa alueellista keuhko-syövän alttiuden loci.

Methods

hankinta genotyyppi Tiedot dbGAP

genotyypit saatiin eturauhasen, keuhkojen, peräsuolen ja munasarjasyöpä seulonta tutkimuksessa (PLCO) jos keuhko kohortti takautuvasti seulottiin rintakehän röntgenkuvat [21]. Aiheet olivat kaikki Itseidentifioituneempana valkoisina, ja käsittävät syntyperä yhteensopivat tapausten ja kontrollien [21], joka perustuu periaatteeseen-komponentti analyysit käyttämällä molempia SNP kytkeytymättömiksi keuhkosyöpä ja niiden syntyperä perillä SNP: n, kuten kuvattu Patterson et al [22]. Johdonmukaisesti, CEPH (Centre d’Etude du Polymorphisme Humain) Utah (CEU) HapMap ohjaa klusterin tässä potilasryhmässä, uudelleen vahvistaa Pohjois- ja Länsi-Euroopan alkuperä [23].

seurasi standardi laadunvalvonta ( QC) menettelyä käytettiin alkuperäisessä tutkimuksessa [4]. Näytteet seulottiin ja valita vain, jos heillä oli vähintään 95% onnistunut genotyypin puhelun hinnan. SNP vähäisin alleelifrekvenssit (MMM) 5%, lähdöt Hardy-Weinberg tasapaino (p 0,01) ja ≥5% puuttuvien kohti SNP, jätettiin pois muihin analyyseihin. Sen jälkeen QC suodatus, meillä oli 1618 henkilöä (788 tapausta ja 830 syntyperä verrokkia), joiden keskimääräinen ikä luokkien 1,63 (5 luokat on määritelty taulukossa S1), joka käsittää 967 urosta ja 651 naarasta, kuten 156-tupakoivilla, 703 edellinen tupakoitsijoita ja 759 tupakoijilla (Taulukko S1); ja keskimääräinen 526826 (514355 peittyvästi) SNP (93,8%) /aihe. Taulukossa S1 esittää yhdistys analyysi perustuu logistinen malli iän, sukupuolen ja tupakointi (koskaan tupakoineet, edellinen tupakointi ja tupakointi) kovariantteja jälkeen ilman mahdollisia geneettisiä vaikutuksia. On tärkeää huomata, että osuus nykyisistä tupakoitsijoista oli noin puoli määrä aktiivisia tupakoitsijoita Yhdysvalloissa väestössä. Todettiin, että kyseessä on kuitenkin alhaisin tupakoivat kun edellisen tupakoitsijat olivat yhteensopivia.

kvantifiointi Tracts homotsygootista ja vertailu Taajuudet syöpätapausta ja säätimet

tunnistaminen kirjoitusten homotsygootista ( TOH) ja yhteiset TOH (cTOH) alueella.

laajentanut moduuli Toimii homotsygootista että GoldenHelix ohjelmistojen [24] tunnistaa TOHs [in-house ohjelmistojen (Zhang et ai, julkaisematon)]. Seuraavaksi tiedot kaikista aiheista tutkittiin, onko tietty vähimmäismäärä yksilöiden jakaa TOH puhelua tietyssä asemassa. Tunnistaa tilastollisia eroja TOHs sisällä tapaus-verrokki suunnittelu, me vain säilyttää ne TOHs joissa 10 tai enemmän aiheita jakaa 100 identtinen homotsygoottista puhelut, jota toiminnallisesti määritellään yhteisenä TOH (cTOH). On 333861 SNP vähintään 10 TOH kutsuu koko sarjan, joka on 65% alkuperäisestä altaan SNP.

havaitseminen cTOHs liittyy keuhkosyöpään.

Sitten nähden testaus assosiaatio cTOH ja keuhko-syöpätapausta. Ottamalla huomioon kunkin cTOH kuin genominen muunnos, genomin laajuinen tapaus-verrokki-analyysi suoritettiin kunkin cTOH, jossa cTOH nähtiin binäärimuuttuja perustuu läsnäolo tai puuttuminen on cTOH. Käyttäen kutakin TOH (joka sisältää useita SNP jotka ovat kytkentäepätasapainossa) muuttujana huomattavasti vähentää testit suoritetaan ja tehon lisäämiseksi yhdistyksen analyysi. Perinteinen yhden SNP-yhdistys tutkimukset vaativat vähintään 610 000 (enintään 3 miljoonaa, jos useampi SNP käytettäessä) testeissä, jos perinteinen GWAS tehtiin. Logistinen malli sovitettiin kunkin cTOH tarkastelemalla taudista asemaa tuloksesta ja cTOH kuin ennustaja. Muita covariates sisältyivät malliin olivat ikä, sukupuoli ja tupakoinnista. P-arvot saatiin Wald testit ja OR (95% CI) laskettiin läpi kerroin arvioita sovitetun logistinen malli. Havaitsemiseksi vuorovaikutukset cTOH ja tupakointi, ja cTOH ja ikä, logistinen malli, jossa on kaksi ylimääräistä vuorovaikutuksen kannalta sovitettiin kullekin cTOH. P-arvo vuorovaikutuksen saatiin F-testi. Minimoida mahdollisuudet vääriä positiivisia löydöksiä, cTOHs pidetään tilastollisesti merkitsevä, jos niiden p 0,01 [24]. Lisäksi Q-arvo lähestymistapa [25], joka perustuu käsitteeseen väärän löytö korko, käytettiin valmistelevan opas jonka variantteja kutsutaan voidaan tutkia tarkemmin.

Tutkiminen allelically yhteensopivat ryhmittymät sisällä cTOH (aTOH).

Kuten edellä todettiin, cTOH on toiminnallisesti määritellään vähintään DNA-kohtien, jotka ovat homotsygoottisia ja vähimmäismäärä aiheita jakaminen cTOH, mutta ei laadullisia yhteensopivuuden nukleotidin. Sisällä cTOH, TOH segmenttejä verrattiin sitten pareittain ja alleelinen ottelu on ilmoitettava, jos vähintään 0,95 yhteisesti kuin puuttuu, yhdessä homotsygoottinen sivustot ovat identtisiä. Nämä alleelinen vastaavia ryhmiä TOHs sisällä cTOH kutsutaan ”allelic’TOH (aTOH). Kuvaaminen ja skannaus näiden aTOHs suoritettiin käyttämällä räätälöityjä ohjelmistoja

CAG-TOH

(julkaisematon ohjelmisto), samanlainen alleeliset-matching menettely Plink [26].

Detection of aTOHs liittyvän keuhkosyöpää tapauksissa.

aTOH kuin genomista variantti käytettiin sitten yhdistyksen analyysi sisällä tapauskohtaisesti valvonnan kehyksen. Jos haluat säilyttää valtaa tilastollisen analyysin, me vain keskittyneet aTOHs jotka ovat läsnä vähintään 5 tapauksessa ja 5 kontrollia. Kunkin aTOH, olemme soveltaneet logistinen malli sairaus asemaa tuloksesta ja aTOH ennustajana iän, sukupuolen ja tupakointi kovariantteja. Samanlainen cTOH todettiin, aTOHs kanssa p 0,01 Wald-testi on ilmoitettu merkitsevästi yhteydessä keuhkosyöpään. Olemme myös soveltaneet q-arvo lähestymistapa [25].

integrointi Geneettiset Tiedot Merkittävä c /aTOH alueiden kanssa julkisesti saatavilla Expression Array Dataset

Tiedot saatiin peräisin julkisesti saatavissa [27] geeni -ilmaisu aineisto 107 tuore kudosnäytteistä AC (58 kasvain ja 49 ei-tuumorikudoksista 20 tupakoimattomia, 26 entiset tupakoitsijat, ja 28 tupakoijilla) ladattavissa Gene Expression Omnibus (GSE10072), ympäristöministeriön ja Genetics keuhkosyöpä etiologia (EAGLE) tutkimus (https://dceg.cancer.gov/eagle). Kriteerit valitaan tässä array aineisto antaa ei vain vähäisiä bias, mutta fysiologisesti merkityksellisiä tietoja. Seurasimme yleisstandardia että erityiset valintakriteerit ja QC: n ovat paikallaan ennen käyttäen julkisesti saatavilla aineistoja (esimerkiksi lauseke array) eri alustoille integrointitarkoituksiin. Näin ollen, olemme varmistaneet, että keuhkosyövässä lausekkeen array aineistoja kuuluvat potilaat, jotka ovat samankaltaisia ​​kuin potilailla, jotka saivat genotyyppi ja altistettiin TOH analyysiin. Esimerkiksi potilaat hyödynnetään sekä ilmaisun array ja TOH analyysin edustavat kahta eri osa yksi paljon suurempi tutkimuskohortissa. Tämä itsessään on merkittävä vahvuus tämän jakelukanavasta integraatioprosessin koska potilaat kahdessa aineistoja alistettiin samaan osallisuutta /valintakriteerit; nämä henkilöt ovat altistuneet samanlaisia ​​ympäristö- tai hoitoon olosuhteissa; mikä tärkeintä, esi tausta ”ilmaisun array aineisto” potilaat olivat samankaltaisia ​​kuin jotka genotyypattiin Toh analyysia; ja potilaat ovat samanikäisiä vaihtelee, eli 55-60 vuotta. Sen jälkeen QC, me normalisoitui ilmaus profiilit näytteitä Robust Multichip keskiarvo (RMA) menetelmää, samaan tapaan kuin saman ilmaisun array tiedot on alun perin käsitelty [28]. Raaka-koettimet kartoitetaan niiden vastaavien geenien, ja useita koettimia, jotka vastaavat samaa geeniä laskettiin keskiarvo. Merkittävä cTOH alueet olivat ensimmäiset laajennettiin 250 kb kumpaankin suuntaan, ja geenit näillä alueilla havaittiin (259 geenejä). Määrä geenejä mukana alueella kasvaa lineaarisesti reunustavat alueet laajennetaan, mutta riippuu myös alueen kuulustellaan (eli jos geeni rikas tai geeni köyhä alue). Jos se palasi 1000 geenejä (jota ei havainnut meidän analyysit täällä), meillä olisi vain käytettävä LD vangita lohkon cTOH tai aTOH. Microarray ilmentymisen profiilit 153 259 cTOH-geenien havaittiin ilmenemistä array. Myöhemmin me arvioidaan jatkuvasti

a priori

perustan eroja ekspressioprofiilit näistä 153 geeneistä käytetään yksittäisiä univariate logistisen regression kanssa Bonferroni korjausta varten tilastollisen merkittävyyden laskelmat (tuloksia ei ole esitetty). Expression profiilit merkittävien geenien yhden muuttujan analyysin (p 0,01) ja sisällä +/- 250 kb alueella c /aTOH alue alistettiin valvomattoman hierarkkinen klusterointi [29] käyttämällä MATLAB.

priorisointi Candidate geenit

Kun integrointi merkittävä c /aTOH alueille ilmaisun array aineisto, päätimme riskejä ero geenien ilmentymistä c /aTOHs ositettu tupakoinnista. Geenit, jotka osoittivat ero ekspressioprofiileja merkitsevä p 0,0001 in alati ja koskaan tupakointi kerrostumien alistettiin sitten tekstin kaivos lähestymistapa auttaa suodatin tarvittavat tiedot tuotetaan genomista, transcriptomic, ja proteomiikka tutkimuksia saatavilla PubMed kirjallisuudessa tietokantaan. Näin ollen tätä tietoa käytettiin tunnistamaan suhde verkostoja geenien, niiden selostukset, niiden proteiinien ja muiden keuhkosyöpään-asiaa biologisia prosesseja tai reittejä [30] – [32].

Tulokset

tunnistaminen erityiset yhteisen Tractsin homotsygootista (cTOH) in yksilöiden keuhkosyöpä on PLCO Cohort

Vastatakseen meidän keskeinen hypoteesi, että erityiset ituradan TOH on joko yli- tai aliedustettuina keuhko-syöpätapausta yli ancestry- verrokeilla, me aluksi seulotaan TOH alueiden PLCO-aineisto (skeema kuvassa 1). Löysimme yhteensä 91460 TOHs kaikissa näytteissä on 44725 TOHs tapauksissa ja 46735 TOHs valvontaan. Keskipituus TOHs oli 886 kb (mediaani = 677,4 kb, 1

st neljännekseen = 484,8 kb, 3

rd neljännekseen = 956,3 kb) ja keskimäärin SNP kussakin TOH 141,4 (mediaani 121, 1

st quartile108, 3

rd kvartiili = 145). Kaikkiaan 890 tällaisten cTOHs tunnistettiin koko genomin, joiden koot +141,6-3421 kb (keskiarvo = 2144 kb, SD = 3115,6 kb, mediaani = 1064 kb, 1

st kvartiili 623,9 kb, 3

rd neljännekseen 2144 kb) ja SNP-lasken 100-413 (keskiarvo = 375, SD = 418, mediaani = 215).

skeema edustaa kehyksen avulla tunnistetaan ja myöhemmin yhdistää merkittävä cTOHs ja aTOHs (alkaen PLCO keuhkosyövän seulonta tutkimus), globaalin transcriptome aineistot vertaamalla keuhkosyövässä normaaliin keuhkoja (alkaen EAGLE keuhkosyövän seulonta tutkimus). Useita differentiaalisesti ilmentyvien geenien sisällä cTOHs ja aTOHs olivat ehdokkuudestaan ​​priorisoidaan aluksi perustuu tilastollisen merkittävyyden seurasi biologinen uskottavuus (esim asiaan hiiri malleja, raportoitu somaattisesti muuttaa satunnaista keuhkosyövässä, asiaan signalointireiteissä ym) saatiin lopulta 9 ” uskottavin ”kandidaattigeenit ja yksi ehdokas genomin alueella. Jälkimmäinen on nimetty, koska se oli itsenäisesti johdettu (tämä nykyinen tutkimus) ja myöhemmin havaittu päällekkäisiä alueen aiemmin havaittuja 3 aikaisemmissa tutkimuksissa kuten liittyy keuhkosyövän riskiä.

Tarkastelemalla kunkin cTOH kuten perimän muunnos, teimme tapaus-verrokki analyysi säätämisen vaikutukset iän, sukupuolen ja tupakoinnista. Seitsemän cTOH alueiden havaittiin merkittävästi eri tavalla edustaa välillä LC tapausten ja kontrollien perusteella p 0,01 (taulukko 1, kuvio 2 ja taulukko S2) [38 cTOH alueilla havaittiin p 0,05 (tuloksia ei ole esitetty)]. Kolme cTOH alueet, cTOH2, 4 ja 7 (vajaan 1p12, 3p24.2-3p24.1 ja 9p22.3, vastaavasti), on kertoimet suhteet (OR) = 1,75-2,06 (p = 0,007-0,001), joka osoittaa yliedustus näiden 3 cTOHs keuhkojen syövän tapauksissa kontrolleihin (taulukko 1 Taulukko S2, ja kuviot 3C ja 3D). Loput neljä cTOH alueilla, cTOH1, 3, 5 ja 6 (1p13.2, 2p16.3-2p16.1, 5p15.31 ja 6p22.3-22.2) on OR = 0,28-0,69 (p = +0,006-,001), joka osoittaa, että nämä cTOH n olivat aliedustettuina tapauksissa verrattuna kontrolleihin (taulukko 1, taulukko S2, ja kuviot 3A ja 3B).

Single-SNP yhdistys analyysi suoritettiin riippumatta TOH analyysin ja verrattiin. Merkittävä yhteenliittymien yhden SNP, ja kukin TOH kanssa keuhkosyöpää vastaan ​​kontrollit, ja niiden 95%: n luottamusväli (värillinen katkoviivat), on esitetty. Alla kukin alemman paneelit ovat kandidaattigeenifragmenttikloonien nimet (monivärinen), joka priorisoitiin jälkeen testaamalla yhteydestä keuhkosyövässä ja differentiaalikaavojen kunkin geenien ja +/- 250 kb TOH, stratifioituna tupakointi tila (p katso Methods kohta). A. cTOH3 /aTOH1 alue (2 p16.3-16.1; ruskea viiva) merkittävästi aliedustettuina keuhkosyöpää ja GWAS tunnistetut SNP (violetti pistettä) samalla alueella (yläpaneeli) omien vastaavien riskeistä kertoimet suhdeluvut (alempi paneeli). B. aTOH4 (7q21.11; ruskea viiva) merkittävästi aliedustettuina keuhkosyöpää ja GWAS tunnistetut SNP (violetti pistettä) alueella (yläpaneeli) ja niiden vastaavat keuhko-syövän riskejä kertoimet suhteet (OR; alapaneeli ).

merkittäviä keuhko syöpään liittyvän yhden SNP ja TOH n eli cTOH1, cTOH2, cTOH5, ja cTOH7, ja niiden 95%: n luottamusväli esitetään. Merkittävä keuhkosyöpä yhdistyksen aTOHs ja SNP alueella (yläpaneeli) ja vastaava riskin kertoimet suhdeluvut (alempi kuva) esitetään paneeleissa A-D. Alapuolella paneelit ovat kandidaattigeenit joka priorisoitiin jälkeen testaamalla yhteydestä keuhkosyövän ja ero ilmaisun kunkin geeneistä kunkin merkittävän TOH +/- 250 kb TOH, stratifioituna tupakointi tila (p 0,0001; katso Menetelmät jakso) .

Mielenkiintoista, vuorovaikutus tupakoinnista ja cTOH3 (rs733726~ rs4672095 [2p16.3-2p16.1]; taulukko 1) havaittiin (p 0,03, taulukko S3). Vaikka ikä- ja sukupuolihormoneja ja tupakointi-tila-oikaistu tai cTOH 3 on 0,69 (taulukko 1, kuva 2 A), cTOH3 on 2-kertainen (OR = 1,8) yliedustettuna savuton tapauksissa jopa savuton valvontaa , kun taas cTOH3 on merkittävästi aliedustettuina yhä tupakoinnin tapauksissa jopa alati tupakoinnin ehkäiseminen [OR 0,78 (edellinen tupakoitsijoita) ja 0,34 (tupakoijilla), vastaavasti, p = 0,009-0,026] (taulukko S3 B).

tunnistaminen Allelically-Vastaavat ryhmät (aTOH) sisällä cTOHs Lung-Cancer asiat ja säätimet

aTOHs voi tarjota geneettistä taustaa tai syntyperä liittyviä tietoja, joten biologinen mielekäs yhdessä keuhko-syöpä fenotyyppi. Lukumäärä aTOHs kussakin cTOH vaihtelee välillä 1 111. Olemme suorittaneet riippumattoman (of cTOHs tunnistettu) tapaus-verrokki analyysiä seurasi säätämisen vaikutukset iän, sukupuolen ja tupakointi keuhkojen syövän fenotyyppi. Tällä tavalla tunnistimme 5 aTOHs (vajaan 2p16.3-2p16.1, 3p25.3, 5q11.2-12.1, 7q21.11 ja 13q31.1-31.3), jotka ovat merkittävästi eri tavalla edustettuina tapausten ja kontrollien välillä (perustuen p 0,01, taulukko 2). Erityisesti vain aTOH1 OR 0,5 (taulukko 2), johdettiin vanhemman cTOH3 (2p16.3-16.1), jossa sekä cTOH3 ja aTOH1 merkittävästi aliedustettuina keuhko-syövistä kontrolleihin verrattuna (OR = 0,69 ja 0,5, p = 0,001 ja 0,005, vastaavasti, kuvio 2, taulukot 1 ja 2). Jäljellä aTOH alueet, aTOH2, 3, 4 ja 5 (sisällä 3p25.3, 5q11.2-12.1, 7q21.11 ja 13q31.1-31.3, vastaavasti) on OR = 3,97, 0,23, 2,95 ja 0,39, vastaavasti (p = +0,001-0,008; taulukko 2).

Toiminnallinen Perimän validointi integrointi Merkittävät cTOH ja aTOH alueiden kanssa Global transcriptome Tietoaineistot

ensi kääntyi huomiomme etsiä biologisesti uskottava geenien eli yksi tai osa kaikista geenien, sijaitsevat ja läheisyydessä (+/- 250 kb) merkittäviin c /aTOH ja jotka voivat olla germane keuhkosyövän riskiä. Sakottaa kartoittaa TOHs sisältävä keuhko-syöpään liittyvien geenien ja toiminnallisesti vahvistaa meidän genomista tietoa, me integroitu merkittävästä TOH alueille geenien ilmentyminen saatujen tietojen keuhkosyöpäpotilaita Eagle tutkimuksessa [27] (kuva 1). Tämä aineisto oli peräisin populaatiosta Euroopan syntyperä (valintakriteerit kuvattu Menetelmät jaksossa) sekä toiminut meidän toiminnallinen validointi sarjassa. Pystyimme suodattamaan geenien sisällä merkittäviä c /aTOH alueita 46 geenien perustuu ero ilmaisun yhden muuttujan analyysiin, yksin (kuviot 1 ja 4). Jatkamalla riskianalyysit ja integrointi tunnettujen elinspesifiseen toiminto ja signalointireitistä rooleja, päädyimme lopulliseen jatkoon 9 eniten uskottava keuhkosyövän riskin geenejä ja yksi ehdokas genomin alueella (p 0,0001, taulukko 3 ja kuva 1; katso keskustelu).

Bi-klusterointi suhteellisen geeniekspression (vaaka) luokitellaan ”LC (kasvain) + tupakointi” ja ”normaalit + tupakointi tila” (pystysuora). Hankinta, uudelleen standardointi ja yhdistäminen ilmaisun array tietojen TOH alueet yksityiskohtaisesti Menetelmät jaksossa. Punainen väri lämpöä kartta on suhteellinen yli-geenien ilmentymistä, sininen tarkoittaa suhteellinen ali-ilmaisun ja valkoinen ilman selkeää suhteellinen ilmaisulliset havaittu ero. Lämpö kartta edustaa ero ilmentymisen profiilit 47 geeniä, jotka valittiin jälkeen yhden muuttujan analyysin (katso Menetelmät yksityiskohdat osasta). Ilmaisu profiilit geenien alueella asuville ja läheisyyteen c /aTOH alueita, jotka liittyvät tupakoinnin erottavat keuhkosyövän normaalista keuhkokudoksesta.

erityisen tutki assosiaatiosta TOHs kätkeminen näiden 9 geenit ja tupakoinnista. Tähän liittyen 9 differentiaalisesti ilmentyvien geenien sisällä 6 cTOH /aTOH ovat germane yhä tupakoimattomilla verrattuna 3, jotka ovat germane sekä alati ja koskaan tupakoineet [(p 0,0001), taulukko 3]. Yksi tärkeä poikkeus on

SBTBN1

ja

RTN4

sisällä cTOH3 /aTOH1 (2p16.3-16.1), jossa yli-ilmentyminen tapahtuu lähes yksinomaan valvontaa suhteessa keuhkojen syövän tapauksissa riippumatta tupakointi tila (OR = 0,000 ja 0,08, p 0,0001, taulukko 3, kuviot 2A ja 4).

ACYP2

(OR = 0,08, p 0,0001), myös tässä TOH, on alle ilmaistaan ​​yhä tupakoitsijoilla liittyy pienentynyt keuhko-syövän riskin, mutta sen ero ilmaisua ei germane in koskaan tupakoimattomilla (Taulukko 3, kuviot 2A ja 4). Kaiken ainutlaatuinen ero ilmaisu allekirjoitusten havaittiin geenin ryhmien sisällä /cTOHs, kuten on esitetty taulukossa 3 ja kuviossa 4. Analyysi ilmentymisen profiilien geenien muiden aTOHs, esimerkiksi

CD36

in aTOH4 (7q21.11) , osoitti alle ilmentymistä tapauksissa keskuudessa koskaan tupakoineet (p 0,0001; taulukko 3 ja kuvio 2B).

Expression profiilit geenien sijaitsee muita merkittäviä cTOHs, cTOH1, 2, 5 ja 7 (1 p13 0,2, 1p12, 5p15.31 ja 9p22.3, vastaavasti, taulukko 1) analysoitiin.

OLFML3

(1p12, kuvio 3A), oli alle ilmaistu alati tupakoinnin tapauksissa verrattuna ei-tupakointi tapauksissa sopusoinnussa pienempi riski kuin näyttelee OR: n 1 (taulukko 3 ja kuva 4). Sen sijaan

WDR3

(on 1p12, kuvio 3B) osoitti merkittävää suhteellinen yli-ilmentyminen riippumatta tupakointistatus, sopusoinnussa TOH-asiaa OR 1 (taulukko 3 ja kuva 4).

FASTKD3

(päällä 5p15.31, kuvio 3C) osoitti merkittävää suhteellinen yli-ilmentyminen alati tupakoinnin keuhko-syöpätapausta verrattuna koskaan savuttomia tapauksissa yhdenmukaisia ​​TOH-asiaa OR 1 (taulukko 3 ja Kuvio 4).

PSIP1

(päällä 9p22.3, kuvio 3D) oli merkitsevästi alle ilmaistu sekä alati ja koskaan savuttomia tapauksissa OR 1 (taulukko 3 ja kuva 4). Yleensä havaitsimme, ainutlaatuinen ja niiden kaltaiset ilmaisullisella allekirjoitukset spesifisen geenin-sarjaa (taulukko 3, kuvio 4). Esimerkiksi havaitsimme netto alle-geenin ilmentymistä asetettiin cTOH3 vuonna keuhkosyöpää jotka ovat tupakoitsijoita (OR 1) [taulukko 3, kuvio 4].

Keskustelu

tunnistaminen riskitekijät, onko geneettinen tai ympäristöön, ja maligniteetteja, mukaan lukien keuhkosyöpä, on alku varhaisen diagnoosin, ja räätälöimällä tehostettu seuranta ja ennaltaehkäisy. Yhteinen variantti-yleisin syöpä hypoteesi vallalla viime vuosikymmenen johtaneet GWAS saadaan yhteinen SNP sisällä 15q25, 5p15, ja 6p21 liittyy keuhkosyövän [5] – [10], jonka osuus ~ 3% kaikista keuhkosyövässä. Joka perustuu työhypoteesi että muut genomista altistavia tekijöitä tai laskemalla keuhkosyövän riskiä on olemassa, teimme genomin laajuinen tapaus-verrokki-analyysi pitkään TOHs, joista kukin satamat yhdestä useita keuhko- syöpä-altistavia tai suojaava loci (eniten todennäköisesti on lievä tai kohtalainen penetrance). Havaitsimme 7 cTOHs ja 5 aTOHs jotka ovat merkittävästi yli- tai aliedustettuina keuhkosyöpää vastaan ​​kontrollit, säätämisen jälkeen ikä, sukupuoli ja tupakoinnista. Mielenkiintoista, löysimme erityisiä cTOH /aTOHs liittyvät tapaukset kontrolleihin riippumatta näistä covariates, muiden riippuvaisia ​​tupakoinnista.

Mikä tärkeintä, meidän merkitykselliset cTOH ja aTOH alueet ovat toiminnallisesti validoitu integroimalla ero spesifisten geenejä asuvat näitä kriittisiä välein, aiemmin osoitettu olevan ainakin somaattisen rooli satunnaista ihmisen keuhkojen karsinoomat, hiiren malleja ja /tai osallistua neoplasian liittyvän signalointireittien (taulukko S4). Uskomme, että agnostically etsivät cTOH ja aTOH ja sitten integroida ilme tiedot tehokkaita menetelmiä löytää, ja samalla toiminnallisesti genomisesti validointi, uusi keuhkosyövän riski alueita ja geenejä. Kolme edellinen keuhkosyöpä GWAS tutkimukset ovat tunnistaneet 5p15 alue liittyvän keuhkosyöpää [4] – [10]. cTOH5 sijoittuu 5p15.31 (meidän ”ehdokas genomin alueella” jälkeen integroiva analyysi) ja on 11-kertainen yliedustettuna alati tupakoinnin keuhkosyöpää ja 3-kertaisesti koskaan tupakoinnin keuhkosyöpää. Tämä toimii vahva positiivinen kontrolli. Olemme myös tunnistaneet uuden ehdokkaan geeni

FASTKD3

, pidemmälle kuin aiemmin oletettu, integroimalla ilmaisun merkittäviä TOH tällä alueella (taulukko S4).

Olemme löytäneet vain yhden TOH alue, jota merkittävä aTOH sijoittuu sen emo- cTOH: aTOH 1 (2p16.3-16.1) ja sen emoyhtiö cTOH3, jonka läsnäolo näyttää antavan suojaava vaikutus keuhkosyövän alati tupakoinnin tapauksissa (OR 0,7, eli yliedustettuna valvonta versus tapauksissa, taulukot 1 ja 2). Differential ilmaus ryhmä geenejä tällä alueella näyttää olevan yhtä suojaavan keuhkosyöpä riippumatta tupakoinnista tai historia (taulukko 3, kuvio 4). Esim

SPTBN1

koodaa beeta-spectrim joka on tärkeä merkitys alenevassa solun pinnalla rekrytointi CD45 ja CD3, ja kumotaan T-solujen toiminta [33]. Siten lisääntynyt

SPTBN1

ilmaisun (ja yliedustus aTOH1 /cTOH3 sisään valvonnan tapauksissa) voisi uskottavasti suojautua keuhkosyöpä lisäämällä immuunivalvonnan, koska me tiedämme, että tupakointi vaimentaa CD4 /CD8 T-solujen suhteen [34]. Vaikka on olemassa uskottava nykyisiä todisteita siitä, että ali-ilmentyminen geenien cTOH3 /aTOH1 (taulukko 3, taulukko S4, kuva 4) olisi suojaava eri mekanismien kautta [35], emme tiedä mitä tuntemattomien mekanismien johtaa edelleen lieventäminen tupakointiin liittyvä keuhko-syöpäriskiä. Toisin kuin muut geenit aTOH1 /cTOH3,

MTIF2

yli-ilmentyminen liittyy sen TOH differentiaalisesti liittyy tapausten ja kontrollien. MTIF2 on mitokondrio translaation aloituskohdasta tekijä, joka kumppanit RNaseL.

Vastaa