PLoS ONE A peräsuolen syövän Alttius New Variant klo 4q26 Espanjan määriteltyyn Genome-Wide Association Analysis

tiivistelmä

Background

Ei-perinnöllisen peräsuolen syöpä (CRC) on monimutkainen häiriö johtuvat yhdistelmä geneettisten ja ei-geneettiset tekijät. Genome-laajuinen yhdistys tutkimukset (GWAS) ovat käyttökelpoisia yksilöimiseksi geneettinen alttius tekijät. Kuitenkin yksittäinen loci toistaiseksi liittyy CRC edustavat vain murto-osa geneettinen riski CRC kehitys väestössä. Siksi monet muut geneettinen riski variantit yksinään ja yhdistelmänä on vielä löytäjäänsä. Tavoitteena työssä on ollut etsiä geneettisiä riskitekijöitä CRC, suorittamalla yhden lokuksen ja kahden lokus GWAS Espanjan väestöstä.

Tulokset

Yhteensä 801 valvontaa ja 500 CRC tapausta sisällytettiin löytö GWAS aineisto. 77 yhden emäksen monimuotoisuus (SNP) s kerta-lokuksesta ja 243 SNP kahdesta lokuksen yhdistys analyysit valittiin replikaatioon 423 ylimääräistä CRC tapauksissa ja 1382 tarkastuksia. Meta-analyysissä, yksi SNP, rs3987 on 4q26, saavutetaan GWAS merkittävä p-arvo (p = 4,02 x 10

-8), ja yksi SNP pari, rs1100508 CG ja rs8111948 AA, osoitti suuntaus kahden lokuksen yhdistys (p = 4,35 x 10

-11). Lisäksi meidän GWAS vahvisti aikaisemmin raportoidun yhteydessä CRC viiden SNP sijaitsee 3q36.2 (rs10936599), 8q24 (rs10505477), 8q24.21 (rs6983267), 11q13.4 (rs3824999) ja 14q22.2 (rs4444235).

Johtopäätökset

GWAS CRC potilaita Espanja vahvisti joidenkin aiemmin raportoitu yhdistysten CRC ja saatiin uusi ehdokas riski SNP, joka sijaitsee 4q26. Epistasia analyysit tuottivat useita uusia ehdokas alttius pareja, jotka on validoitu erillistä määritystä.

Citation: Real LM, Ruiz A Gayan J, González-Pérez A, Sáez ME, Ramírez-Lorca R, et ai . (2014) peräsuolen syövän Alttius New Variant klo 4q26 Espanjan määriteltyyn Genome-Wide Association Analysis. PLoS ONE 9 (6): e101178. doi: 10,1371 /journal.pone.0101178

Editor: Zongli Xu, National Institute of Environmental Health Sciences, Yhdysvallat

vastaanotettu: 11 huhtikuu 2014; Hyväksytty: 3 kesäkuu 2014; Julkaistu: 30 kesäkuu 2014

Copyright: © 2014 Real et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Data Saatavuus: Tällä kirjoittajat vahvistavat, että kaikki tiedot taustalla olevat havainnot ovat täysin saatavilla rajoituksetta. Kaikki tiedot sisältyvät paperin.

Rahoitus: Tämä työ oli osittain tukee CENIT ohjelma Centro Tecnológico Industrial (CEN-20091016), avustukset Espanjan Institute of Health Carlos III (ADE10 /00026, PI09 /02444, PI12 /00511, Acción Transversal de syöpä) avustusta Fondo de Investigacion Sanitaria /EAKR (08/1276, 08/0024, PS09 /02368, 11/00219, 11/00681), ja COST office kautta COST toiminta BM1206. SCB tukevat sopimuksia Fondo de Investigación Sanitaria (CP 03-0070). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: LMR, AR, AGP, MES, RRL, FJM, JV, RMF, JMC , CMR, EV ovat entisiä työntekijöitä Neocodex. JG on perustaja Bioinfosol. Tämä ei muuta tekijöiden noudattaminen PLoS One politiikkaa jakaa tietoja ja materiaaleja.

Johdanto

peräsuolen syöpä (CRC) edustaa maailmanlaajuisesti mitattuna taajuudella, kolmanneksi yleisin syy syövän -aiheiset kuolleisuus, ja toiseksi yleisin pahanlaatuinen sairaus Euroopassa [1]. Pieni osa potilaista on suvussa CRC, mikä viittaa joidenkin perinnöllinen osuus. Ituradan mutaatioita on tunnistettu syy perinnöllinen syöpäriskiä joillakin näistä CRC-altis perheet. Kaiken korkea penetrance mutaatiot arvioidaan olevan alle 5% CRC tapauksista [2]. Toisaalta, valtaosa potilaista, joilla CRC ei ole selkeää näyttöä siitä, että hän on perinyt häiriö ja ovat siten luokiteltu ”satunnaista” syöpä.

Sporadic CRC pidetään monimutkainen sairaus johtuvat perintöainesyhdistelmä ja ei-geneettisiä riskitekijöitä konsertti somaattisten geneettisiä ja epigeneettiset muutokset. Ei-Mendelin geneettiset riskitekijät ovat yleisiä alhaisen riskin variantit jaetaan koko genomin. Genomin laajuinen yhdistys tutkimukset (GWAS) lähestymistapa on hyödyllinen työkalu tunnistaa sellaiset variantit [3]. Tätä lähestymistapaa käyttäen noin 30 riskin geneettisiä variantteja liittyvä CRC herkkyys on raportoitu viime vuosina [4] – [15]. Tästä huolimatta, yhdistetty vaikutus Näiden varianttien kokonaan edustaa vain pientä osaa geneettinen riski CRC kehitys väestössä [16]. Tämä viittaa siihen, että monet muut riskin geneettisiä variantteja ovat vielä tunnistamatta.

yleensä GWAS eivät ole riittäneet paljastamaan kaikki geenien monimutkaisia ​​sairauksia ja, mikä tärkeintä, ne eivät ole olleet kovin hyödyllinen eristää erityisiä molekyyli väyliä, jotka liittyvät häiriöt tutkitaan [17]. Yksi syy voisi olla se, että yhden lokus lähestymistapa on tyypillisesti ainoa tapa soveltaa GWAS aineistoja, ja siinä ei oteta huomioon multigenic luonne suojattavan etiologiaa monimutkaisia ​​sairauksia. Siten uusien analyysimenetelmien joka auttaisi havaitsemaan tehokkaampia geneettisiä kytkentöjä yhdistelmän perusteella merkkiaineita ovat ehdottaneet meille ym [18] – [20]. Äskettäin kaksi ensimmäistä-lokuksen yhdistys tutkimus CRC on raportoitu [21]. Lisätutkimukset ovat selvästi tarpeen kattavampi käsitys geneettisen monimutkaisuuden CRC herkkyys eri ihmispopulaatioiden.

Tämän työn tarkoituksena oli etsiä geneettisiä riskitekijöitä CRC Espanjan väestöstä, suorittamalla uusi GWAS kerta-lokuksen ja kahden lokuksen geneettinen yhdistys analyysejä.

tulokset

Phase I CRC-GWAS analyysi

tunnistaa CRC riskin liittyvän SNP, suunnittelimme GWAS (NXC-GWAS), joka käsittää 801 tarkastuksia ja 500 tapausta tuskin tutkittu Espanjan väestöstä (NXC-GWAS näyte).

Kaikki SNP genotyypattiin käyttäen Affymetrix NSP I 250K siru. Sen jälkeen laadunvalvonta, 20 tapausta hylättiin (4 ristiriitainen sukupuoli, 8 eri etnisyys ja 8 alhainen näyte-kantaan). Lopuksi, 480 tapausta ja 801 valvontaa valittiin yhdistyksen analyysiä. Pääkomponenttianalyysin suoritettu keskuudessa tämä näyte ei havaittu populaation sekoitettuna (kuva S1). Ikä rekrytointi oli 58,0 ± 9,1 vuotta tapauksissa ja 51,9 ± 8,8 vuotta kontrolleissa (keskiarvo ± keskihajonta). Vastaava määrä (prosentteina) naisten näytteistä oli 278 (57,9%), ja 368 (45,9%), tässä järjestyksessä. Niistä 262264 SNP, joka voidaan genotyyppi tämän siru, 83334 ei läpäissyt laadunvalvontaa (52964 SNP hylättiin alhaisen pieniä alleelin taajuus (MMM), 2307 SNP epäonnistunut HWE, ja 28333 oli merkittävästi erilainen nopeus puuttuvien välillä tapauksen ja kontrolliryhmiin). Kaikkiaan 178.930 markkereita valittiin lopulta myöhemmin yhdistyksen analyysejä. Ei ollut yleistä inflaatiota testisuureen (genomista inflaatiotekijä = 1,10) (katso kuva S2), joka tarjoaa varmuuden siitä, että järjestelmällinen häiritsevien tekijöiden oli epätodennäköistä.

Käyttämällä Plink suoritimme yhden lokuksen geneettinen yhdistys analyysiin [22 ]. Yksi geneettinen merkki, rs10446758 kromosomi 4q31.23, saavutti GWAS-merkitsevä p-arvo (p = 1,73 x 10

-8), ja kaksi muuta markkereita, rs4887855 kromosomissa 16q23.1 ja rs7171889 kromosomissa 15q26.2, osoitti suuntaus yhdistyksen (p = 8,27 x 10

-8 ja p = 8,53 x 10

-8, vastaavasti) (kuvio 1) (taulukko S1).

sininen ja punainen vaakasuorat viivat vastaavat p-arvot 6,97 x 10

-4 ja 5 x 10

-8 vastaavasti.

Meillä on myös suoritettu kahden lokuksen analyysin avulla HFCC ohjelmistoa (katso Potilaat ja menetelmät jakso), yksinomaan SNP että läpäissyt laadunvalvontaa. Kaikkiaan 1,60 x 10

10 kahden lokuksen yhdistelmät saatiin lopulta. Levityksen jälkeen ohjaus suunta ja seuranta suodattimet, tämä ohjelmisto tuotti 5×10

5 kahden lokuksen kerrostumiin. Vaikka mikään niistä saavuttanut katkaista p-arvo vahvistettu 3,12 x 10

-12 joitakin paria saavutti arvot lähellä tätä kynnysarvoa (taulukko S2).

vaihe II. Validointi ja meta-analyysi

Voit testata paras geneettisiä kytkentöjä havaittu vaiheen, vaikka yhtäältä nämä SNP jotka kuuluivat johonkin parhaiten 157 kahden lokuksen signaaleja (taulukko S2) valittiin. Nämä parit osuus 276 yhden SNP koska 38 SNP oli läsnä enemmän kuin yksi pari. Toiseksi, 79 SNP kertakäyttöinjektiopullosta lokus analyysit valittiin mukaan yhdistyksen p-arvo on saatu vaiheessa I (p 6,9 x 10

-4) tai todennäköisyys onnistuneesti genotyyppi kanssa Veracode tekniikkaa. Siten yhteensä 355 SNP valittiin alun perin valmistamiseksi mittatilaustyönä taulukoita. Kuitenkin se oli vain mahdollista suunnitella oligonukleotidiin altaat 340 SNP (79 yhden lokuksen SNP ja 261 kahden lokus SNP).

Nämä geenimerkit genotyypattiin vuonna 423 eri tapauksissa ja 1448 erilaisia ​​tarkastuksia (NXC-VAL näyte ). Ikä rekrytointi oli 58,7 ± 7,3 vuotta tapauksissa ja 51,1 ± 12,9 kontrolleissa (keskiarvo ± keskihajonta). Vastaava määrä (prosentteina) naisten näytteistä oli 262 (61,8%), ja 920 (63,5%), tässä järjestyksessä. Kaksikymmentä SNP ei läpäissyt laadunvalvontaa (14 SNP: tä ei genotyyppi on yli 80% näytteistä, ja 6 SNP osoitti HWE p-arvo 0,001 kontrolleissa). Mitä näytteitä, 66 verrokit ulkopuolelle (31 henkilöä ei saavuttanut genotyypitysreaktioseosta puhelutaajuuden 80%, ja 35 yksilöt osoittivat jonkin sukulaisuusaste toisiinsa mukaan saatujen tietojen kanssa GRR ohjelmistot). Lopuksi 423 CRC tapauksissa ja 1382 tarkastuksia genotyypattiin 320 markkereita (77 single-lokuksen ja 243 kahden lokus valittu SNP) (taulukko S3). Taulukossa 1 on esitetty ne valitaan SNP jotka monistaa NXC-VAL näytteen (p 0,05 ja sama vaikutus suuntaan). Vain yksi SNP, rs3987 on 4q26, saavutti GWAS merkittävä p-arvo meta-analyysi (taulukko 2). Kiinnostavaa, neljä enemmän SNP samalla genomin alueella osoitti suuntaus assosiaatio GWAS-merkitsevä p-arvo (taulukko 2).

Mitä kaksi lokuksen analyysin, vain viisi paria validoitu vuonna vaihe II (p 0,05 ja sama vaikutus suuntaan). Vaikka mikään niistä saavuttanut GWAS merkittävää p-arvo (p 3,12 x 10

-12) meta-analyysissä (taulukko 3), SNP pari, rs1100508 CG ja rs8111948 AA, oli rajatapaus assosiointia (4,35 x 10

-11).

tulos validointi käyttäen muita aineistoja

Voit testata, onko tulokset voidaan toistaa toisessa Espanjan aineisto, käytimme tietoja Epicolon hanke [23] . Kuitenkin yksikään SNP, joka pidettiin merkittävinä tai ehdokkaiden vaiheen II Tämän tutkimuksen monistaa tällä Epicolon näytteessä.

saadut tulokset meidän GWAS (vaihe I ja II), ja ne on saatu Epicolon kohortin , yhdistettiin vaivaa nähdä maailmanlaajuinen vaikutus kaikkien SNP tarkastetaan vaiheessa II. Mikään SNP saavutti GWAS merkittävää p-arvo yhdistetyssä tutkimuksessa (taulukko S4). Taulukossa 4 esitetään parhaat tulokset on saatu tässä tutkimuksessa (valittu niistä, SNP: itä, joka esittää vaikutusta samaan suuntaan kaikissa kolmessa analysoitiin sarja. Katso yksityiskohdat, jotka on valittu SNP taulukossa S5).

osalta kaksi -locus HFCC analyysi ei SNP-paria osoittivat merkittävää ja yhtenäisesti (samaan suuntaan), kun 3 näytettä (NXC-GWAS, NXC-Val ja Epicolon) analysoitiin yhdessä.

analyysi SNP: iden aikaisemmin liittyvä CRC

Vain yksi aikaisemmalta SNP kanssa CRC riski onnistuneesti genotyypitetty meidän GWAS. Jotta voitaisiin kattaa suurempi määrä näistä SNP: me laskennallinen genotyyppien käyttäen CEU HapMap tietokannan ja Plink ohjelmisto. Sen jälkeen syytöksensä saimme yhteensä 1.371.009 SNP myöhempää analysointia varten. Kaikkiaan 16 aikaisemmin raportoitu CRC liittyvien SNP oli saatavissa aikaan analyysi (taulukko 5). Näistä viisi SNP sijaitsee 3q36.2 (rs10936599), 8q24 (rs10505477), 8q24.21 (rs6983267), 11q13.4 (rs3824999) ja 14q22.2 (rs4444235), osoitti nimellinen yhdessä CRC meidän GWAS, ja vaikutusten kanssa samaan suuntaan kuin aiemmin on raportoitu (taulukko 5). Kaksi SNP sijaitsee 8q23.3 (rs16892766) ja 12q13.13 (rs7136702) osoitti suuntaus nimellinen yhdessä CRC tutkimuksessamme, jälleen vaikutus samaan suuntaan kuin aikaisemmin raportoitu (taulukko 5).

Emme voineet testata hakijan SNP raportoimat Fernandez-Rozadilla

et al

. [23] niiden CRC-GWAS suoritetaan Espanjan väestöstä (Epicolon näyte), koska nämä ehdokkaat eivät kuulu tai menestyksellisesti genotyypitetty /laskennalliset Tutkimuksessamme.

Testasimme myös kahden lokuksen vuorovaikutukset rs1571218 (20p12 0,3) ja rs10879357 (12q21.1) aikaisemmin yhdistetty CRC [21]. Soveltamalla yleisesti suoraviivainen malleja emme noudata mitään todisteita niiden välinen vuorovaikutus meidän aineisto (tuloksia ei ole esitetty).

Keskustelu

Esitämme uuden kaksivaiheisen CRC-GWAS suoritetaan Espanjan väestöstä yhden lokuksen ja myös kahden lokuksen yhdistys käyttämällä HFCC ohjelmistojen [18]. Yksi merkki, rs3987 klo 4q26, saavutti yhdessä CRC herkkyys on GWAS merkittävää p-arvo. Lisäksi yksi SNP pari, rs1100508 CG rs8111948 AA (sijaitsevat 7q31.33 ja 19q12, vastaavasti), osoittivat myös suuntaus epistaattinen -alueella.

Huolimatta rajoituksista meidän GWAS – alhainen tiheys perimän kattavuus DNA-siru, ja maltillinen otoskoko – me toistettu 5 16 SNP aiemmin liittyy CRC. Lisäksi, suurin osa näistä 16 SNP meidän GWAS tutkimuksessa olivat samaan suuntaan kuin julkaistuissa raporteissa (taulukko 5). Lisäksi regressioanalyysi osoitti hyvää yksimielisiksi kertoimet suhdeluvut (kuva S3). Nämä tiedot yhdessä viittaavat siihen, että meidän tutkimus on linjassa aiemmin julkaistu CRC GWAS analyysejä.

Meidän kaksivaiheinen CRC-GWAS, yksi merkki, nimittäin rs3987 klo 4q26, näytteillä yhdessä CRC herkkyys on GWAS merkittävä p- arvo. Tämä SNP sijaitsee käytettäessä geenien välisen alueen 4q26 välillä

TRAM1L1

ja

NDST3 geenien

(~500 kb ja ~180 kb, vastaavasti). Useat tutkimukset ovat jo ehdottaneet syövän läsnäolon geenien 4q alueella [24], [25], ja se on myös raportoitu, että somaattisten deleetioita 4q26 ovat yleisiä CRC [26], [27]. Mielenkiintoista,

NDST4

geeni, joka sijaitsee myös 4q26, ja jotka kuuluvat samaan perheeseen kuin

NDST3

, on tunnistettu mahdolliseksi tuumorisuppressorigeeniä CRC [27].

kahden lokuksen analyysi paljasti, että yksi SNP paria, rs1100508 CG ja rs8111948 AA (sijaitsee 7q31.33 ja 19q12, vastaavasti), oli suuntaus -alueella. Nämä SNP ovat intergeenisessä alueilla sijaitsevat 7q31.33 ja 19q12. Lähinnä geenin rs1100508 on

GPR37

, jäsen G-proteiiniin kytketty reseptori perhe, joka tiedetään olevan vuorovaikutuksessa Parkin, vaikkakin sen tehtävä on vielä täysin tunnettu. Toisaalta, rs8111948 sijaitsee välillä

LINC00662

ja

LINC00906

(~500 kb ja ~600 kb, vastaavasti), kaksi lokusta kuuluvat pitkän ei-koodaavat RNA: ta (lncRNA) perhe . Jos yhdistys tämän SNP parin vahvistetaan, luonne että vuorovaikutus täytyy edelleen tunnettu.

Tutkimme myös merkkiaineita, jotka liittyvät CRC meidän kaksivaiheista GWAS riippumattomalla Spanish GWAS aineisto (Epicolon ), mutta yksikään näistä yhdistysten jäljitellä. Koska meidän GWAS voisi vahvistaa enemmän hyvin saavista CRC yhdistysten kuin Epicolon GWAS [23], katsomme, että ehdokkaat johdettu Tutkimuksemme syytä validoitu edelleen meta-analyysi mukaan lukien muut GWAS ja validointitutkimukset suoritetaan Espanjan väestöstä, tai hieman yleisempi valkoihoinen väestö.

mukaan GWAS katalogin NIH (https://www.genome.gov/26525384), ja aikaisemmat työt tästä aiheesta [5] – [15 ], kumpikaan liittyvät muunnelmat CRC raportoitu taulukossa 1 tai 2, eikä variantit sisältyvät SNP pareittain raportoitu taulukossa 3 (tai kytkentäepätasapainossa niiden kanssa) on aikaisemmin liittynyt CRC. Koska suurin osa näistä edellisen tutkimuksia ei ole erityisen suoritettiin Southern valkoihoinen väestö, tuloksemme voisi olla erityinen kyseiselle väestölle. Vaihtoehtoinen selitys olisi, että ne ovat vääriä positiivisia. Klusterointi useita SNP samaan 4q26, ja replikointi aiemmin raportoitu yhdistysten puolla tätä mahdollisuutta.

Vaikka tuloksia ei voida monistaa riippumattoman Epicolon näyte, toteutimme meta-analyysi, jossa otetaan tilille kolme näytettä analysoitiin tässä (NXC-GWAS, NXC-VAL, ja Epicolon). Mikään SNP, tai niiden yhdistelmiä, oli toistettu kolme näytettä, mutta paras signaalit käsittävät useita SNP kytkentäepätasapainossa at 9q31.1, sisällä tai lähellä

LINC00587

lokuksen (taulukko 4). Tämä geeni kuuluu myös lncRNA perheen mukana solujen erilaistumista ja lisääntymistä kuin posttranskriptionaalisella säätelijöitä liittämiseen tai molekyylitason houkutuslintuja varten miRNA [28], [29]. Ekspressiota lncRNAs on vapautettu monissa eri syövissä, mukaan lukien paksusuolen syöpä [30], ja jotkut tutkimukset viittaavat siihen, että rooli syövän aloittamista, etenemisen ja etäpesäkkeiden [31]. Yhdistyksen raportoitu aikaisemmissa GWAS välillä CRC alttius ja SNP sijaitsee 8q24 voisi johtua

PRNCR1

lokuksessa, eli lncRNA jäsen [32].

Mielenkiintoista, suuri osa SNP todettu liittyä CRC tutkimuksessamme tietojenkeruuvaiheessa (taulukot 1, 2 ja 4), valittiin kahden lokuksen analyysin. Tämä viittaa siihen, että sen lisäksi tunnistamaan epistaattinen vuorovaikutusta, meidän kahden lokuksen analyysimenetelmä (HFCC ohjelmisto) voidaan myös parantaa kaapata yksittäisen signaalit genomin liittyvät CRC alttiuteen erityisesti ja siten multigenic tauti yleensä. Tämä on houkutteleva hypoteesi, joka voidaan todistaa, jos jotkut näistä SNP validoidaan tulevissa tutkimuksissa. Toisaalta, tulokset meidän kahden lokuksen analyysit viittaavat siihen, että vuorovaikutus signaaleja ei ole voimakkaampi ennustearvo kuin yhden loci CRC alttius koska epäonnistumisen havaita SNP paria liittyy CRC at GWAS merkittävää p-arvo. Tämä havainto yhdessä puuttuminen tilastollisesti merkittäviä tuloksia globaalissa meta-analyysi, sekä puute replikaation ainoa SNP parin vuorovaikutuksen aikaisemmin raportoitu liittyvän CRC [21] viittaa siihen, että rooli geneettisten tekijöiden CRC alttiuteen saattaa olla monimutkainen, että luultu.

Yhteenvetona olemme tehneet CRC-GWAS Espanjan väestö on linjassa joidenkin aiemmin raportoitu yhdistysten ja tuotti uuden ehdokkaan SNP CRC alttius klo 4q26 että on validoitu tulevissa tutkimuksissa. Meidän kaksi-lokuksen tutkimuksessa esitetään myös korkean tason monimutkaisuutta geneettisten syöpäriskiä.

Materiaalit ja menetelmät

Potilaat

Oppiaineet I vaiheessa oli 801 ohjausobjektit Espanjan väestössä (joka on kuvattu aikaisemmin [33]) ja 500 tapausta diagnosoidaan CRC patologisen vahvistuksen (NXC-GWAS näyte). Vaiheessa II 1448 valvontaa ja 423 tapausta CRC käytettiin (NXC-VAL näyte). CRC kerättiin kahdessa eri Espanjan sairaaloissa (sairaala Universitario Virgen del Rocío Sevillassa ja Hospital Universitario 12 de Octubre Madrid) marraskuusta 2002 huhtikuussa 2008. kontrollinäytteistä sisältyvät vaiheen II kerättiin samana ajanjaksona useilla ensisijainen terveyskeskuksissa ympäri Espanja. Nämä näytteet on aikaisemmin käytettiin verrokkeina muissa yhdistys tutkimuksissa eri sairauksien Espanjan väestöstä [34]. Siksi yhteensä 923 CRC tapauksissa ja 2249 tarkastuksia Espanjan väestössä oli mukana tässä tutkimuksessa. Kaikki yksilöt kirjoilla oli valkoihoisia rekisteröity espanjalainen esivanhemmat (kaksi sukupolvea) kirjaamat kliinisen tutkijan.

Ethics lausunto

eettisiä komiteoita päässä Hospital Universitario Virgen del Rocío, Sevilla, ja Hospital Universitario 12 de octubre, Madrid, samoin kuin Neocodex hyväksyi tutkimuksen protokolla, joka oli kansallista lainsäädäntöä noudattaen ja suoritettiin eettisten ohjeiden sekä Helsingin julistuksen [35]. Kirjallinen suostumus saatiin kaikki yksilöt mukana tässä työssä.

Ulkoiset genotyypityksen aineisto

genotyypin tiedot valituista SNP muista GWAS suoritetaan Espanjan väestöstä (Epicolon kohortti) [23] käytettiin ohjenuorana saadut tulokset tässä. Erityisesti tämä kohortti koostui 882 tapauksissa ja 473 valvontaa todeta läpi Epicolon II projekti ja 194 lisätarkastuksia Espanjan National DNA pankkiin.

genotyypin

Perifeerisen veren kaikista tapauksista ja valvonta käytettiin eristää ituradan DNA leukosyyteistä. DNA: n uutto suoritettiin automaattisesti standardimenetelmien mukaisesti käyttäen Magnapure DNA eristäminen järjestelmä (Roche Diagnostics, Mannheim, Saksa).

genominlaajuisten genotyypin käytimme Afymetrix NspI- siru kuten aikaisemmin on kuvattu [33]. Genotyyppausanalyysiin valittujen SNP NXC-VAL näyte käytimme mukautettuja Golden Gate protokollia ja Veracode genotyypitysmääritys (Illumina, San Diego, Kalifornia USA) mukaan valmistajan ohjeiden.

Tietojen saatavuus

Association tulokset genotyyppi ja laskennalliset SNP tarjotaan pakattu Plink tiedostot (Dataset S1 ja Dataset S2). Tapauskohtaisesti genotyyppi olemassa tietoja pyynnön eettinen komitea on IMPPC (Instituto de Medicina Predictiva y Personalizada del syöpä) ehtojen mukaisesti perustettu Espanjan lain Biomedical Research (Ley 14/2007, de 3 de julio).

laadunvalvonta analysoi

näytteissä genotyyppi käyttäen Affymetrix alustan, suoritimme laajan laadunvalvonta käyttämällä Affymetrix genotyypin Console Software (https://www.affymetrix.com) ja Plink [22] . Vain yksilöiden näytteen puhelun ylitti 93% myöhemmin uudelleen kutsuttu kanssa Bayes Vankka Linear Model kanssa Malalanobis (BRLMM) etäisyys algoritmi, juoksi oletusparametrit. BRLLM parani puhelun hinnat useimmissa näytteissä. Itse ilmoitettu sukupuolen verrattiin sukupuolen määrittämä kromosomi X genotyyppiä, ja poikkeamia ratkaistiin tai näytteitä poistetaan. Ohjelma graafinen esitys Ihmissuhteet (GRR) [36] käytettiin tarkistaa näytteen sukulaisuuden ja korjaamaan mahdollisia näytteen virhemerkintöjen, päällekkäisyydet, tai saastumista. SNP valittiin toisen puhelun ylitti 95% (kussakin tapauksessa, ohjaus, ja yhdistetty ryhmä), ja pieni alleelin taajuus yli 1% (jälleen kussakin tapauksessa, ohjaus, ja yhdistetty ryhmä). SNP jotka poikkesivat selvästi peräisin Hardy-Weinberg tasapaino (HWE) (P-arvo 10

-4) kontrollinäytteissa poistettiin myös. Poistimme myös SNP jossa on huomattavasti erilainen nopeudella puuttuvien (P-arvo alle 5 x 10

-4) välillä tapaus ja kontrollinäytteiden.

Samoin SNP genotyyppi faasin II alistettiin laatua kontrollifiltterien. Niinpä nämä SNP joita ei onnistunut genotyyppi on vähintään 80% ihmisistä, ja ne, joilla on p-arvo Hardy-Weinberg tasapaino (HWE) alempi kuin 0,001 heitettiin pois. Lisäksi yksilöiden yli 10% puuttuvien genotyypin tietoja tai jotka osoittivat sukulaisuutta keskenään myös ulkopuolelle.

pääkomponenttianalyysi

Pääkomponenttianalyysi toteutettiin EIGENSOFT [37] , [38] arvioida väestön sekoittumisen meidän väestö, ja käyttää henkilöiden poikkeavat havainnot. Me juoksi SMARTPCA ohjelman oletusparametrit ilman kromosomin X markkereita ja käyttää riippumattomia SNP (pareittain r

2 0,1). Jotta minimoida kytkentäepätasapaino- analyysissä, pitkän kantaman kytkentäepätasapaino- alueilla aikaisemmin raportoitu [39] tai havaita Väestön myös ulkopuolelle. Yksilöt tunnistettu harha (kuusi keskihajonnat tai useamman pitkin yksi alkuun kymmenen pääkomponentit) poistettiin kaikki myöhemmät analyysit. Pääkomponenttianalyysin ajettiin yhdessä muiden HapMap Euroopan ja globaali väestö havaitsemaan henkilöitä eri etnisten ryhmien.

Yhden lokuksen yhdistys analyysi

Mukauttamaton yhden lokuksen alleelinen (1 vapausasteen, df) yhdistys analyysit tehtiin käyttämällä Plink ohjelmistojen [22], riippumattomasti kussakin ryhmässä aiheita vaiheen I tai vaiheen II. Meta-analyysi työkalu Plink käytettiin analysoimaan yhdistetyn tietoja eri aineistoja. Näissä tutkimuksissa kiinteiden vaikutusten malleissa käytettiin, kun mitään todisteita heterogeenisuus havaittiin. Muuten satunnaisvaikutusten malleja käytettiin. GWAS merkittävä p-arvo määritettiin 5 x 10

-8 [40]. Plink käytettiin myös arvioida genomisen inflaatiotekijä. Haploview ohjelmisto [41]: ssa käyttäen graafisesti GWAS yhden lokuksen analyysitulokset (Manhattan tontti). Konkordanssi havaitun vaikutuksen ja raportoitu vaikutus niille SNP aiemmin todettu liittyvän CRC analysoitiin lineaarisella regressiolla jälkeen logaritminen muutos kertoimet suhdeluvut.

Kahden lokuksen yhdistys analyysi

jonka tarkoituksena on havaita mahdolliset epistaattinen

loci

, selvitimme koko maailmankaikkeuden kahden lokuksen yhteisvaikutuksia (kaikki SNP x SNP vuorovaikutuksia) käyttäen Hypoteesi Free Clinical kloonaus (HFCC) ohjelmistoa kuten aiemmin on kuvattu [18]. Lyhyesti, I vaiheessa kolmessa eri replikointi ryhmää 160 tapausta ja 267 valvontaa luotiin. Jotta voidaan pitää alustava positiivinen tulos, chi-neliö (1 df) testi Raja-arvo asetettiin 6,64 (p 0,01) ja suunta vaikutuksen piti olla sama jokaisen replikointi ryhmää (mikä approksimoi p 1 x 10

-6 kaikkia kolmea replikointi ryhmissä).

tutkia luonteen ja vahvuus vuorovaikutuksen valittujen kahden lokuksen kuviot, me arvioida edelleen epistasia joukossa valittu merkkiaineiden avulla Alambique ohjelmisto [ ,,,0],18]. Erityisesti Alambique ohjelmoitiin mitata poikkeamat lisäaine malleista laskemalla Synergy indeksin, AP tai RERI tilastoja, kun taas lähtö useista mitattiin laskemalla kerrostumiin erityisiä kertoimet suhdeluvut ja tapauskohtaisesti ainoastaan ​​vuorovaikutuksen testi. Algoritmit sisältyvät Alambique ohjelmisto on aiemmin kuvattu muualla [42], [43].

aikana validointiprosessin, ne SNP valitsema HFCC että onnistuneesti genotyyppi on NXC-VAL näyte analysoitiin replikointi . Tässä tapauksessa kaksi ryhmää replikointi luotiin: NXC-GWAS näyte ja NXC-VAL näyte. Kun valittu paria tutkittiin myös vuonna Epicolon kohortissa, kolme ryhmää replikointi luotiin: NXC-GWAS, NXC-VAL ja Epicolon näyte.

Multiple-testaus korjausta sovellettiin näissä tutkimuksissa otetaan huomioon useita erilaisia ​​SNP-paria syntyy. Täten p-kynnysarvo perustettiin (p = 3,12 x 10

-12 (0,05 /kokonaismäärä SNP-parien syntyy vaiheen I aineisto).

Voit testata kahden lokuksen vuorovaikutus, joka on aikaisemmin liittynyt CRC alttiuteen [21], eli rs1571218 (20p12.3) ja rs10879357 (12q21.1), me mallinnettu vuorovaikutusta käyttäen lineaarista regressiota SPSS ohjelmisto 19,0 (IBM Corporation, Somers, NY, USA).

Imputoinnilla

laskennalliset genotyyppien käyttäen HapMap vaiheen 2 CEU perustajien (n = 60) apuna paneeli Plink [22]. genotyyppi puhelut laadukkaita tulokset (info 0,8) käytettiin myöhemmät yhdistys analyysit.

tukeminen Information

Kuva S1.

scatterplot kahden tärkeimmän ominaisvektorit saadaan Pääkomponenttianalyysin suoritettiin 801 valvontaa (vihreä ympyrä) ja 480 tapausta (sininen ympyrä) valittiin vaiheen I yhdistys tutkimus.

doi: 10,1371 /journal.pone.0101178.s001

(PDF) B Kuva S2.

rikvantiilin-rikvantiilin (QQ) käyrä todettua ja oletettua χ2 arvot saatu tutkimuksen yhdistyksen välillä SNP genotyypin ja peräsuolen syövän riskiä.

doi: 10,1371 /journal.pone.0101178.s002

(PDF) B Kuva S3.

Korrelaatio vaikutukset (OR) löytyy NXC-GWAS ja raportoitu vaikutuksia 16 SNP aiemmin todettu liittää CRC riski. Sininen viiva edustaa täydellistä korrelaatiota. Vihreä viiva osoittaa korrelaatio ilman outlayer rs16969681 (punainen ympyrä). Tämä SNP alun perin raportoitu UK2 GWAS kanssa OR = 1,247, joka saavutti GWAS merkittäviä jälkeen meta-analyysi muiden Pohjois-Euroopan GWAS mutta ei monistaa Epicolon GWAS Etelä-Euroopassa. Determinaatiokerroin (R2) ja p-arvo (Pearsonin P) korrelaatio on osoitettu. Unohtamatta rs16969681, determinaatiokertoimen ja p-arvo oli 0,28 ja 0,035, tässä järjestyksessä.

Doi: 10,1371 /journal.pone.0101178.s003

(PDF) B Taulukko S1.

Paras vaiheen tulokset saatiin Plink.

doi: 10,1371 /journal.pone.0101178.s004

(DOC) B Taulukko S2.

Best SNP × SNP vuorovaikutusten saatu HFCC ohjelmisto.

doi: 10,1371 /journal.pone.0101178.s005

(DOC) B Taulukko S3.

SNP sisältyvät vaiheen II ja meta-analyysin tuloksia.

doi: 10,1371 /journal.pone.0101178.s006

(DOC) B Taulukko S4.

SNP sisältyvät vaiheen II ja globaali meta-analyysin tuloksia.

doi: 10,1371 /journal.pone.0101178.s007

(DOC) B Taulukko S5.

Tiedot saaduista tuloksista kussakin näytteessä näistä SNP jotka osoittivat parhaat tulokset globaalissa meta-analyysi.

doi: 10,1371 /journal.pone.0101178.s008

(DOC) B Dataset S1.

Plink yhdistys tiedot genotyyppi SNP.

doi: 10,1371 /journal.pone.0101178.s009

(ZIP)

Dataset S2.

Plink yhdistys tiedot laskennalliset SNP.

doi: 10,1371 /journal.pone.0101178.s010

(ZIP) B

Kiitokset

Professori Manuel Serrano Rios, päätutkija of ”Proyecto Segovia”, mainitaan rekrytointiin henkilöille edustava Espanjan väestöstä kontrolliryhmän.

Vastaa