PLoS ONE: tunnistaminen Mahdolliset Regulatory Variant peräsuolen syövän riski Mapping kromosomiin 5q31.1: Post-GWAS Study

tiivistelmä

Laajamittainen genomin laajuinen yhdistys tutkimukset (GWAS) todenneet kromosomi 5q31.1 kuin alttius lokus peräsuolen syöpä (CRC), joka oli vielä puutetta syy geneettisiä variantteja. Haimme mahdollisesti sääntelyn yhden emäksen monimuotoisuus (SNP) on päällekkäisiä välisellä alueella kytkentäepätasapaino- (LD) lohko 5q31.1 ja säätelyelementtejä ennusti histonimodifikaation, testataan sitten niiden yhdessä CRC kautta tapauskontrollitutkimuksessa. Niistä kolme ehdokasta yhteistä variantteja, löysimme rs17716310 myönnetyn huomattavasti (heterotsygoottinen malli: OR = 1,273, 95%: n luottamusväli (95% CI) = 1,016-1,595,

P

= 0,036) ja marginaalisesti (hallitseva malli: OR = 1,238, 95% CI = 1,000-1,532,

P

= 0,050) lisäys riski CRC kiinalaisessa väestöstä lukien 695 tapausta ja 709 valvontaa. Tämä vaihtelu on ehdotettu olevan sääntelyn muuttamalla toimintaa edistäjän että valvonta

PITX1

ilme. Käyttämällä epigeneettisellä tietoja, kuten kromatiinin immunosaostuksella-sekvensointi (chip kohdat) data saattaa auttaa tutkijoita tulkitsemaan tuloksia GWAS ja paikantaa syy variantit sairauksiin jälkeisessä GWAS aikakauden.

Citation: Ke J, Lou J, Chen X, Li J, Liu C, Gong Y, et ai. (2015) Identification of a Potential Regulatory Variant peräsuolen syövän riski Mapping kromosomiin 5q31.1: Post-GWAS Study. PLoS ONE 10 (9): e0138478. doi: 10,1371 /journal.pone.0138478

Editor: Yifeng Zhou, Medical College of Soochow yliopisto, Kiina

vastaanotettu: 24 kesäkuu 2015; Hyväksytty: 29 elokuu 2015; Julkaistu: 18 syyskuu 2015

Copyright: © 2015 Ke et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään

Data Saatavuus: kaikki asiaankuuluvat tiedot kuuluvat paperin ja sen tukeminen Information tiedostoja.

Rahoittajat: National Natural Science Foundation of China (NSFC-81402744) JG. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Kiinassa, peräsuolen syöpä (CRC) on viidenneksi yleisin diagnosoitu syöpä miehillä ja kolmas naisilla, arviolta 310244 uutta tapausta ja 149722 kuolemista tapahtuu vuonna 2011 [1]. Riskitekijöitä CRC kuuluvat ruokavalio, liikunnan puute, ylipaino, tupakointi ja juominen [2, 3], ja se on hyvin vakiintunut, että geneettiset tekijät on myös tärkeä rooli etiologiassa CRC [4, 5]. Tähän mennessä genomin laajuinen yhdistys tutkimukset (GWAS) ja hieno kartoitus tutkijat ovat tunnistetun riskin variantteja kartoitus yli 30 riippumatonta alttius lokusten CRC eurooppalaiset ja aasialaiset [6-20]. Kuitenkin suurin osa näistä variantteja asuvat intergeenisessä ja introni alueilla, ja todennäköisin biologinen mekanismi, joka liittää ne tauti on sääntelyn [21].

Kertyvät näyttö osoittaa, että ei-koodaavan geneettisiä variantteja riskin liittyvän loci voisi käyttää vaikuttaa geenin ilmentymisen moduloimalla säätelyelementtejä [22], mukaan lukien promoottorit, tehostajat, eristimet ja äänenvaimentimet. Ja eri histonit reunustavasta nukleosomit tällaisten genomialueiden on havaittu kuljettaa ominaisuus translaation jälkeisiä modifikaatioita [23, 24]. Esimerkiksi promoottorit ovat yleensä merkitty H3K4me3 (histoni H3 trimetyloidaan lysiini 4) ja parantajia mukaan H3K4me1 (histoni H3 monometyloitu lysiinin 4), ja joko on lisäksi merkitty H3K27ac (histoni H3 asetyloitu lysiiniä 27) aktivoinnin yhteydessä [25- 28]. Nykyään genominlaajuisten kartoitus histonimodifikaation aikaan kromatiinin immunosaostuksella-sekvensointi (chip kohdat) on laajalti käytetty ennustamaan promoottoreita ja tehostajia [29-32].

5q31.1 ensin kartoitettu CRC alttius lokukseen Jia et al [17] sekä Itä-Aasian ja Euroopan populaatiot, tukee lisäksi toinen suurempi mittakaavan geneettinen tutkimus Zhang et al [20] Itä aasialaiset. Todennäköisimmin mukana geenin

PITX1

(pariksi kaltainen homeodomain 1) on pidetty kasvainsuppressorigeenin liittyvät karsinogeneesiin CRC [33, 34] ja muiden syöpien [33, 35-38]. Kuitenkin raportoitu vahvin riski polymorfismi rs647161 on epäselvä funktio eikä missään tiedetä puhtaaksi tai säätelysekvenssejä. Joten me perusteltu, että rs647161 ei ole syy yhden nukleotidin polymorfismi (SNP) ja todellisen toiminnallisen SNP vielä louhitaan tällä alueella. Samalla, tunnistetaan toiminnalliset SNP päällekkäiset kudosspesifisiä säätelyelementtejä ennustaa chromatin tilan kuten histonimodifikaation, edustanut tehokas lähestymistapa edetä tilastollinen yhteys toiminnallisuuteen ja syy jälkeisessä GWAS geneettinen tutkimuksia [39-42].

tässä tutkimuksessa kartoitettiin chip seuraavat tiedot histonien modifikaatiot Encode hanke [29], tutkitaan mahdollisesti sääntelyä variantteja sisällä alttius lokuksessa 5q31.1, ja tutkitaan ehdokas yhteinen SNP ”yhdessä CRC riski kautta tapaus-verrokki tutkimuksessa Kiinan väestön.

Materiaalit ja menetelmät

TET

yhteensä 695 CRC tapauksissa ja 709 syöpää vapaa tarkastuksia rekrytoitiin Tongji sairaalan Huazhong University of Science and Technology (HUST) vuosien 2008 ja 2011. Kaikki potilaat eivät liittyneet etnisten Han kiinalaisia ​​asuvat Wuhan ja sen lähialueilla. Sisällyttäminen kriteerit tapausta histopatologisesti vahvistettiin CRC ilman aiempaa kemoterapiaa tai sädehoitoa, ja mitään rajoituksia sukupuoli ja ikä. Kontrollit valittiin satunnaisesti lääkärintarkastuksesta ohjelmaa yhtä sairaalassa samana ajanjaksona kuin potilasta otettiin, joista osa oli myös mukana meidän läpäisevä tutkimuksissa [43, 44], ja ne asianmukaisesti sovitettu tapauksiin sukupuolen ja ikä (± 5 vuotta). Tässä tupakoitsijat määriteltiin ne, jotka oli polttanut vähintään yhden savukkeen päivässä 12 kuukautta tai kauemmin milloin tahansa elämässään, kun taas tupakoimattomien määriteltiin ne, jotka eivät olleet. Klo rekrytointi, 5 ml perifeeristä laskimoverta kerättiin kustakin aiheesta jälkeen kirjallinen suostumus saatiin. Tutkimus hyväksyi ethnics komitea Tongji sairaalan Huazhong tiede ja teknologia.

Valinta Candidate SNP

Candidate SNP tässä tutkimuksessa tunnistetaan yhteisiä (pienet alleelin frekvenssi, MMM 0.05) geneettisiä variantteja paikallistamiseen päällekkäisiä välisellä alueella 5q31.1 lokuksen ja CRC-säätelyelementit merkitty asianmukaisesti epigenetic markkaa. Ensinnäkin ladannut genotyyppi tiedot han-kiinalaisten Pekingissä, Kiinassa (CHB), joka oli 500 kb ylävirtaan ja alavirtaan tagSNP rs647161 alkaen HapMap tietokannasta, ja tulo, joka tiedot ohjelmiston HaploView saamiseksi kytkentäepätasapaino- (LD) lohko rs647161 kriteerien on

r

2

0,8, joka määriteltiin rajan GWAS lokuksen 5q31.1. Toiseksi, ostimme chip seuraavat tiedot eri histonimodifikaation valmistetaan kahdessa CRC solulinjoissa HCT116 ja Caco2 alkaen UCSC tietokannasta integroituminen koodaus data (S1 taulukko), sitten uutetaan laajuuden signaalinhuippuja seisomaan säätelyelementtejä, jossa leikkaavat kaksi replikointi versioita samasta datajoukon (risteys) ja yhdisti kaikki erilaiset tietokokonaisuudet (liitto). Kolmanneksi, sen pohjalta dbSNP tietokantaan, keräsimme SNP kanssa MAF 0,05 vuonna CHB, jotka sijaitsevat päällekkäisten välisellä alueella edellä mainitun LD lohkon ja huiput. Lopuksi kolme SNP: iden rs2193941, rs17716310 ja rs7703385 valittiin ehdokkaaksi SNP: seuraavan askeleen genotyypin.

Genotyypin

Genominen DNA uutettiin periferaalisen veren leukosyyteistä käyttäen RelaxGene Veri System DP319-02 (Tiangen, Peking, Kiina) viittaamalla valmistajan ohjeiden. Kaikki SNP genotyypattiin kanssa TaqMan SNP genotyypin määritys (Applied Biosystems, Foster City, CA, USA) on 7900HT Fast Real-Time PCR System (Applied Biosystems, Foster City, CA, USA). 5% monistaa näytteet valittiin sattumanvaraisesti uusittavuuden arvioimiseen laadunvalvontaa, joiden konkordanssin oli 100%.

Tilastollinen analyysi

t-testiä ja χ

2 testiä levitettiin Arvioimme erot ja jakaumat genotyyppien tapausten ja kontrollien välillä. Hardy-Weinberg tasapaino (HWE) arvioitiin soveltamalla hyvyys fit χ

2 testi kontrolleissa. Vahvuus yhdistyksen välillä jokaisen SNP ja CRC riski mitattiin kerroinsuhde (OR) ja sen vastaavan 95%: n luottamusväli (95% CI). Jotta vältettäisiin oletukseen geneettisten mallien, heterotsygoottinen, homotsygoottinen, hallitseva, resessiivinen ja lisäaine malleja analysoitiin. Tilastollinen testi teho kunkin SNP laskettiin POWER v3.0 (https://www.mds.qmw.ac.uk/stat-gen/dcurtis/software.html). Ja syrjäisimmät alueet ja vastaavat 95% CI, säätää sukupuolen, iän ja tupakoinnista laskettiin ehdoton monimuuttujatestauksen logistinen regressio. Tilastolliset analyysit tehtiin SPSS Software v20.0 (SPSS, Chicago, Illinois, USA). Mahdollinen geeni-ympäristö ja SNP-SNP vuorovaikutukset arvioitiin pareittaisesta analyysi alla multiplicative [45] ja lisäaine vuorovaikutuksen mallit [46].

P

arvot multiplicative vuorovaikutuksen laskettiin monikertaisesti vuorovaikutus voimassaoloaikaa monimuuttuja logistinen regressiomalli SPSS ohjelmistoja. Ja

P

arvot lisäaineen vuorovaikutusta arvioitiin bootstrapping testi hyvyys sovituksen käyttäen Stata v11.0 (Stata Corporation, College Station, TX). Kaikki

P

arvot olivat kaksipuolinen kanssa tilastollisen merkittävyyden kriteerit

P

0.05.

Tulokset

Valinta Candidate SNP

alue GWAS alttiuslokukset 5q31.1 määrittelimme LD oli kromosomi 5: 134467220-134518445. Jälkeen kolmivaiheinen bioinformatiikan analyysi, kolme yhteistä polymorfismit, rs2193941, rs17716310 ja rs7703385 että sijaitsevat huiput histonimodifikaation ChIP-Seq tuottaman tiedon HCT116 tai Caco2, löydettiin edellä loci (taulukko 1).

Väestön ominaispiirteet

695 tapahtumasta tapauksia ja 709 taajuus verrokit otettiin tässä tutkimuksessa. Kuten taulukosta 2, osuus miehillä oli 58.42% tapauksissa verrattuna 56.42% kontrolleissa (

P

= 0,449, Pearson χ

2 = 0,570). Keski-ikä ja vastaava keskihajonta oli 60,16 ± 12,26 vuotta tapauksista ja 59,80 ± 13,18 vuotta kontrollille (

P

= 0,598 t-testi), ja ei ollut tilastollisesti merkitseviä eroja tapausten ja kontrollien suhteen iän jakelu (

P

= 0,305, Pearson χ

2 = 3,625) kesken neljään luokkaan (≤50, 51-60, 61-70 ja ≥71). Kuten odotettua, enemmän tupakoitsijoita esiteltiin tapauksissa kuin kontrolleissa (35.25% vs. 29,62%;

P

= 0.022, Pearson χ

2 = 5,257), kun otetaan huomioon, että tupakointi oli vakiintunut riskitekijä CRC (2).

Association Analysis

Kaikki kolme SNP, rs2193941, rs17716310 ja rs7703385, olivat HWE (

P

HWE = 0,55, 0,17 ja 0,55), ja tilastollinen testi teho oli 95,9%, 95,3% ja 95,5% tässä järjestyksessä. Genotyyppi jakaumat tutkittu polymorfismien esitetty taulukossa 3. yhdistys analyysi, vain rs17716310 osoitti merkittävää yhteyttä CRC alle heterotsygoottianalyysiin malli, kun taas kaksi muuta SNP rs2193941 ja rs7703385 esittänyt mitään tilastollista näyttöä suhteessa CRC riskiä.

Under monimuuttuja logistinen regressiomalli oikaistu sukupuolen ja iän, yksilöiden AC genotyyppi rs17716310 oli huomattavasti lisääntynyt riski CRC (OR = 1,273, 95% CI = 1,016-1,595,

P

= 0,036 ) verrattuna niihin, joilla AA homotsygootti. Dominoiva malli suoritettiin parantaa tilastollinen voima yhdistämällä AC sertin osaksi C-operaattorin ryhmä (AC plus CC), ja se osoitti, että alleeli C: n kantajia sai marginaalinen vaikutus CRC alttiuteen (OR = 1,238, 95% CI = 1,000-1,532,

P

= 0,050). Kuitenkaan mitään merkittävää vaaraa variantin C-alleeli nähtiin homotsygoottinen, resessiivinen tai lisäaine mallin. Kuten rs2193941 ja rs7703385, ei ollut positiivisia tuloksia kaikissa geneettinen mallien olemme tutkineet.

Analyysi kytkentäepätasapainossa

kuviossa 1, kolmen tutkitun SNP olivat korkeat LD toisiinsa ( rs2193941 ja rs17716310,

r

2

= 0,89; rs17716310 ja rs7703385,

r

2

= 0,97; rs2193941 ja rs7703385,

r

2

= 0,90) tutkimuksessamme. Toisaalta, rs2193941, rs17716310 ja rs7703385 löydettiin olevan korkea LD kanssa tagSNP rs647161 (

r

2

= 0,83,

r

2

= 0,88,

r

2

= 0,88, vastaavasti) vuonna CHB väestö 1000 Genomes Project Vaihe 3.

Vuorovaikutusanalyysi

Taulukko 4 yksityiskohtaisesti tulokset vuorovaikutuksen analyysin välillä lupaavia SNP rs17716310 ja tupakointi, jossa havaittiin merkittävä vuorovaikutus (

P

mo = 0,013) in multiplikatiivinen ehdoin. Kun tutkimme pareittain vuorovaikutus kolme ehdokasta muunnelmia, ei havaittu olevan positiivista tuloksia alla sekä kertovien että lisäaine malli (S2 taulukko).

Keskustelu

jälkeisessä GWAS aikakauden tunnistaminen erityinen toiminnallinen geneettisiä variantteja, joka on todellisuudessa fenotyyppi on merkittävä tarkoitus ja haaste, ja säätelyelementit perimän voi auttaa. Käyttämällä epigeneettisellä merkkejä saatuja asiaan solutyypeistä, etsimme mahdollisesti toiminnallisia SNP jotka sijaitsivat oletetusti säätelyelementtejä, ja validoitu niiden yhdessä CRC itsenäisessä väestöstä.

Tässä tutkimuksessa yhdistämällä GWAS lokuksen 5q31.1 ja lupaava säätelyalueita ennusti histonimodifikaation CRC solulinjoissa, me seulotaan kolme yhteistä variantteja, rs2193941, rs17716310 ja rs7703385, niiden päällekkäisyyksiä. Sen jälkeen teimme yhdistyksen tutkimuksen kiinalaisessa väestöstä, joka sisältää 695 CRC tapauksissa ja 709 terveystarkastuksia, löysimme merkittävä ja marginaalinen vaikutus rs17716310, joka oli LD tagSNP rs647161 ja ehkä vuorovaikutuksessa tupakoinnin.

Havainnot led voimme olettaa rs17716310 vaikutteita CRC riskiä muuttamalla toimintaa säätelyelementtejä, jotka kontrolloivat

PITX1

ilme. Valehtelu sisällä genomin alueella näytteille chromatin muutoksia H3k4me1 ja H3k27ac, rs17716310 on erittäin suositeltavaa olla sääntelyn variantteja kuuluvat aktiivinen tehostaja [47, 48]. Se on noin 107 kb ylävirran puolella lähinnä geenin

PITX1

, joka on raportoitu tuumorisuppressorina vähen- tämisessä RAS reitti [33], aktivoimalla

TP53

[49] ja viritys telomeraasiaktiivisuuden [ ,,,0],50]. Lisäksi, pienempi

PITX1

ilmentyminen on löydetty ihmisen syövän kudosnäytteistä ja solulinjat [35-37], ja liittyy huono selviytymisen CRC potilailla [51]. Toisaalta, on online-tietokanta HaploReg [52], rs17716310 osoitettiin muuttaa sitovaan motiiviin p300, joka toimii transkription koaktivaattori ja histoni-asetyylitransferaasi geenin ilmentymisen säätelemiseksi remodeling kromatiinin [53]. Muunnos saattaa muuttaa sitoutumiskohta joidenkin transkriptiotekijä (t), ja vaikutus yhteisvaikutusta tämän aktiivinen edistäjä ja loppupään promoottori

PITX1

, negatiivisesti transkriptio ja ilmentäminen ehkäisevän geenin, ja näin ollen helpottaa CRC tuumorigeenisyyteen ja herkkyys. Mitä vuorovaikutusta tupakoinnin löytyy multiplikatiivinen malli, se saattaa johtua siitä, että suhteita savu tila ja RAS koulutusjakson,

TP53

ja telomeraasiaktiivisuuteen [54-57], jossa

PITX1

oli mukana. Kuitenkin oletus on vielä toiminnallisia kokeita voidaan varmentaa.

soveltaminen epigenetic biofeature tietoja, kuten histonimodifikaation chip seuraavat tiedot kartoittaakseen parantajia ovat edustettuina hyödyllinen väline tunnistaa ehdokas toiminnallinen SNP säätelyalueita [ ,,,0],58, 59], ja tietokantoja, kuten UCSC ja Encode ovat tarjonneet helpon pääsyn suuria määriä merkityksellisiä tietoja. Integrointi hiljattain syntynyt epigentics ja perinteinen molekyyliepidemiologiset voisi olla tehokas tapa auttaa tulkitsemaan GWAS resluts ja löytää syy variantit sairauksiin jälkeisessä GWAS tutkimuksia. Hakeminen samanlainen strategia muille CRC GWAS alueiden olisi auttaa ymmärtämään paremmin CRC riskin.

Silti useita rajoituksia olisi tunnustettava täällä. Ensinnäkin strategia hakemalla ehdokas polymorfismien riippui ennuste siru-seuraavien tietojen kahden CRC solulinjoista, joka ei ollut riittävän tiukasti määritellä tarkkaa säätelyelementtejä ja ole riittävän kattava löytää kaikki toiminnalliset SNP sisällä. Toiseksi, otoskoko meidän tapauskontrollitutkimuksessa oli suhteellisen pieni. Kolmanneksi, riittämätön ympäristö- ja kliiniset tiedot rajoitettu meidät tutkimaan tarkemmin vuorovaikutukset geeni ja muista tekijöistä. Forth, puuttuvat toiminnallisten kokeiden biologinen todellisuus alla tilastollisesti merkitsevä assosiaatio raportoimme on epävarmaa.

Yhteenvetona huomasimme todennäköisesti sääntelyn SNP korkean LD kanssa GWAS tagSNP joka liittyy CRC riskin Kiinan väestön . Systemaattinen tutkimukset enemmän alttiuslokukset enemmän otoskokoja ja seuranta funktionaalisia analyysejä perusteltua tunnistaa syy-variantteja ja kehittää biologinen mekanismi geneettisen etiologian.

tukeminen Information

S1 Taulukko. ChIP-seq aineistoja ladatut UCSC integroimalla Encode tiedot.

Doi: 10,1371 /journal.pone.0138478.s001

(DOC)

S2 Taulukko. Vuorovaikutus analyysi välillä rs17716310 ja rs2193941, rs17716310 ja rs7703385, rs2193941 ja rs7703385.

Doi: 10,1371 /journal.pone.0138478.s002

(DOCX) B

Vastaa