PLoS ONE: Association between DNA Damage Response ja korjaus Geenit ja vaara invasiivisen seroosit Munasarjojen Cancer

tiivistelmä

Background

Analysoimme yhdistyksen välillä 53 liittyvistä geeneistä DNA korjaukseen ja p53-välitteisen vahinkoa vasteen ja serous munasarjasyöpä riskiä käyttämällä tapaus-verrokki tietoja North Carolina munasarjasyöpä Study (NCOCS), väestöpohjaisen, tapauskontrollitutkimuksessa.

Methods /Principal havainnot

analyysi rajoitettiin 364 invasiivisen serous munasarjasyöpä tapauksissa ja 761 valvontaa valkoinen, ei-latinalaisamerikkalainen rotu. Tilastollinen analyysi oli kaksi lavastettu: näytön avulla marginaalinen Bayes tekijät (BFS) varten 484 SNP ja mallinnus vaiheessa, jossa laskimme monimuuttuja mukautetaan posterior todennäköisyydet yhdistyksen 77 SNP että läpäissyt näyttö. Nämä todennäköisyydet olivat ehtona aiheesta ikä diagnoosin /haastattelussa, erä, DNA laatumitta ja genotyyppejä muiden SNP ja mahdollisti epävarmuuden geneettisen parametrisointien SNP ja määrä liittyvien SNP. Kuusi SNP oli Bayes tekijät yli 10 hyväksi yhdistyksen kanssa invasiivisen vakavasta munasarjasyöpä. Näihin sisältyvät rs5762746 (mediaani OR (riskisuhde)

per alleeli = 0,66; 95% luotettava välein (CI) = 0,44-1,00) ja rs6005835 (

mediaani

OR

per alleeli

= 0,69; 95% CI = 0,53-0,91

) in

CHEK2

, rs2078486 (mediaani OR

per alleeli = 1,65; 95% CI = 1,21-2,25) ja rs12951053 (mediaani OR

per alleeli = 1,65; 95% CI = 1,20-2,26) in

TP53

, rs411697 (mediaani OR

harvinainen homotsygoottinen = 0,53; 95% CI = 0,35-0,79) in

BACH1

ja rs10131 (

mediaani OR

harvinainen homotsygoottinen =

ei arvioitavissa) in

LIG4

. Kuusi eniten liittyvien SNP joko ennustetaan olevan toiminnallisesti merkittäviä tai ovat LD tällaisen variantin. Varianttien TP53 vahvistettiin liittyvän suuressa seurantatutkimuksessa.

Johtopäätökset /merkitys

Perustuu havaintojen seurantatesteissä DNA korjaukseen ja vasteen reiteistä suurempi aineisto on aiheellista vahvistaa nämä tulokset.

Citation: Schildkraut JM, Iversen ES, Wilson MA, Clyde MA, Moorman PG, Palmieri RT, et al. (2010) välisestä assosiaatiosta DNA Damage Response ja korjaus Geenit ja vaara invasiivisen seroosit munasarjasyöpä. PLoS ONE 5 (4): e10061. doi: 10,1371 /journal.pone.0010061

Editor: Marie-Pierre Dubé, Universite de Montreal, Canada

vastaanotettu: 02 joulukuu 2009; Hyväksytty 5 maaliskuuta 2010 Julkaistu: 08 huhtikuu 2010

Copyright: © 2010 Schildkraut et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä käsikirjoitus tukivat avustuksia National Institutes of Health 1-R01-CA76016 ja 1-R01-HL090559. Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistelu manuscipt.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Munasarjasyöpä on johtava kuolinsyy keskuudessa gynekologiset syövät [1]. Erittäin tappava serous histologinen tyyppi käsittää noin kaksi kolmasosaa tapauksista ja aiheuttaa suurimman sairauteen liittyvät kuolemat. Lisääntymiseen liittyvien tekijöiden kuten korkea pariteetti, ehkäisytablettien käyttö, imetys, kohdun, ja munanjohtimen sitomiseen suojautua munasarjasyöpä [2], kun taas hedelmättömyys ja endometrioosin nousu riski [3], [4]. Biologisten mekanismien taustalla olevat riskitekijät eivät ole hyvin ymmärretty, mutta tulehdukseen liittyvä oksidatiivista stressiä on ehdotettu yhdistävänä teorian näiden riskitekijöiden voivat aiheuttaa genomista vahinkoa johtaa syövän kehittymiseen [5], [6], [ ,,,0],7], [8], [9]. Jos tämä teoria on oikea, on todennäköistä, että riski munasarjasyöpä muutettaisiin yhteisellä geneettisiä variantteja, jotka vaikuttavat tehoon DNA korjaus geenit [10], [11].

Useat tekijät osoittavat, että DNA korjaus väyliä tärkeä rooli munasarjan syövän synnyn. Ensinnäkin, kaikki korkean penetraation munasarjasyöpä alttiusgeenit jotka on tunnistettu tähän mennessä rooli DNA: n korjaukseen. Tässä suhteessa vahingollisia mutaatioita

BRCA1

ja

BRCA2

geenit vähentävät korjaamiseen kaksijuosteisen DNA taukoja. Lisäksi ituradan mutaatioita DNA mismatch korjaus geenejä, jotka aiheuttavat perinnölliset polypoottinen Colon Cancer (HNPCC) syndrooma myös silmiinpistävän lisätä munasarjasyövän riskiä [12], [13]. Toiseksi, somaattiset mutaatiot

TP53

geeni ovat yleisimmin hankittu molekyylitason muutoksia kuvattu tähän mennessä korkealaatuista serous munasarjasyöpiä [14], [15], [16].

TP53

on mukana kunnossapidon perimän koskemattomuuden useiden mekanismien kautta kuten solusyklin pysähtymisen vasteena DNA-vauriolle, DNA: n korjaukseen ja apoptoosin säätelyyn.

Edellä havainnot johti meidät oletuksen, että yhteinen polymorfismien liittyvien geenien DNA vaste ja korjauksen tai p53-DNA-vaurioita tarkastuspiste saattaa lisätä munasarjasyövän riskiä. Olemme keskittyneet 477 koodaus yhden emäksen monimuotoisuus (SNP) ja seitsemän ylimääräistä aminohappoa muuttamalla SNP 53 geenien DNA-vaurioita vastaus ja korjaus polkuja. Käytimme Bayes hakustrategia kutsutaan Monitasoinen päättely SNP Association (MISA) [17] analysoimaan näitä SNP todisteita yhteydessä munasarjasyöpään tietojen avulla väestöpohjainen North Carolina munasarjasyöpä Study (NCOCS).

Bayesin menetelmät ovat tulossa paljon yleisempiä valinta analyysia geneettisten assosiaatiotutkimuksiin ([18] ja siinä olevat viitteet). Tämä johtuu useista tekijöistä, kuten useita keskeisiä etuja Bayes paradigma on yli frekventistisessä paradigma ja parempi saatavuus varten suunniteltuja ohjelmistoja Bayesian analyysi geneettisten yhdistyksen tietoja, kuten MISAN paketti käyttää tässä. Avain puute on testaus frekventistisessä paradigma on sen jättäminen yksiselitteisesti huomioon todennäköisyys yhdistyksen johtuvia vaihtoehtoinen hypoteesi, eli osuus on valtaa – tiedot, jotka tuottavat pienen p-arvo alle nolla voi myös olla erittäin epätodennäköistä alla vaihtoehtoinen hypoteesi [18]. Sen sijaan Bayesin menetelmät tarjoavat toimet yhdistymisvapautta – Bayes tekijät (BFS) ja posterior todennäköisyydet – että nimenomaan selittää todennäköisyys tietojen mukaan kilpailevia hypoteeseja. Tämä osuu lisäkuluja oletuksista; nimittäin, määrittely ennalta todennäköisyydet jokaiselle hypoteesin ja ennen jakaumia yli mallin parametrien edellytyksenä hypoteeseja.

MISA [17] parantaa entisestään SNP-at-a-aika (marginaalinen) menetelmät mallintamalla fenotyypin funktiona monimuuttuja geneettinen profiili ja sen seurauksena, säädetään toimenpiteistä yhdistymisvapaus oikaistu jäljellä markkereita. MISA työllistää Bayes Malli Keskiarvon [19], [20] tilille epävarmuuden selityksessä todellisen mallin yhdistymis-, mikä portaittain logistinen regressio ja muita mallinvalintaan lähestymistapoja kuten suopungin eivät tee. Tällä on merkittävä vaikutus: menetelmiä, jotka tunnistavat yhden mallin voi menettää tärkeitä SNP vuoksi LD rakenteeseen. Lisäksi MISAN tarjoaa yhteenvedot, missä määrin tiedot tukevat yhdistyksen tasolla yksittäisten varianttien, geenien ja reitit samalla sallien päättely koskien geneettinen parametrisointi (log-lisäaine, hallitseva tai resessiivinen) kunkin SNP. Priorijakauma palveluksessa MISAN oli huolellisesti valittu moninaisuus korjauksen se aiheuttaa.

Materiaalit ja menetelmät

Tutkittavat

Kotelot ja kontrollit osallistujien NCOCS, toteutettiin 48-läänin alueella Pohjois-Carolinassa. Yksityiskohtainen kuvaus Tutkimus on julkaistu aiemmin [2], [21]. Lyhyesti, tapauksessa havaittiin läpi North Carolina Central Syöpärekisteri käyttäen nopeaa tapauksessa toteaminen. Hyväksyttävät tapauksissa aged 20-74, oli diagnosoitu epiteelin munasarjasyöpä vuosien 1999 ja 2007 histologisen dioja saatiin ja kaikissa tapauksissa tehtiin standardoituja histopatologisten tarkastelun tutkimuksessa patologi (RCB) vahvistaa diagnoosin. Vastausprosentti oikeutettuja tapauksissa oli 70%. Löysimme pieni ero demografiset ja kliiniset ominaisuudet joukossa tapauksia, jotka osallistuivat tähän tutkimukseen verrattuna niihin, jotka laskivat. Ohjaus naiset tunnistettiin samalta alueelta käyttämällä satunnaisia ​​numeron numerot ja olivat taajuus sovitetaan tapauksissa iän (viiden vuoden ryhmät) ja rodun (musta tai ei-musta). Seitsemänkymmentä kolme prosenttia mahdollisten tarkastusten joka läpäisi kelpoisuus seulonta suostui lähetetään lisäselvityksen tietoa. Niistä lähetetään tutkimuksen tiedot, vastausprosentti oli 64 prosenttia. Vaikka valvonta vastausprosentti on hieman alhainen, tämä ei ole vaikuttanut yhdistysten vakiintuneiden epidemiologiset riskitekijät [2], [21]. Lisäksi on epätodennäköistä, että osallistuminen olisi vaikuttanut genotyypin. Protokolla hyväksyttiin Duke University Medical Center Institutional Review Board ja ihmisillä valiokuntien Keski Syöpärekisterissä ja jokainen sairaalassa, jossa tapauksessa havaittiin.

rajoitettu nykyisen analyysien valkoinen, ei-latinalaisamerikkalainen invasiivisia serous munasarjasyöpä tapauksissa (n = 364) ja valkoinen ei-latinalaisamerikkalainen ohjaimet (n = 761), jossa genotyyppitietoja kokouksen laadunvalvonnan vaatimukset. Osallistujat otettiin verinäytteet aikana in-henkilö haastattelussa tutkimuksen sairaanhoitaja. Ituradan DNA eristettiin ääreisveren lymfosyyteistä käyttämällä Puregene DNA eristys reagenssit, mukaan valmistajan ohjeiden (Gentra Systems, Minneapolis, MN).

genotyypitysmenetelmiä

Valitsimme laajan ryhmän ehdokas geenien DNA korjaukseen ja vastaus väyliä (taulukko S1), joka todennäköisesti vuorovaikutuksessa

BRCA1

tai

BRCA2

tai ovat mukana kaksinkertainen lohkon murtuma, yhteensopimattomuuden korjauksen, nukleotidin Leikkauskorjauksessa, tai emäksen Leikkauskorjauksessa. Me tagged nämä 53 kandidaattigeenit vapautuspainikkeella 19 Kansainvälisen HapMap Projektin (www.hapmap.org) [22] CEU perustaja väestö ja ldSelect ohjelma [23]. Me koodattu alue alkaa 10000 emäsparia ylävirtaan ja päättyen 10000 emäsparia alavirtaan kustakin geenistä siten, että siinä koodaus, ei-koodaus ja säätelyalueita. ldSelect tunnistettu astiat SNP: iden vähäisin alleelin taajuus (MAF) ≥0.05 käyttäen pareittaisesta kytkentäepätasapaino- (LD) kynnys

r

2≥0.8. Päätimme genotyypin kaksi tageja siiloissa jossa kaikki SNP oli alhainen Illumina suunnittelun tulokset parantaa odotettavissa kattavuutta. Analyyseja varten, me säilytti tunnisteen tarkempi genotyyppi puheluja mitattuna puhelutaajuus yksimielisiksi ja korko CEPH trios. Niistä 671 koodaus SNP genotyyppi, 61 olivat nonsynonymous; ylimääräinen 14 ei-koodaus aminohappo muuttuu SNP myös genotyyppi kun tunnistetta, joka valittiin myös nonsynonymous. Kaikki nonsynonymous SNP jotka täyttivät kriteerit Illumina Golden Gate määritykset mukana. Näytteet genotyypattiin käyttäen Illumina Golden Gate Pitoisuus ™ at Duke Institute for Genome Sciences ja Policy (IGSP), jossa tapausten ja kontrollien satunnaisesti sekoitettu kullekin 21 levyjen. Kuusi CEPH-Utah trios (Coriell Institute, Camden, N.J.) jaettiin kuudella levyt. Levyt käsiteltiin neljässä erissä genotyypin laitokseen. SNP, jota ei voitu kutsua käyttäen Illumina BeadStudio ohjelmiston enemmän kuin 1% näytteitä erän käsiteltiin puuttuu erän. Käytimme regressioanalyysimme onko erän ja DNA laadun mittareita liittyi tapaus-verrokki tila.

arvioitiin tarkkuus geneettisten tietojen avulla SNP- ja aihekohtaisia ​​laadunvalvonnan analyysejä. Ensin poistetaan kaikki järjestön analyysit SNP yhden tai useamman CEPH genotyyppien eri mieltä niiden julkaistun arvoihin, eli ne, jotka oli arviolta virheprosentti on suurempi tai yhtä suuri kuin 1/18 olettaen julkaistut genotyypit ovat oikein. Toiseksi, käytimme X2 hyvyyttä testi jatkuvuutta korjaus 0,25 testata lähtöjä Hardy-Weinberg-Equilibrium (HWE) kontrollien joukossa [24] ja joukossa 60 CEPH vanhemmat käyttävät julkaistu genotyypit on loci kiinnostava. Poistimme osajoukko näytteiden pohjalta analyysin vasemman hännän jakelun p-arvojen HWE. Tämä alaryhmä osuus oli Illumina GenCall 50. prosenttipiste pisteet (GC50PCT) kunkin näytteen ja käytettiin vastaavaa jakelun arviointiin HapMap CEPH näytteiden vertailuun. Raportoitu arvioiden vähäinen alleelin taajuus (MAF) ovat vähintään havaitun alleelifrekvenssien kontrollien joukossa.

Kaksikymmentäkaksi on 685 DNA: n korjaukseen SNP kokeeseen oli puhelun hinnat alle 99% kaikilla neljällä erissä ja olivat poistetaan myöhemmin huomioon. Kolmekymmentäseitsemän jäljellä 663 SNP oli alle 95% yhteneväinen CEPH näytteiden välillä genotyypin puheluiden ja julkaisemia HapMap ja poistettiin myöhemmin huomioon. Jääneen, 484 eivät olleet tarpeettomia ja mukana kaikissa myöhemmissä analyyseissä. QQ juoni HWE p-arvo jakautuminen nämä SNP käyttäen kaikkia 787 valkoisella ei-latinalaisamerikkalainen tarkastukset osoittivat todisteita ylitarjonta pienten p-arvojen suhteen, mitä on odotettavissa olevan tasaisuus. Vastaava juoni perustuu HapMap genotyypin 60 CEPH vanhemmat eivät ole tätä ominaisuutta.

määrä SNP kanssa HWE p-arvo alle 0,01 lasketaan kaikki 787 valkoisella ei-latinalaisamerikkalainen valvonta oli 17; käyttäen HapMap näyte, se oli 5. Olettaen p-arvot ovat riippumattomia ja tasaisesti jakautunut odotettu määrä alle 0,01 on 4,84, 2,5

persentiilin tämän jakelun on 1 ja 97,5

persentiili on 10 .

Tämä viittaa siihen, että sen sijaan ottaa asukasluku geneettinen selitys, tämä lähtö johtuu todennäköisesti genotyypitys virheitä. Tämän varmistamiseksi meidän pitää poistaa näytteet, joiden Illumina GC50PCT pienempi kuin kynnys on suurempi kuin tavanomaiset 0,7. Me kasvatettu kynnys korkeintaan 0,8 ja totesi, että jakelun HWE p-arvot dramaattisesti parantunut kynnys 0,789. Tämä valinta jätetään 364 (390) tapauksessa ja 761 valvontaa. Käyttämällä tätä kynnys oli 9 SNP kanssa HWE p-arvo alle 0,01. Kaikki ylimääräiset analyysit tehtiin käyttämällä näitä näytteitä ja niiden genotyyppi tietoja 484 ei-tarpeeton SNP kulkee laadunvalvonta analyysi.

tilastolliset menetelmät

MISA Analysis.

Käytimme MISA tunnistaa todennäköisesti yhdistysten ja geneettisen parametrisointien liittyvien SNP. MISA toteuttaa mallin haku yli logistista regressiomallia tapaus-verrokki asema annetaan SNP muuttujat ja joukko suunnittelu ja mahdollisten sekoittavien muuttujia. Nykyisessä analyysien, ikä diagnoosin /haastattelussa, erä, DNA laatumitta GC50PCT, ja vuorovaikutus termien erän ja GC50PCT ovat ”suunnittelu” muuttujia kaikissa malleissa. Viittaamme malliin vain suunnittelun muuttujat mallia ”geneettistä yhdistys,” tai ”nolla” malli lyhyitä. Se iswhere D

i on indikaattori siitä aihe

i

on tapaus, M on mallitunniste, α

0 on siepata, Z

i on vektori suunnittelun muuttujien sillä aihe

i

, ja β

0 on vektori kertoimien muuttujien Z

i alla null mallia. Lisäämällä tärkein vaikutuksia tahansa yhdistelmä SNP on nolla malli määritellä sellainen yhdistys. MISA sallii kunkin mukana SNP on log-lisäainetta, hallitseva tai resessiivinen parametrointi. MISA käyttää evoluution Monte Carlo algoritmi näyte malleja tässä luokassa niiden posterior todennäköisyydet. Tämä stokastinen Haku suoritetaan sijasta luettelemalla mallit huomioon niiden valtava määrä.

Koska tähtitieteellinen määrä tilastollisia malleja edellä lomakkeen, MISAN sisältää salliva yhden SNP-at -aika (marginaalinen) Bayes Factor (BF) -näytöstä koko joukko ei-tarpeeton SNP poistaa SNP todennäköisesti aiheuta monimuuttujakalibrointiin logistiikkaregressiomallin. Wilson et ai. [17] osoittavat, että näyttö, jonka jälkeen monimuuttuja oikaistun analyysin MISAN antaa lisää voima havaita yhdistysten yli marginaalinen analyysi yksin, minimaalisella nousu vääriä positiivisia hinnat. Ne osoittavat, että MISA on myös paljon parempi teho kuin tavallinen monivertailu oikaisumenetelmät ja väärien löytö korko menettelyjä, portaittain logistinen regressio tai lasso.

MISA hyödyntää priorijakauma yli mallin parametrit kalibroidaan pienehkö vaikutus kokoja ja beeta-binomimallia priorijakauma määrästä SNP sisällytetään malliin. Jälkimmäinen jakelu aiheuttaa lukuisia korjaus määrittämällä maailmanlaajuinen etukäteen kertoimella yhdistyksen, joka on riippumaton määrä SNP tai geenien analyysissä. Sen parametrit,

a = 1/8

ja

b = S

(lukumäärä SNP mallissa haku vaihe), valittiin tulosten perusteella on simulaatiokokeessa saavuttaa haluttu tasapaino vääriä positiivisia ja vääriä negatiivisia hintoja. Tarkemmin tilastollisia menetelmiä käytetään tässä analyysissä löytyy Wilson et al. [17] (Text S1).

Bayes päättely.

Sekä marginaalinen ja monimuuttuja analyysit käyttää Bayes tekijät (BFS) mitata todisteita puolesta (tai vastaan) yhdistys. BF on vastaavasti yleinen todennäköisyys suhde ja riskisuhde. Entisessä luonnehdinta on suhde todennäköisyys tietojen alle yksi malli (esimerkiksi malli geneettinen yhdistyksen) toiseen (esim. Malli geneettisiä Association). Sen sijaan, että suhde näytteenoton mallien kunkin hypoteesin arvioitu todennäköisin parametriarvo (MLE) kunkin kuin frekventistisessä paradigma, BF on suhde näytteenotto mallien keskiarvona niiden priorijakaumia mallin parametreihin. Jälkimmäisessä kuvaamista, peruskehystä määritellään suhde taka kertoimella hypoteesi (tai mallin) yhdistymisvapaus tunnetun kertoimet (π /(1- π)) kyseisen hypoteesin ja siten mitata määrin data

päivitys

kertoimet että hypoteesi yhdistys [25], [26], [27]; joiden BF 10, takaosan kertoimella yhdistyksen ovat 10 kertaa suurempi kuin ennen kertoimet. Alle yleisesti käytetty asteikolla todisteiden [28], peruskehystä välillä 1,0 ja 3,2 ovat ”heikosti tukevia”, ne välillä 3,2 ja 10 ovat ”tukevia”, ne välillä 10 ja 30 ovat ”vahvasti tukevia”, ne välillä 30 ja 100 ovat ” erittäin vahva ”ja ne yli 100 ovat” ratkaisevaa ”tueksi yhdistyksen (olemme muuttaneet nimet useampaan näistä luokista, mutta ei niiden tulkinta). Peruskehys ilman yhdistys on yksinkertaisesti käänteisluku BF varten yhdistys, näin poiketen p-arvot peruskehystä voi tarjota mitta tukea kannattaa nollahypoteesi. Peruskehystä voidaan muuntaa posterior kertoimet (PO = BF x π /(1- π)), ja taka todennäköisyydet yhdistyksen (PPA = PO /(1 + PO)) tarjota ”absoluuttinen” mitta todisteita yhdistyksen [ ,,,0],18]. Posterior todennäköisyydet voidaan käyttää osana päätösanalyysin mitkä SNP jatkaa edelleen. Kynnys 0,5 PPA, oletetaan, että väärät positiiviset ovat samaan hintaan kuin väärä negatiivinen tulos. Alustavia tutkimuksia, alempi kynnys voi olla sopivampi.

puuttuvat tiedot.

Ei ollut puuttuvia suunnittelu muuttujia. Käytimme fastPHASE [26] tuottaa 100 imputations puuttuvan genotyyppitietoja annetaan havaittu, unphased genotyyppitietoja. Näytön marginaalinen peruskehystä laskettiin yksinkertaista keskiarvoa BFS kullekin 100 laskennallisten aineistoja. Olemme verranneet näitä BFS niille laskettiin yksi datasarja, jossa puuttuva genotyypit korvattiin niiden modaalisen arvo määritettiin 100 imputations. Kaksi sarjaa peruskehystä oli korrelaatio 0,998. Tästä syystä ja koska laskut suuresti virtaviivainen, käytimme yhden datajoukon kanssa liikennemuoto fill-ins ”varten MISAN analyysiä.

Imputointimenetelmän olettaa, että puuttuva SNP genotyyppiä ovat ignorable eli joko puuttuvat täysin random (MCAR) tai puuttuu satunnaisesti (MAR). Käytimme marginaalinen BF ohjelmisto tarkistaa tämä olettamus tutkimalla onko SNP: n malli puuttuvien oli ehdollisesti riippumaton tapaus-verrokki asema annetaan Havaintojen olemme selittää puuttuvien. Muotoilu muuttujia tässä analyysissä olivat samat kuin käytettiin näytössä ja MISA. Näissä laskentaa, käytimme 0-1 indikaattori varten SNP puuttuvien tilalle genotyypin tietojen ja laskettu peruskehystä assosiaatiota tämän indikaattoria tapaus-verrokki asema log-lisäaine malli SNP viisi tai enemmän puuttuvat arvot (60 SNP).

suunnittelu muuttujat.

Logistinen regressioanalyysi on tapaus-verrokki tilan erän ja GC50PCT osoitti vahvan erän vaikutus (p 10e

-7), vastaa pääasiassa epätasaisen asioiden jakaminen ja valvonnan erän neljä ja erä-GC50PCT vuorovaikutuksen (p = 0,02). Pohjalta tämän analyysin, me sisältävät erä, GC50PCT, vuorovaikutus erän ja GC50PCT kaikissa yhdistyksen malleissa iän myötä.

haplotyyppianalyysissä.

yhdistykset yhden tai useamman SNP on geeni voi esiintyä, kun ne variantit merkitä riski haplotyypin. Käytimme Haploview 4.1 suorittamaan haplotyyppi yhdistys kokeita selvittämään, onko tämä voisi olla kyse geeneissä sisältävä pisimmälle liittyvien SNP.

Tulokset

NCOCS Candidate DNA Repair Gene Analysis

marginaalinen SNP-at-a-aika analyysi 484 ei-tarpeeton SNP kulkee laadunvalvonta, S = 77 SNP läpäisi marginaalinen näyttö (enintään marginaalinen BF 1,0). (Tulokset seulonnasta vaiheen analyysin, kuten mediaani pariton suhde (syrjäisimmillä alueilla), 95% uskottava välein (CI) ja MAFs kaikille 484 SNP on esitetty taulukossa S2.) Ajoimme MISA käyttäen 77 SNP että läpäissyt näytön parametrit

a = 1/8

ja

S = 77

, mikä johtaa marginaalinen ennen kertoimet yhdistyksen tässä osajoukko 1 /AXS = 0,0016. Taulukossa 1 luetellaan SNP-spesifinen peruskehystä varten 41 SNP: 25 geenejä, jotka oli MISAN BF 1,0. Taulukossa on myös raportoi todennäköisin geneettinen malli jokaiselle SNP, posterior todennäköisyys, että mallin ja mediaani syrjäisimpien ja 95%: n luottamusväli arvioita.

Näistä 41 SNP, kuusi SNP neljästä geenistä (

CHEK2

,

TP53

,

BACH1

ja

LIG4

) on MISA BF 10 todisteeksi assosiaatiosopimuksen näiden SNP ja munasarjasyöpä. Nämä rs5762746 (BF = 28,940) ja rs6005835 (BF = 28,028) in

CHEK2

, rs2078486 (BF = 19,604) ja rs12951053 (BF = 14,062) in

TP53

, rs411697 (BF = 15,909) in

BACH1

ja rs10131 (BF = 10,864) in

LIG4

. Neljätoista SNP seitsemässä geenejä, mukaan lukien

GADD45B

,

MSH3

,

MSH6

,

NBS1

,

RAD52

,

TP53

,

ja XRCC5

oli peruskehystä vaihtelevat 3,39-9,09, jossa posterior kertoimet, jotka ovat 3,39-9,09 kertaa suurempi kuin ennen kertoimet. SNP-erityinen Bayes tekijät ovat komposiitti toimenpiteitä, keskimäärin yli tilastollisia malleja yhdistys, joka sisältää että SNP säädettäessä muiden mahdollisesti liittyvien SNP ja niiden geneettisen parametroinnit. Näin ollen ne nimenomaisesti huomioon epävarmuus erittely tilastollisen mallin yhdistymis-.

Kuva 1 esitetään yhteenveto yhdistysten 20 SNP kanssa MISAN BF 3.2. Tämä juoni yhteenveto top 100 mallia valittu sen perusteella, niiden posterior mallin todennäköisyydet. Mallit on järjestetty x-akselin laskevassa todennäköisyys ja leveys sarakkeen liittyvä malli on verrannollinen, että todennäköisyys. SNP: t ovat edustettuina y-akselilla. Läsnäolo SNP mallissa osoittaa värillisen lohkon risteyksessä mallin sarakkeeseen ja SNP: n rivi. Väri lohko osoittaa geneettinen parametrisointi SNP tiettynä malli: violetti log-lisäaine, sininen väistyvä ja punainen hallitseva. Ruutukuvio vastakohtana kuvion voimakas vertikaalinen bändejä osoittaa huomattavaa mallin epävarmuuden. Seitsemänkymmentäkahdeksan alkuun 100 mallia kuviossa 1, mukaan lukien top 48 mallit, sisältää vain yhden SNP lisäksi suunnittelun muuttujia. Vain 22 alkuun 100 mallien mukana kaksi SNP ja yksikään niistä oli enemmän kuin kaksi. Huippumalli sisältää vain log-lisäaine geneettinen parametrisointi rs6005835 in

CHEK2

kanssa Maximum a priori (MAP) arvio OR 0,70. Toinen sijoittui näytteet malli koostuu log-lisäaine geneettinen parametrisointi rs5762746 in

CHEK2

kanssa MAP OR 0,73. SNP rs6005835 ja rs5762746 in

CHEK2

vaatimaton LD mitattuna r

2 0,5.

Yksittäiset SNP ovat edustettuina y-akselilla etikettejä geenin ja RS numero SNP ja tilataan perusteella Bayes tekijä hyväksi SNP yhdistys, joka annetaan y-akselin oikealla puolella juoni. Läsnäolo SNP mallissa osoittaa värillisen lohkon risteyksessä mallin sarakkeeseen ja SNP: n rivi, kun taas väri lohko ilmaisee parametrointi SNP: violetti log-lisäaine, sininen väistyvä ja punainen määräävässä asemassa.

mallit, jotka sisältävät useita SNP edustavat 22 top 100 mallia lukumäärästä, mutta vain 7,8% niiden koko taka massasta. Alhainen suhteellinen painotus tämän luokan malleista on pitkälti seurausta voimakkaasta MISAN moninaisuus korjauksen, joka kontrolloi väärien positiivisten määrä liittyy soitettujen puhelujen perusteella SNP-erityisiä peruskehystä. Korkein sijoitus multi-SNP malli (rank = 49) sisältää CHEK2 rs5762746 ja TP53 rs2078486. Nämä vaihtoehdot ovat täydentäviä ennustavat, kukin selittää niin paljon vaihtelua tapaus-verrokki tilan, kun mallinnetaan yksin kun mallinnetaan läsnäollessa toisen. Tämä viittaa siihen, että SNP useista geeneistä, jotka liittyvät DNA-vaurioiden korjaamiseen annetaan lisätietoja luonnehtimiseksi munasarjasyövän riskiä.

haplotyyppianalyysissä.

Haploview [29] analysointi CHEK2, TP53, BACH1 ja LIG4 , joka sisältää kuusi parasta SNP, ei ole osoittanut merkkejä usean SNP (haplotyyppi-pohjainen) riski genotyyppejä.

Analyysi puuttuvia tietoja.

60 SNP yli 4 puuttuu SNP genotyyppiä , vain kuusi oli peruskehystä 1,0 ehdollista riippuvuus tapaus-verrokki tilan puuttuvien annetaan suunnittelun muuttujia. Neljä näistä peruskehystä olivat alueella 1,01-1,49 ja eivät ole huolta. Loput kaksi, rs11571789 vuonna BRCA2 (BF = 3.80) ja rs1805794 in NBS1 (BF = 4,60), olivat tukevana ”yhdistymisvapautta. Nämä voivat johtua joko mahdollisuus tai läsnä ollessa mittaamattoman sekoitin ja heijastavat rakenteessa ei-ignorable puuttuvien. Puuttuvat tiedot imputations että sivuuttaa mahdollisuutta matalataajuista polymorfismien joka vaikuttaisi kykyyn määritystä koetin ei osuus LD välisen harvinainen liittyvä variantti ja SNP kanssa puuttuvat arvot. Lopullinen vaikutus asennettaessa yhdistys malleja tämän SNP tulee olemaan SNP näennäinen vaikutus puolueellinen. BRCA2 rs11571789 korkein marginaalinen BF yhdistettäväksi munasarjasyöpä oli 0,26 (tukevana ”mitään yhdistys), ja se ei sisälly MISAN analyysiin. NBS1 rs1805794 suurimmasta marginaalinen BF oli 1,76 ja sen MISAN BF oli 3,82. Tämä vaatimaton näyttöä hyväksi yhdistyksen pitäisi tulkita valossa mahdollisia tämän vaikutuksen olleen sekoiteta.

Keskustelu

Tämän tutkimuksen tulokset tarjoavat näyttöä yhdistyksen useiden geenien DNA korjaukseen ja vastaus reittejä ja riski invasiivisen vakavasta munasarjasyöpä. Oli vahva tuki assosiaatiot munasarjasyöpä ja kaksi SNP

CHEK2

, kaksi SNP

TP53

,

ja

yksi SNP kukin

BACH1

ja LIG4

. Meidän analyysit ovat myös tukevat assosiaatioita neljän SNP

NBS1

, kolme SNP

MSH3

, kolme SNP

RAD52

, ja yksi SNP kukin

GADD45B

,

MSH6

,

TP53

,

ja XRCC5

ja invasiivisen vakavasta munasarjasyöpä. Tietääksemme tämä on ensimmäinen tutkimus viittaa siihen, assosiaatiot munasarjasyövän ja SNP

CHEK2

,

BACH1

,

XRCC5

,

NBS1

,

MSH6

,

RAD52

,

ja GADD45B

. Kuten alla, on näyttöä siitä, useat parhaiten liittyvän SNP voi olla toiminnallinen merkitys.

Käytimme SNPInfo analyysi [30] onko jokin kuudesta SNP kanssa MISAN BF 10 oli LD kosketukseen oletetun toiminnallista varianttia tai ennustetaan olevan toiminnallista merkitystä. Tutkimme jokaisen HapMap SNP LD on 0,5 tai korkeampi yksi kuudesta alkuun SNP. Taulukko S3 kertoo, onko muunnos on ennustetaan vaikuttavan transkriptiotekijän sitoutumiskohdan, liitoksen suorittavan sivusto, joka on miRNA sitoutumiskohta tai muuttaa rakenteen proteiinituotteen. Lisäksi se osoittaa, onko SNP on ei-synonyymi tai nonsense muunnos ja raportoi sääntely- potentiaali ja sekvenssikonservoinnista tulokset. Tämän analyysin perusteella, sekä rs10131 vuonna

LIG4

ja rs9587535 vuonna ABHD13, SNP korkean LD kanssa rs10131 (LD = 0822) ennustetaan Miranda [31] vaikuttaakseen miRNA sitoutumiskohta. Lisäksi rs10131 on korkea ennustettu sekvenssi säilyttämistä pisteet (ei-koodaavan variantti). Kaksi muuta

LIG4

LD SNP (rs1931336 ja rs9587535 LD 0,59 ja 0,82 kanssa rs10131, vastaavasti) on myös tämä ominaisuus. Useat variantit heikko LD (0,5 LD 0,7), jossa

TP53

rs12951053 ennustetaan vaikuttavan transkriptiotekijän sitoutumiskohta; yksi näistä (rs17882227) on täydellinen LD

TP53

rs2078486, yksi erittäin liittyvien SNP: itä. Lisäksi rs2287498 vuonna

WDR79

(täydellisessä LD kanssa rs2078486 ja LD (R

2 = 0,62) kanssa rs12951053) ennustetaan vaikuttavan toiminto jatkos päällä ja ei-synonyymi variantti (rs2287499 ) in

WDR79

heikoissa LD kahden parhaiten liittyvän

TP53

SNP on ennustaa PolyPhen [32] olevan hyvänlaatuinen. Useat ei-koodaavan

TP53

versioiden korkea sääntelyn potentiaalia ja /tai sekvenssin säilyttämisen tulokset; Näiden rs17882227 on korkein LD (1.0), jossa on ehdokas (rs2078486). SNP rs388707 LD kanssa

BACH1

rs411697 ennustetaan vaikuttavan liittämiseen, kun taas toinen SNP (rs425989) LD kanssa rs411697 ennustetaan Miranda vaikuttaakseen miRNA sitoutumiskohta. Lisäksi kolme introni SNP LD kanssa

BACH1

ehdokas on sekvenssikonservoinnista tulokset suurempi kuin 0,1, mikä viittaa siihen, että ne voivat olla toiminnallisesti mielenkiintoinen. Useat variantit ja lähellä

CHEK2

osoittaa voi vaikuttaa toiminnon.

Vastaa