PLoS ONE: amerikkalaisen ositus munasarjasyövässä asiassa Control Data: Utility genominlaajuisten Tiedot päätellä Ancestry

tiivistelmä

tutkittiin kyky useiden pääkomponenttien analyysiä (PCA) -pohjaisen strategioita havaita ja ohjaus väestön kerrostuminen käyttämällä dataa monikeskustutkimuksessa epiteelin munasarjasyövän naisten eurooppalaisten-Amerikan etnisyys. Näitä ovat korjaus perustuu syntyperää informatiivinen markkereita (AIMS) paneeli suunniteltu mittaamaan Euroopan esi vaihtelua ja korjaukset hyödyntäen un-ohennettu genominlaajuisten SNP data; tapaus-verrokki näytteet peräisin neljästä maantieteellisesti erillistä Pohjois-Amerikan sivustoja. Tavoitteet vain ja genominlaajuisten ensimmäisen pääkomponentit (PC1) sekä vastasi aiemmin kuvattu Pohjois tai Northwest-Kaakkois-akselilla Euroopan vaihtelua. Huomasimme, että genominlaajuisia PCA jää tämän ensisijaisen ulottuvuutta vaihtelua tarkemmin ja tunnistaa muut akselit genominlaajuisten vaihtelua merkitystä epiteeli- munasarjasyöpä. Associations ilmeinen välillä genominlaajuisia tietokoneiden ja tutkimus sivuston vahvistaa Pohjois-Amerikan maahanmuuttohistoria ja viittaavat siihen, että tuntemattomien mitat vaihtelua sijoituttava Pohjois-Euroopassa. Rakenne vangiksi genominlaajuisia PCA oli myös löydetty verrokeilla eikä heijasta tapaus-verrokki vaihtelua läsnä tietoja. Genomin laajuinen PCA esiin kolme alueiden paikallista LD, joka vastaa laktaasin (LCT) kromosomissa 2 HLA-järjestelmä (HLA) kromosomissa 6 ja yhteisen inversio polymorfia kromosomissa 8. Nämä ominaisuudet eivät kompromissi tehoa PC tästä analyysin syntyperä valvontaa. Tutkimuksessa todetaan, että vaikka tavoitteena paneelit ovat kustannustehokas tapa pyydystää väestörakenne, genominlaajuisten Tiedot on mieluiten käytettävä saatavilla.

Citation: Raska P, Iversen E, Chen A, Chen Z, Fridley BL, Permuth-Wey J, et al. (2012) amerikkalaisen ositus munasarjasyövässä asiassa Control Data: Utility genominlaajuisten Tiedot päättelemällä Esipolviluettelo. PLoS ONE 7 (5): e35235. doi: 10,1371 /journal.pone.0035235

Editor: Manfred Kayser, Erasmus University Medical Center, Alankomaat

vastaanotettu: 28 kesäkuu 2011; Hyväksytty: 13 maaliskuu 2012; Julkaistu: 09 toukokuu 2012

Copyright: © 2012 Raska et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Genotyyppaustulokset vaiheen 1 tukivat R01-CA-114343 ja R01-CA114343-S1. MAY0 tutkimus tukee R01-CA-122443 ja P50-CA-136393 ja rahoitusta Mayo Foundation. NCO-tutkimus tukee R01-CA-76016. TBO tutkimus tukee R01-CA-106414, American Cancer Society (crtg-00-196-01-CCE), ja Advanced Cancer Detection Center Grant, Department of Defense (DAMD-17-98-1-8659) . Tor tutkimus tukee avustuksilla Kanadan Cancer Society ja National Institutes of Health (R01-CA-63682 ja R01-CA-63678). Mayo Clinic genotyypin Shared Resource tukevat National Cancer Institute (P30-CA-15083). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Genome-laajuinen yhdistys tutkimukset (GWAS) on tullut keskeinen väline löytää geneettinen alttius monimutkainen sairaus [1] – [4]. Voimassaolo GWAS voidaan vaikuttaa sopimaton ohjaus perinnöllinen sairaus liittyvän genominlaajuisten tausta vaihtelua. Väestön kerrostuneisuus (PS) viittaa genominlaajuisten malleja kytkentäepätasapainossa (LD), että kun liittyvät tautiin, voivat peittää signaalin (läsnä tai poissa) yksittäisten SNP [5] – [9].

Vaikka häiriövaikutukset väestöstä ositus on tunnustettu, on katsottu olevan käytännön huolenaihe pääasiassa sekoitettu tai sekapopulaatioissa kanssa syntyperä eri maanosista [10], [11]. Tästä huolimatta jotkut kirjoittajat ovat osoittaneet, että jopa suhteellisesti enemmän homogeeninen väestö Euroopan amerikkalaisista, genominlaajuisten rakenne voi silti olla ongelma yhdistyksen tutkimuksia [12] – [15].

paneelit SNP ovat olleet suunniteltu erityisesti havaitsemaan ja ohjaus väestön kerrostuneisuus eurooppalaisissa amerikkalaiset [14] – [17]. Vaikka nämä tutkimukset ovat mukana erilaisia ​​aineistoja he ovat kaikki kuvattu yhteinen pääakseli vaihtelua Euroopan syntyperä koostuu North tai Northwest – Kaakkois cline. Nämä tutkimukset eroavat toisistaan ​​useita merkittäviä ulottuvuuksia vaihtelua, että SNP valittu syntyperä informatiivinen markkereita (tavoitteet), sekä useita tavoitteita, jotka ne ovat peräisin. Siten päätettäessä optimaalinen paneeli tietylle joukko tietoja ei ole yksinkertaista.

Nämä Euroopan AIM paneelit suunniteltu tavoitteena on tarjota kustannustehokas tapa valvoa kerrostuminen vähentämällä genotyypityksen kustannusten ehdokas geeni tutkimukset ja validointitutkimuksia [12], [17]. Tästä huolimatta niitä voidaan myös käyttää genomin laajuinen yhdistys tutkimukset (GWAS). Vaikka pääkomponenttianalyysi (PCA) voidaan suorittaa koko GWAS datasarja valvomiseksi varten syntyperä [18], mikä rajoittaa analyysin tavoitteena voi tarjota tapa välttää vaikutuksia paikallisen LD kuvioita PCA tuloksiin ja tapa ehkäistä syömällä ja ohjaamalla pois tapaus-verrokki vaihtelua kohteisiin.

Tässä tutkimuksessa verrataan kahden kontrolloiden PS kautta PCA käyttäen Paschou et al. Tavoitteet paneeli [17] data (Paschou PCA) ja käyttäen genominlaajuisia data (GWAS PCA) kantaa munasarjasyöpä tapaus ohjaustiedot joukko Euroopan amerikkalaisista neljästä eri Pohjois-Amerikan sivustoja. Erityisesti tutkimme vaikutuksia pyydystää tapaus-verrokki vaihtelua ja alueiden suuren paikallisen LD on GWAS PCA perustuu PS sopeuttamisstrategia.

Methods

Tiedot munasarjasyövän GWAS julkaistaan ​​[ ,,,0],19]. Lyhyesti, GWAS I vaihe data käytämme täällä peräisin neljästä tapausverrokkitutkimukset epiteelin munasarjasyöpä: Mayo Clinic munasarjasyöpä Study (MAYO, n = 877) (Rochester, MN), joka sisältää asukkaat kuuden tila ympäröivä alue (MN, IA, WI, IL, ND, SD), Duke University North Carolina munasarjasyöpä Study (NCO, n = 1147) (Durham, NC), joka sisältää asukkaat ympäröivän 48 läänin alueella, University of Toronto familiaalinen munasarjakasvain Study (TOR, n = 1275) (Ontario, Kanada), ja H. Lee Moffitt Cancer Center ja tutkimuslaitoksen Tampa Bay munasarjasyöpä Study (TBO, n = 396) (Tampa, FL), joka sisältää asukkaat ympäröivistä 2 läänin alueella. Kaikki osallistujat itse ilmoitettu olevan eurooppalaisten ei-juutalaista syntyperää. Lisätä etiologic homogeenisuuden, me ulkopuolelle tapauksissa ei-epiteelin tai rajatapaus kasvaimia, tunnettu

BRCA1

ja

BRCA2

mutaation kantajia ja naisilla, joilla on aiemmin ollut munasarja-, rinta-, endometriumin tai varhaisen puhkeamista peräsuolen syöpä. Kaikki säätimet oli ainakin yksi munasarja ehjä viitepäivänä ja olivat taajuus-sovitettu tapauksissa ikäryhmästä. Tutkimuksen protokolla hyväksyi Institutional Review Board jokaisessa keskus (jonka Sisäiset asiakasriskiluokitukset Mayo Clinic, Duke University, yliopistossa Toronton, ja Lee Moffitt Cancer Center) ja kaikki tutkimukseen osallistuneista kunhan kirjallinen lupa.

Veri toimi lähteenä genomista DNA: ta. Kaikki näytteet genotyyppi käyttäen Illumina Infinium 610K Array ja Illumina n Genome Studio ™ ohjelmistoa käytettiin automaattisia genotyypin klustereiden ja kutsumus. Kun laadunvalvonta kuvattu Permuth Wey et al [19], näyte koko 3715 koehenkilöä (1815 tapausta ja 1900 tarkastuksiin) 559179 markkereita oli saatavilla analyysiä varten.

Principal Component Analyysit (PCA) B

PCA suoritettiin 4 sarjaa markkereita: (1) Paschou Euroopan tavoitteena paneeli (Paschou PCA), (2) kaikki saatavilla GWAS markkereita Illumina 610K array genotyypitetty tässä tutkimuksessa (GWAS PCA), (3) kaikki käytettävissä markkereita käyttämällä säätimiä (GWAS ohjaus PCA) ja (4) kaikki saatavilla markkereita poistaen merkkiaineiden korkean LD alueilla (GWAS LD PCA), käyttäen snpMatrix paketin R ohjelmistojen [20].

annettu data matriisi X N yksilöiden rivit ja P SNP pylväiden laskimme ominaisarvo N N matriisi, XX

T. Ominaisvektorit vastaavat PC-tulokset (S), joka voidaan sitten käyttää laskettaessa kuormitukset (B) SNP: iden kunkin PC kertomalla kanssa diagonaalimatriisi ominaisarvojen (V):

GWAS ohjaus PCA, säätimiä käytettiin saamiseksi B ja sitten tietokone tulokset saadaan läpi kertomalla koko datajoukon näitä kuormituksia (X

TB). Vain ensimmäiset 10 ominaisarvot pysyvät koko näitä laskelmia.

Poistaminen Outliers

19 tarkastuksia, jotka olivat yli kuusi keskihajonnat päässä keskiarvosta pistemäärän PC jonkin ensimmäisen 10 PC havaittiin harha in GWAS ohjaus PCA. Ylimääräinen asia yksittäinen todettiin Peränpitäjänä että GWAS PCA. Kaikki 20 henkilöä poistettiin kaikista kumppanuus- perustuu genominlaajuisten data. 1881 valvonta ja 1814 tapausta jäi alkuperäisestä datan joukko 1900 tarkastusten ja 1815 tapauksia, yhteensä 3695 yksilöä.

Poistaminen LD alueiden

LD alueet määriteltiin silmämääräisesti kuormitukset tontteja yksittäisten tietokoneiden ja tunnistetaan kaksi SNP että bracketed huippu kokonaisuudessaan. Kaikki SNP tällä alueella poistettiin lukuun ottamatta keskeinen SNP kanssa äärimmäisen lastaus, myös tunnistetaan juoni. Niistä 559179 SNP saatavilla GWAS tiedot, 553601 säilytettiin varten GWAS LD PCA.

Association Testit

Testit yhdistymis- kunkin SNP munasarjasyöpään suoritettiin käyttäen yleisen lineaarinen malli, joka sisältyi PC kovariantteja kanssa SNP vaikutus mallinnetaan järjestysasteikko (log-lisäaine) genotyypin vaikutusta. Inflaatio tekijät arvioitiin suhde havaitun somistetut tarkoita sen odotusarvo alle chi-neliön oletus. Association testit tietokoneiden sivuston ja taudin tehtiin kautta moninkertaisen lineaarisen regression toteutettu R. Jokainen PC on taantunut tautien tilan ja päällä.

MLE ja Price et al.: N tavoitteena Panel

soudun, suurimman uskottavuuden estimointi käytettiin määrittämään arvioiden Northwestern Euroopan, Kaakkois Euroopan ja Ashkenazi juutalaista syntyperää perustuu ylimääräistä Euroopan AIM paneelin Price et al [16].

tulokset

Principal Components

Vertasimme GWAS ja Paschou PC perusteella niiden korrelaatioita toisiinsa, niiden yhteenliittymien kanssa torjunta-sivuston ja niiden vaikutus inflaatiotekijä, jossa luottivat yhdistyksen sivuston välityspalvelin niiden merkitystä syntyperä. Korrelaatio ensimmäisen PC (eli PC1) ja Paschou PCA ja GWAS PCA oli 0,79. Tämä ensimmäinen PC vastasi Luoteis-Kaakkois akselin vaihtelun että Paschou ym paneelin yksinomaan suunniteltu mittaamaan. Erillinen analyysi käyttäen Price et al: n paneeli vahvisti tämän (katso kuva 1) [16]. Vaikka molemmat PC1s liittyvät sivuston, GWAS PC1 oli merkittävämpi p-arvot (katso taulukko 1) ja korjattuna inflaatiotekijä parempi kuin Paschou PC1 (katso taulukko 2). Samoin kun eroavatko otettiin huomioon vain GWAS PC1 esittänyt todisteita yhdistyksen ensimmäisen akselin amerikkalaisen esi vaihtelua ja munasarjasyöpä.

sininen, vihreä ja punainen pistettä edustaa yksilöiden korkein arvioihin Luoteis-, Kaakkois-ja Ashkenazi juutalaista syntyperää vastaavasti otettu MLE analyysi Price et al. Tavoitteet paneeli.

GWAS PCA myös jää ylimääräisiä esi rakenne. GWAS PC2 kuvassa 1 on esitetty rakenne yksilöiden Northwestern syntyperä, joka ei ole ilmeistä Paschou PC2. Screeplots molemmille PCA (katso kuva S1) osoitti, että toisin kuin Paschou PCA jossa vain PC1 selvästi piilee ennen kyynärpää juoni, kriteeri käytetään usein päätellä, että varianssi selittyy PC on suurempi kuin odotettua sattumalta The GWAS tietokoneet vain tasaantui noin 20

th PC. Tämä ylimääräistä rakenne vahvistivat tutkimalla ensin 100 tietokoneiden ja niiden yhdistyksen sivusto. Sisältää kaikki pareittain sivusto vertailuja, suurin merkitys oli rajoitettu ensimmäiseen 20 PC (katso kuva S2). Kapenee analyysi ensimmäiseen 10 tietokoneet, vain PC: 1,3 ja 4 liittyivät merkittävästi sekä sivuston ja munasarjasyöpä (katso kuva 2), kun taas PC2 ei liittynyt sivuston tai munasarjasyöpä. Tämä viittaa siihen, että PC 1, 3 ja 4 voivat kaikki osuus ulottuvuudet esi vaihtelua, joilla on potentiaalia sekoittavien munasarjasyövän tapauksessa Control Association testaus. Vaikutus säilyttää ensimmäisen 4 tietokoneiden inflaatiotekijä tukee tätä päätelmää, sillä inflaatiotekijä oli huomattavasti pienempi kuin käytettäessä pelkästään GWAS PC1 tai edes ensimmäinen 10 PC (katso kuva 3).

P-arvot kaikkien pareittain välisessä vertailussa neljä kohdetta annetaan.

Ensimmäiset 10 PC saatu Paschou PCA, GWAS ohjaus PCA, GWAS PCA ja GWAS LD PCA käytetään covariates testauksessa genominlaajuisten yhdistys munasarjasyöpään. Huomaa, että Paschou paneelin suunniteltu mittaamaan vain yhden merkittävän PC.

GWAS Ohjaus

Se, että GWAS PC1 voimakkaammin liittyy munasarjasyöpään kuin Paschou PC1 ja että se tuottaa tehokkaampi vähentäminen inflaatiotekijä voi johtaa yksi uskoa, että GWAS PC1 voidaan pyydystää tapauksessa ohjaus vaihtelua ja vähentää tehoa GWAS. Samaa voitaisiin väittää ylimääräisistä PC liittyvän munasarjasyöpään. Jotta testata tämän teimme PCA käyttämällä vain verrokkiyksilöitä (GWAS ohjaus PCA), jossa arvot tapauksen tietokoneiden saatiin Menetelmät kuvatulla tavalla.

Vaikka tietokoneet 1 ja 2 GWAS ohjaus PCA oli hyvin korreloi heidän kollegansa GWAS PCA (ρ 0,9), PC 3 ja 4 korreloi myös, joskin vähemmässä määrin (ρ 0,6, katso taulukko 3). Lineaarinen yhdistelmä GWAS ohjaus PC 3 ja 4 selitetään 68,9% vaihtelu GWAS PC 3 ja 68,7%: n vaihtelu GWAS PC 4, joten oli uudelleenjako varianssin GWAS PC 3 ja 4 poikki useita GWAS ohjaimen tietokoneisiin.

Kuva 3 osoittaa, että inflaatio tekijät saadaan kun säätämisen GWAS ohjaus PC osoittavat samaa mallia kuin ne, jotka saadaan, kun säätämisen GWAS PC, mutta ovat järjestelmällisesti alhaisempi, mikä osoittaa, että entinen tarjoavat tehottomampi korjaus PS. Molemmissa tapauksissa inflaatiotekijä laski huomattavasti PC 1, 3 ja 4. Jos jälkimmäinen saavutti tämän syömällä tapauksessa ohjaus vaihtelua, nämä akselit vaihtelu ei olisi havaittu PCA käyttämällä vain valvontaa. Pienempi alennuksia inflaatiotekijä havaittiin GWAS säädöt todennäköisesti johtuu GWAS ohjaus PCA: n pienempi otoskoko (n = 1814 vs. n = 3695). Väheneminen inflaatiotekijä saavutetaan lisäämällä GWAS ohjaus PC5 voidaan selittää sen korrelaatio (ρ = 0,3) ja GWAS PCA PC3.

Seuraavaksi verrattiin säädön ensimmäisen 4 PC kahdesta genominlaajuisten kumppanuus- on p-arvot SNP yhdistysten munasarjasyöpään. Jos GWAS PCA olivat syömällä tapaus-verrokki vaihtelua, vahvuus yhdistyksen ykköseksi sijoitettu SNP päässä GWAS ohjaus säätää analyysi vähentäminen tai ohjata pois GWAS PCA säätää analyysi. Sen sijaan havaitsimme, että merkittävin SNP GWAS ohjaus-PC säätää analyysin pysyi merkittävin SNP GWAS PC säätää analyysin (katso oikean ruudun kuva 4).

Negatiivinen log p-arvot top osumia munasarjasyöpä yhdistys jälkeen kontrolloi syntyperä käyttäen ensin 4 kpl GWAS ohjaus PCA verrattuna ei kontrolloi syntyperää (vasen paneeli) ja kontrolloimalla syntyperä käyttäen ensin 4 kpl GWAS PCA (oikea paneeli).

Kuva 4 osoittaa myös, että GWAS korjattuna alkuun hittejä

samalla tavalla

kuin GWAS ohjaus. SNP joiden p-arvo muuttui eniten verrattuna korjaamattomana assosiaatiotestiä on korostettu punaisella. SNP että rajat identiteetti linjan vasemmasta paneelista oikeaan paneeliin ovat ne, joiden vahvuus yhdistyksen korjataan samaan suuntaan, jonka kaksi tietokoneiden ja joiden korjaaminen on vahvempi käyttää GWAS tietokoneita. SNP jotka ovat kauempana identiteetti viiva oikeassa paneelissa kuin vasen, jotka eivät ylitä sitä ovat ne, joiden vahvuus yhdistyksen muuttuu eri suuntiin, kun auttavat sinua tarkentamaan säädön yhdet tietokoneiden verrattuna muihin. Kolme kuudesta SNP, joka muutti eniten, kun oikaistaan ​​GWAS ohjaus PC oli tehokkaammin korjattuna GWAS tietokoneisiin. Yksi SNP sai suunnilleen saman korjauksen tasosta ja kaksi korjattiin samaan suuntaan mutta ei niin paljon, että GWAS säätää analyysin kuin GWAS ohjaus säätää analyysi. Mikään SNP korjattiin eri suuntiin kahden sarjaa analyysejä.

Lisäksi vaikutusta p-arvojen ylä- osuma SNP, vertailun genominlaajuisten korjaus kahden PCA voi myös tehdä. Korrelaatio p-arvot kaikille SNP-kohtien välillä korjaamaton yhdistyksen testejä ja näiden korjattu GWAS PCA oli 0,922, välillä korjaamattomia ja GWAS kontrolli oli 0,958 ja välillä GWAS ja GWAS ohjata PCA oli 0,983. Jos GWAS PCA oli poimimaan genominlaajuisten tapauksessa ohjaus vaihtelua, ja siksi korjaamalla laadullisesti eri tavalla GWAS ohjaus, sen tuloksena p-arvot olisivat paremmin korreloi korjaamattoman analyysin sijaan kuin GWAS valvontaa.

Linkage Desequilibrium

Tontit yksittäisten SNP kuormitukset varten GWAS PC 1: stä 4 kohokohta kolmelle alueelle suuren paikallisen LD. Nämä näkyvät piikit kromosomeissa 2, 6 ja 8 (katso kuva 5). Nämä samat alueet olivat ilmeisiä varten GWAS valvontaa tietokoneisiin. Nämä tonttien paljastavat, että akselit vaihtelun määritelty PC 3 ja 4 GWAS ja GWAS ohjaus kumppanuus- ovat keskenään, jossa GWAS ohjaus PC3 osoittaa voimakas huippu kromosomissa 8, joka näkyy juoni GWAS PC4.

GWAS PCA (vasen paneeli) ja GWAS ohjaus PCA (oikea paneeli) kuormat piirretty osoittaa piikkejä kromosomissa 2, 6 ja 8.

GWAS PC1 kuormituksia piikin molemmilla kromosomien 2 ja 6. piikin kromosomissa 2 vastaa aluetta, joka sisältää SNP rs4988235. Tämä SNP on tunnettu polymorfismi geenissä LCT, liittyy laktaasin pysyvyys. Tämä SNP T-alleelia on pohjois-etelä cline Euroopassa taajuudella 5-10% Etelä-Euroopassa ja 70-80% Pohjois-Euroopassa [21]. Huippu kromosomissa 6 vastaa major histocompatibility complex alue (HLA), tunnettu alue on korkea LD [22]. GWAS PC2 kuormitukset on myös korostunut huippu HLA alueella. PC3 ja PC4 kuormituksia huiput ovat kromosomissa 8 alueella, jossa polymorfisen inversio dokumentoitu Euroopan amerikkalaiset ,, [23-25]. Vaikka HLA ja inversio alueet näyttävät tiheämmin maistella Illumina genominlaajuisten SNP paneeli kuin muilla alueilla näistä kromosomeista, tämä yksin ei selitä suuruuden huiput (katso taulukko 4). Erityisesti, kromosomi 8 sisältää 7 muut alueet ovat samankokoisia tai pienempiä kuin inversio alueella, jotka ovat samalla tai tiheämmin näytteitä SNP paneelin, kun ensimmäinen 1 k SNP: jotka käsittävät huippu HLA alueella on sama keskimääräinen tiheys kuin muualla kromosomissa 6.

Vaikka olemassa näyttöä munasarjasyövän asiaan rakennetta datan GWAS PC 1: stä 4, niiden kuormitukset tontteja osoitti, että paikalliset LD voi pohjautua rakennetta. Teimme lisäksi PCA (GWAS LD PCA), jossa vain SNP korkeimman lastaus säilytettiin edustamaan kutakin LD alueiden (katso taulukko 4), onko näille alueille vaikuttaisi näiden tietokoneiden korjaamaan sairauden asiaa PS .

GWAS PC1, PC3 ja osa GWAS PC4 akselit vaihtelun suurelta osin säilytettävä GWAS LD PCA, kun taas PC2 akseli vaihtelu katoaa (katso taulukko 3). GWAS LD PC2 kaappaa vaihtelua kuvataan molemmat GWAS PC 3 ja 4. Tämän vuoksi kromosomi 2 LCT-geenin ja kromosomissa 8 inversio alueet näyttävät korreloi vanhaan komponentteja Euroopan Amerikan väestöstä edustaa GWAS PC 1, 3 ja 4. Toisin The GWAS LD PCA osoitetaan, että HLA alue ei ole merkittävästi yhteydessä genominlaajuisten Euroopan syntyperää PS. Suuri osa vaihtelua kuvataan GWAS PC2 voi siis olla paikallinen sijaan genomin laajuinen, esi vaihtelua. Tämä voi selittää sen puute yhdistyksen sivuston.

harvennus GWAS PCA LD alueilla johtanut vähemmän tehokkaan valvonnan inflaatiotekijä (katso kuva 3). Vain ensimmäiset 2 kpl GWAS LD, mikä vastaa suunnilleen GWAS PC 1, 3 ja 4, alensi inflaatiotekijä. PC1 vähensi inflaatiotekijä samassa laajuudessa ja ilman harvennus SNP on LCT LD alueella, kun säädetään PC 3 ja 4 vähensi inflaatiotekijä enemmän kun kromosomi 8 LD aluetta ei harvennettu.

Ancestral GWAS tietokoneiden ja Association tutkimuspaikka

GWAS PC 1, 3 ja 4 ovat kumpikin erittäin merkitsevästi yhteydessä tutkimuspaikassa korjausten jälkeen tapaus-verrokki tila (katso taulukko 5). Jokainen PC tunnistaa selvä kontrasti sivustoja. Mayo site (MAYO) on alhaisin PC1 arvot ja Tampa (TBO) korkein, keskimäärin; Toronto (TOR) ja North Carolina (NCO) ovat välituotteita eikä discernably erilainen. Sivustot ovat eri keskiarvoja PC3 korjausten jälkeen tapaus-verrokki asema, ja tilataan (pienimmästä suurimpaan arvoon) NCO, TOR, TBO sitten MAY. PC4 kontrasteja MAY ja loput alueista, jotka eivät discernably erilaisia ​​toisistaan.

käyrä PC1 vastaan ​​PC3 osoittaa, että vaihtelu edustaa PC 3 oli sisällä yksilöiden Northwestern Euroopan syntyperä (katso kuva S3) . Se osoittaa myös, että PC 3 selvästi vaihtelee sivustoja. Ei ainoastaan ​​MAYO osoittavat suuntauksena positiivisia PC 3 arvoa verrattuna muihin sivustoihin, mutta NCO osoitti suppeampaa muunnelma tästä PC verrattuna muihin sivustoihin. PC 1 osoitti TBO olevan sivuston enemmän edustus Kaakkois eurooppalaisten samalla MAYO oli vähiten.

Keskustelu

Vaikka tietojen mukaan kaikki SNP genotyyppi on genominlaajuisten paneeli voidaan ohjata väestön rakenteen kautta PCA, käyttämällä pienempää predesigned pyritään paneeli voidaan ajatellaan antavan tiettyjä etuja. Ensinnäkin, kontrolloi kerrostuminen käyttämällä GWAS tiedot voivat ei-toivotusti vähentää tapaus-verrokki vaihtelua, että tutkimuksessa pyritään tunnistamaan, kun taas mahdollisuus, että tavoitteena paneeli sisältää liittyvä sairaus SNP on etäinen. Toiseksi korjaukset perustuvat YK-ohennettu GWAS data voi ilmetä paikallista rakennetta sijasta genominlaajuisten, esi vaihtelua ja siten vaarantaa valvonnan tehoa PS. Tavoitteet paneelit tarkoituksella jättää päällekkäisyydet SNP ja siksi välttää tämän ongelman. Nämä mahdolliset haitat GWAS perustuvia korjauksia voidaan yhdistää populaatioissa hienovaraisempaa genominlaajuisten rakenne ja vahvempi malleja paikallisten LD kuten Euroopan Amerikan väestöstä.

Havaitsimme, että nämä epäkohdat eivät toteutuneet analyysimme ja munasarjasyöpä GWAS tietoja. Erityisesti olemme havainneet, että täyden GWAS PCA toisteta rakennetta läsnä valvonnassa yksilöitä ja ei siis ollut syömällä merkittävä määrä tapaus-verrokki vaihtelua. Tämä ei ole yllättävää, koska tapaus-verrokki vaihtelua, sekä genomin laajuinen ja paikalliset, harvoin riittävän suuri ohitukseen genominlaajuisten lähteitä väestöstä vaihtelua PCA. Tämä ja vähensi Inflaatiotekijöiden arvoihin verrattuna käyttäen Paschou paneeli ehdottaa, että yhdistys munasarjasyöpä löytynyt GWAS PC 1, 3 ja 4 ovat todellinen korjauksen PS vielä huomioidaan sivuston, joka on todennäköisesti johtuu suurempaa tarkkuutta saatiin käyttämällä koko GWAS keräämiseen. Huomaa, että vain 460 Paschou paneelin 500 merkkiaineet olivat saatavilla meille munasarjasyöpä GWAS tietokokonaisuus, mikä vähentää sen tehon verran. Kuitenkin tämä on usein silloin, kun käytetään ennalta suunniteltu tavoitteena paneeli väestörakenne ohjaus on GWAS analyysiin.

Mahdolliset sudenkuoppia ei oteta huomioon vaikutus alueiden suuren paikallisen LD valvontaan PS käyttämällä PCA voidaan luokitella kahteen skenaariot: (1) toiminnalliset variantti ei kuulu näiden alueiden Tässä tapauksessa tietokoneita, jotka muodostavat vain vaihtelua näillä alueilla eivät tehokkaasti valvoa PS, eli inflaatiotekijä ei ole riittävästi alennettu, ja (2) toiminnallinen variantti sijoittuu tällaiselta alueelta; tässä tapauksessa tietokoneita, jotka tiukasti edustavat paikallista rakennetta kyseisen alueen voi ohjata pois yhdistyksen eli inflaatiotekijä laskee liikaa. Vaikka tässä tutkimuksessa alueilla suuren paikallisen LD muuttanut tuloksia GWAS PCA, käytännön vaikutuksia tällä testaamiseen SNP yhdistyksen munasarjasyöpään oli kyseenalainen.

Only GWAS PC2 päteviä esimerkkinä tämän ensimmäisen ilmiön . Sen katoaminen GWAS LD PCA ja sen puute vaikuttaa inflaatiotekijä ja yhdistyksen tauti osoittavat, että se on pääasiassa edustavat paikallista rakenteen HLA alueella ja ehdottaa, että toiminnalliset variantit ovat todennäköisesti olla kyseisellä alueella. Vaikka HLA LD alue sisälsi tarpeeksi vaihtelua täysin muodostavat korkeisiin PC, vaikutus mukaan lukien tämä PC ohjattaessa kerrostuminen ei ole kovin erilainen kuin mahdolliset useat ei-informatiivinen tietokoneissa rutiininomaisesti ottaen ensimmäisen 10 PC kovariantteja (katso kuva 3). Mitkä korkeisiin PC sisällyttää kovariantteja yhdistyksessä analyysi ja kuinka moni heistä sisällyttää voi olla enemmän vaikutusta inflaatiotekijä valvontaa kuin poistamalla vaikutukset LD alueiden PCA.

Teimme ei tarkkailla esimerkki toisen ilmiön edellä mainittiin tässä tietokokonaisuutta. Sen sijaan, akselit vaihtelua kuvataan tietokoneita, jotka havaittiin liittyvän sairauden (GWAS PC 1, 3 ja 4) on säilytetty huomattavassa määrin, kun alueiden suuren paikallisen LD eliminoitiin. Tämä viittaa siihen, että vaikka nämä tietokoneet osoittavat korkea korrelaatio paikalliseen LD alueita ja nämä alueet voivat mahdollisesti satama toiminnallisia variantteja, tietokoneet ovat todellisia, esi, genominlaajuisten rakennetta eikä vain vaihtelua sisällä LD alueella.

käyttäminen skitsofrenia GWAS tiedot Euroopan amerikkalaisista, Zou et al. löydetty sama LD alueiden Nykyisessä tutkimuksessa, ja lisäksi huippu kromosomissa 17. käyttäminen kutistuminen torjuntamenetelmänä LD vaikutuksia PCA, he huomasivat, että kaikki huiput häviävät lukuunottamatta LCT alueen huippu. He päättelevät, että on tärkeää selittää LD käytettäessä PCA kontrolloida PS [25]. He eivät antaneet väliset korrelaatiot tietokoneiden kanssa ja ilman niiden kutistumista menetelmällä. On uskottavaa, että, kuten nykyisessä tutkimuksessa kaksi PC 3 ja 4 ovat korreloi ja että polymorfisen inversio alueella ei ole käytännön vaikutusta syntyperää valvontaa.

Väestö kerrostuminen vaihtelevat tutkimuksesta tutkia ominaisuuksista riippuen tutkimuksen väestön ja tauti ja se voi siten väittää, että tässä esitetyt tulokset ovat ominaisia ​​tämän tutkimuksen. Kuitenkin populaatiot Euroopan syntyperä, kuten yksi tutkittu tässä ovat homogeenisia ja tapaus-verrokki tai paikallinen LD vaihtelu on

vähemmän

todennäköisesti varjoonsa vanhaan väestön vaihtelu käytettäessä YK-ohentaa GWAS tiedot PCA, tutkimuksissa vähemmän homogeenisen väestön kuten ne, jotka tuovat yhteen aiheita eri Manner ancestries ja /tai jotka keskittyvät sekoitettuna populaatiot. Lopuksi suosittelemme huolellisen analyysin avulla PCA koko datajoukon tehtävä ennen päättää miten hallita PS. Käyttö tietokoneita täyden GWAS PCA voi tarjota parempia valvonta PS ja johtaa alhaisempaan inflaatiotekijä. Lisäetuna on, että tällainen analyysi voi auttaa löytö ja poisto harha ja tai liittyvät henkilöt, jotka voivat jäädä huomaamatta muiden laadunvalvonnan /laadun arviointimenetelmät. Tässä tutkimuksessa harha poistimme vaikuttanut merkittävästi tietokoneiden alkuperäisestä GWAS tarkastusmääritystä ja osoittautui sisältävän liittyviä henkilöitä jääneet aiempien QC suodattimia.

On korostettava, että Paschou paneeli teki erittäin hyvin vangitsemaan suuri osa PS niin pieni määrä SNP: iden. Itse uudemmassa paperi tutkijat takana Paschou paneelin osoittavat, että on mahdollista ennustaa yksittäisten syntyperä Euroopassa alas muutaman sadan kilometrin päässä alkuperä käyttäen paneelit 500 tai 1000 SNP [26]. Nämä paneelit ovat erinomainen työkalu kustannustehokkaasti genotyyppi yksilöiden tarkoituksen PS valvonta. Mitä tämä tutkimus haluaa korostaa, että vaikka tämä tehokkuus, läsnä ollessa täysi GWAS tietoja meidän ei houkutusta luottaa yksinomaan tällaista alennettua määrää SNP suoritettaessa PCA.

On mielenkiintoista huomata että yhdistyksen välillä GWAS tietokoneiden 1,3 ja 4 sekä sairautta, vaikka otetaan huomioon eroavatko (katso taulukko 5). Ottaen huomioon nämä eroavatko poistaa että osa väärä yhdistyksen välillä sairaus ja syntyperä, joka johtuu eroista suhteellisen määrän tapauksia ja tarkastuksia rekrytoitiin eri toimipaikkojen yhdistettynä jopa hienoisia eroja syntyperä eri toimipaikkojen. Jäljelle on sitten johtua sisällä sivuston erot esi meikin tapausten ja kontrollien välillä johtuu näytteenoton vaihtelua. Merkittävää on, että tämä sisällä sivusto ero syntyperä tapausten ja kontrollien välillä johtaa jatkuva merkittävä signaali, kun kaikki sivustot, yhdistetään. Tämä tarkoittaa sitä, että joko erilainen syntyperä tapausten ja kontrollien välillä tapahtui samaan suuntaan sattumalta kussakin paikassa tai että tämä ero syntyperä oli niin lausutaan yksi sivustot, että se hukkui mitä tapahtui loput alueista. Toinen mahdollisuus on, että yhdistyksen välillä tauti ja syntyperä ei ole väärä vaan todellisia, mikä selittää sen johdonmukainen suunta kaikissa sivustoja.

Vastaa