PLoS ONE: Identity Descent kartoitus perustaja Mutaatiot Cancer käyttäminen korkearesoluutioinen Kasvain SNP Data

tiivistelmä

Dense genotyyppi tietoja voidaan käyttää havaitsemaan kromosomifragmentteja peritty yhteisestä esi-isästä näennäisesti sukulaisyksilöistä. Sairaus aiheuttavia mutaatiota periytyvät yhteisestä perustaja voidaan siis havaita etsimällä yhteistä haplotyypin allekirjoituksen näytteessä potilaspopulaatiossa. Esitämme tässä FounderTracker, laskennallinen menetelmä genomin laajuinen havaitseminen perustaja mutaatioiden syövän käyttäen tiheässä kasvain SNP profiileja. Meidän menetelmä perustuu kahteen oletukseen. Ensimmäinen, villityypin alleelin usein tapahtuu heterotsygoottisuuden menetys (LOH) kasvaimissa ituradan mutaation kantajia. Toiseksi päällekkäisyyden esi kromosomifragmentteja peritty yhteinen perustaja määrittelee minimaalinen haplotyypin säilytetty kunkin potilaan kuljettavat perustaja mutaatio. Meidän lähestymistapamme tukeutuukin havaitsemiseen haplotyyppien merkittäviä henkilöllisyytensä laskeutumisen (IBD) jakamisen toistuvia alueilla LOH korostaa genomista loci todennäköisesti satama perustaja mutaation. Me validoitu tätä lähestymistapaa analysoimalla kaksi todellista syöpää aineistoja, jossa olemme menestyksekkäästi tunnistettu perustaja mutaatiot hyvin tunnettu tuumorisuppressorigeeneille. Sitten käytetään simuloidun datan arvioimiseksi kyky meidän menetelmän havaita IBD traktaatteja funktiona niiden koko ja taajuus. Osoitamme, että FounderTracker voi havaita haplotyyppien alhainen esiintyvyys on korkea teho ja spesifisyys, merkittävästi ylittäen olemassa olevia menetelmiä. FounderTracker on siis tehokas työkalu löytää tuntemattoman perustaja mutaatioita, jotka saattavat selittää osan ”puuttuva” periytyvyys syövässä. Tämä menetelmä on vapaasti käytettävissä ja sitä voidaan käyttää verkossa tällä FounderTracker verkkosivuilla.

Citation: Letouzé E, kylvää, Petel F, Rosati R, Figueiredo BC, Burnichon N, et al. (2012) Identity Descent kartoitus perustaja Mutaatiot Cancer käyttäminen korkearesoluutioinen Kasvain SNP Data. PLoS ONE 7 (5): e35897. doi: 10,1371 /journal.pone.0035897

Editor: Thomas Mailund, Aarhus University, Denmark

vastaanotettu: 22 helmikuu 2012; Hyväksytty: 23 maaliskuu 2012; Julkaistu: 02 toukokuu 2012

Copyright: © 2012 Letouzé et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ on osa CIT ohjelman Ranskan Ligue Nationale Contre le Cancer (https://cit.ligue-cancer.net/index.php/en). Tätä työtä tukivat avustuksia Institut National du Cancer ja CNRS (LIA NEOGENEX) Enzo Lalli; CNPq ja CAPES avustuksia Bonald C. Figueiredo. Tätä työtä tukivat ohjelmasta Hospitalier de Recherche Clinique avustus COMETE 3 (AOM 06 179). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

With SNP taulukot ja seuraavan sukupolven sekvensointi, on nyt mahdollista määritellä genotyypin miljoonia SNP yhdessä kokeessa, alhaisin kustannuksin. Tämä on tehnyt mahdollista havaita DNA-alueet peritty yhteisestä esi-isästä kahdessa näennäisesti toisiinsa yksilöitä. Kaksi osuuksilla DNA sanotaan identtinen syntyperän, jos ne ovat identtisiä johtuvat yhteisten syntyperä. Havaitseminen identiteetin syntyperää (IBD) populaatioissa pidetään erittäin lupaava lähestymistapa nostolaite kartoitus tauti geenejä. Todellakin, sidos analyysit tehdään yleensä pienissä sukutauluista sisältävä läheistä sukua yksilöitä. Näin ollen IBD segmentit tunnistetaan yleensä liian pitkä hahmotella polttoväli kiinnostavat alueet, joilla on rajoitettu määrä kandidaattigeenejä. Sen sijaan kirjoitusten IBD sukulaisyksilöistä harvoin ulottuvat enemmän kuin muutama senttimorgan (cM). Väestöpohjainen sidoksen tutkimukset ovat siten erittäin hyödyllisiä sakon määrittely ehdokas loci [1]. Useita tehokkaita menetelmiä on kuvattu ilmaisemiseksi kirjoitusten IBD parien välillä yksilöiden, joka perustuu tiheä asteittain [2], [3] tai unphased [4], [5] genotyypin tietoja. Nämä menetelmät ovat käyttökelpoisia pareittain IBD havaitsemiseen, mutta väestöpohjainen sidoksen kuvaaminen edellyttää havaitsemista perimän alueita, joilla on merkittävä ylimäärä IBD tapauksissa taudin suhteen valvontaa. Kahta menetelmää ehdotti äskettäin havaitsemiseksi IBD välillä useita henkilöitä: Markovin ketju Monte Carlo lähestymistapa (MCMC) [6], ja DASH (DASH Associates Shared Haplotyypit) [7], graafiperusteisen algoritmi, joka perustuu pairwise IBD segmentit päätellä klustereita IBD yksilöitä. Merkittävä rajoitus MCMC on, että siihen liittyy voimakas laskenta ja siksi ei sovellu analysointiin suuria tietomääriä koostuu korkean tiheyden SNP profiileja. DASH on paljon nopeampi, mutta vain palauttaa listan haplotypes jotka ovat identtisiä jonka syntyperää useita näytteitä. Merkittävät rikastumisen sairaus tapauksissa voidaan sitten arvioida tilastollisella yhdistys testi. Tämä lähestymistapa ottaa huomioon vain taajuus säilytetty haplotyyppien, eikä niiden pituus. Silti, pitkä haplotyyppi, vaikka kohtasi muutamissa tapauksissa, osoittaa todennäköisesti läsnäolon perustaja mutaation.

menetelmä on erityisesti omistettu kartoitus syövän geenien. Yksi keskeinen piirre syöpiä on, että kasvaimen solut kerääntyvät kromosomipoikkeavuuksia antaa kasvuedun aikana syövän etenemisessä siten, että kasvain genomi lopulta tulee erittäin järjestetään uudelleen versio konstitutiivisen genomin potilaalle. Lisäksi sijainti somaattisten muutosten on osittain lähtöisin läsnäolo riskin alleelien ituradan genomissa [8]. Erityisesti potilailla perinyt ituradan mutaation kasvainsuppressorigeenin menettävät usein normaalia vastine syöpäsoluissa, paljastaen mutanttifenotyyppi, kuten Knudson kaksi-osuma malli [9]. Siten ituradan mutaatioita sijaitsevat usein alueilla Heterotsygotian menetys (LOH). Tämä ominaisuus on erityisen hyödyllinen sidoksen kartoitus syöpägeenit. Ensinnäkin alueet LOH voidaan priorisoida etsittäessä toistuvia IBD. Toiseksi, kun genominen alue läpikäy LOH, vain toinen kahdesta vanhempien kromosomit jää kasvaimen DNA, joten haplotyyppi tämän kromosomin annetaan suoraan kasvaimeen SNP profiilin, ilman haplotyypin-asteittain vaiheessa. Vähäinen alueet LOH ovat siis ihanteellinen lähtökohta havaitsemiseksi toistuvien IBD populaatiossa näytteessä kasvaimia.

menetelmä on suunniteltu havaitsemaan syöpään liittyvät mutaatiot periytyvät yhteisestä perustaja käyttäen toistuvia IBD minimaalinen alueet LOH (kuvio 1). Pohjalta ituradan algoritmi [3] pareittain IBD havaitsemiseksi vaiheittain haplotypes, kuvaamme pisteytys lähestymistapaa, jossa otetaan huomioon sekä määrää ja pituutta IBD segmentit luonnehdinta merkittävästi säilytetty haplotyyppien joukon kasvainnäytteestä. Me vahvistaa tätä lähestymistapaa kaksi todellista syöpää aineistoja. Ensimmäisessä aineisto, joka käsittää 13 lapsuuden lisämunuaiskuoren kasvaimet eteläisestä Brasiliasta, me hahmotella konservoituneen haplotyypin ulottuu 520 kb ympäri aiemmin raportoitu p.R337H

TP53

perustaja mutaatio. Toisessa aineisto, joka käsittää 30 feokromosytoomien ja paragangliooma, havaitsemme uutta perustaja mutaatio

SDHD

geenin, läsnä vain kaksi näytettä. Lopuksi näyttää kanssa simuloitu tietojen FounderTracker havaitsee konservoitunut haplotyyppien alhainen esiintyvyys on korkea teho ja spesifisyys, merkittävästi ylittäen nykyiset menetelmät.

Tulokset

havaitseminen säilyneitä haplotyyppien toistuvia alueilla LOH

strategia väestöpohjaisia ​​sidos kartoitus perustaja mutaatioiden syöpä on esitetty kuvassa 1. mutaatio leviää populaatio on toimitettava kromosomiin katkelma yhteinen esi, joka pienenee sukupolvelta johtuu geneettisestä rekombinaatiota meioosissa. Kaikki mutaation kantajia ovat siis identtinen syntyperän niiden yhteinen esi varten kromosomissa alueen kätkeminen ituradan mutaatio. Lisäksi villityypin vastine mutantti geeni on usein menetetään LOH kasvaimissa esiintyy ituradan mutaation kantajia. Lähestymistapamme kartoituksen perustaja mutaatioiden avulla SNP array data siten siihen kuuluu (i) tunnistamaan toistuvat alueet LOH, (ii) jälleenrakennetaan kasvain haplotyyppien näillä alueilla, ja (iii) etsivät toistuvia IBD kasvainten haplotyyppien.

Tämä kaavio kuvaa periaatteiden menetelmämme. Perustajan mutaatio (punainen tähti kaaviokuva kromosomien) leviää populaation sisällä kromosomi fragmentti (punaisella) periytyy esi perustaja (A). Johtuen ylitys villapaidat (katkoviivat) homologisen kromosomeissa at Meioosin tämä kromosomi fragmentti lyhenee yli sukupolvien, niin että mutaatio harjoittajat (merkitty punaisella) lopulta satama vain lyhyen identtinen syntyperän (IBD) haplotyyppi ympärille mutantti geeni (B ). Lisäksi villityypin vastine ituradan mutaatioiden usein menetetään LOH tuumoreissa, niin että perustaja mutaatio tyypillisesti sijoittuu minimaalinen alueen LOH (C). Tämän seurauksena perustaja mutaatio sijaitsee haplotyypin säilytetty kunkin mutaation kantaja (peak IBD pisteet), on minimaalinen alueella LOH (D).

Yhdellä koetin kohdistaminen kummankin alleelit kunkin SNP, SNP paneelit ovat erinomainen väline genominlaajuisten havaitseminen LOH, ja useat algoritmit on kuvattu tähän tarkoitukseen [10], [11]. Tässä tutkimuksessa käytämme Genome Alteration Painomenetelmä [12] havaitsemiseksi Loh, jossa määritellään joukko toistuvia alueita LOH perusteella niiden taajuus kasvain keräämiseen.

sitten rekonstruoida haplotyyppi säilytetyt alleeli kunkin kasvaimen (kuva 2). Koska vain yksi kahdesta kromosomista jää kasvaimen takia LOH, genotyypit saadaan kasvaimen DNA suoraan antaa haplotyyppi kromosomin säilytetään tuumorisoluissa. Muuten, jos konstitutiivinen DNA on myös saatavilla, vertailun unphased genotyyppien konstitutiivisen DNA kasvain haplotyyppi voidaan suorittaa päätellä haplotyyppi kadonneen kromosomi. Arvioida virheprosentti liittyvät tähän lähestymistapaan, vertasimme haplotyyppien rekonstruoida kaksi kasvaimia samasta potilaasta, jossa samassa kromosomissa oli hävisi LOH [13], ja saimme hyvin pieni virheprosentti ( 5 x 10

-5).

genotyypit voidaan päätellä SNP array data, jossa B-alleelin taajuus (BAF), joka luonnehtii fluoresenssi suhde A- ja B-alleelien kussakin lokuksessa:

BAF = B /

(

A + B

). Konstitutiivisen DNA, kukin SNP on läsnä kahden alleelin. Genotyypin kunkin SNP (AA, AB, tai BB) voidaan siten määrittää BAF (0, 0,5 tai 1, vastaavasti), mutta ei haplotyypin jokaisen kromosomin. Sitä vastoin, jos jokin kaksi kopiota on menettänyt LOH kasvaimeen, kasvaimen SNP profiili heijastaa suoraan haplotyyppi kromosomi, joka pysyy kasvain. Jos pariksi konstitutiiviset ja kasvaimen DNA-näytteitä ovat käytettävissä, haplotyyppi kadonneen kromosomi voidaan rekonstruoida vertaamalla kahden profiilin.

Lisäksi etsimme merkittävästi toistuvia IBD joukko rekonstruoitu kasvain haplotypes. Analyyttinen putki Tämän vaiheen on esitetty kuvassa 3. segmentit pairwise IBD ensin tunnistetaan ituradan algoritmi [3]. Sitten määrittää pisteet kullekin pareittain IBD segmentti, jossa otetaan huomioon sekä määrä Alleelifrekvenssien SNP: iden kunkin segmentin (katso materiaalit ja menetelmät). IBD pisteet lasketaan sitten kullekin SNP merkki, yhteen tulokset kaikkien pairwise IBD segmentit sisältävät tämän SNP. Kytkentäepätasapaino- (LD) on myös otettava huomioon, koska genomialuetta vahvojen LD järjestelmällisesti on korkea IBD tulokset (kuva S1). Siksi vertailla kunkin SNP, IBD pisteet saadaan kasvaimista nolla jakauma IBD tulokset määritettiin käyttämällä referenssisarjan haplotypes peräisin terveiden verrokkien (esim vaiheittainen haplotypes päässä 1000 Genomes hankkeet).

FounderTracker putki toistuvien IBD tunnistus on jaettu kahteen vaiheeseen. IBD pisteet lasketaan ensin kullekin SNP markkeri kasvain joukko haplotypes. IBD pisteet on johdettu pareittain IBD segmentit tunnistetaan ituradan algoritmilla. Siinä otetaan huomioon niiden pituuden ja Alleelifrekvenssien SNP: iden kunkin segmentin. IBD pisteet kasvaimia verrataan sitten nolla jakelu perustetaan vertailutietojen asetettu, tunnistaa SNP IBD tulokset huomattavasti odotettua suurempi sattumalta.

Soveltaminen tapauksessa lapsuuden Lisämunuaiskuoren kasvainten Etelä-Brasiliassa

Koska proof-of-concept, ensin sovellettu menetelmämme esimerkkiin lapsuuden lisämunuaisen kuorikerroksen kasvaimet (ACT). Näitä harvinaisia ​​syöpiä (0,3-0,4 tapausta vuodessa miljoonaa lasta alle 15 vuotta) ovat poikkeuksellisen esiintyy Etelä-Brasiliassa (3,4-4,2 tapausta miljoonaa) [14], jossa ne ovat lähes poikkeuksetta liitetty tiettyyn ituradan mutaation

TP53

(c.1010G A, p.R337H) [15], [16], identifioitu perustaja mutaatio [17]. Analysoimme 13 Brasilian tapausta ACT ja kuusi Hyväksytty verinäytteet on Illumina 370k SNP taulukot. Kaikki kasvaimet todettiin kantamaan p.R337H

TP53

mutaatio. Käytimme Genome Alteration Painomenetelmä havaita LOH. Tämä menetelmä tunnisti kaksi vyöhykkeillä LOH kaikissa näytteissä: 4,4 Mb alueen 11p15, ja koko kromosomin 17. Sitten käytetään FounderTracker havaita merkittävästi toistuvia IBD näillä kahdella alueella. Mitään merkittäviä alueen IBD havaittiin 11p15 alueella (kuva S1), mutta erittäin merkittävä IBD tulokset saatiin varten 17p13 alueelle (q-arvo 2,2 x 10

-16). Erityisesti huippu IBD pisteet määritteli 520 kb alueen ympärillä

TP53

geenin (kuvio 4a). Yksityiskohtainen haplotyyppianalyysissä paljasti, että mutatoidut kopiot säilyvät 13 kasvaimissa näytetään identtisellä haplotyyppi tälle alueelle, kun taas villityypin kopioita rekonstruoitu kuuden potilaille Hyväksytty verinäytteitä näytetään eri haplotyyppien (kuva 4b). Tämä toistuva IBD segmentti vastaa siten kromosomi fragmentti, jossa p.R337H

TP53

mutaatio perinyt kaikki potilaat yhteisestä perustaja, jota ei ole häirinnyt crossover perimyslinjan.

IBD pisteet lasketaan pitkin kromosomi 17 joukkoa 13 lapsuuden lisämunuaisen kuorikerroksen kasvaimet (ACT) näyttää merkittävä piikki 17p13.1 (A). Jyrkkä nousu IBD pisteet käyrä vastaavat rajat IBD segmenttien kunkin parin kasvaimia. Huippu alue edustaa yksityiskohtaisesti paneeli B, jossa haplotyyppien kromosomissa 13 kopiota säilytetään kasvaimet (kätkeminen mutantti

TP53

alleeli), ja haplotyyppien kromosomin kopioiden hävisi LOH (kätkeminen villityypin

TP53

alleeli) rekonstruoitu kuuden potilailla, joilla vastaaviin normaaleihin verinäytteitä. Haplotyypit Villityypin alleelit ovat kaikki erilaisia, mikä osoittaa erilaiset haplotyyppien tämän genomin alueella väestön analysoitu. Sitä vastoin haplotyypin yhteinen kaikille Mutanttialleelit ulottuu 470 kb ylävirtaan ja 32 kb alavirtaan

TP53

(edustaa paksu punainen viiva). Tämä säilytetyn haplotyypin vastaa kromosomi fragmentti kätkeminen R337H

TP53

mutaatio periytyy esi perustaja.

keskipituus pairwise IBD kirjoitusten noin

TP53

oli 5,4 cm: n (jotka vaihtelevat 0,88 cm 19 cm, kuva S2). Kuten pareittain IBD segmentit arvioidaan pituus on

1 /

(

2n

) Morgans jälkeen

n

sukupolvea (siis

2n

meioosi) [ ,,,0],2], tämä viittaa siihen, että p.R337H

TP53

mutaatio tapahtui noin yhdeksän sukupolven sitten.

soveltaminen tapauksessa feokromosytoomien ja paragangliooma

feokromosytoomien ja paragangliooma ovat neuroendokrii- kasvaimia johtuvat lisämunuaisytimessä ja sympaattisen tai parasympaattisen paraganglia kudoksiin vastaavasti. Nämä kasvaimet esiintyy yhteydessä perinnöllinen syöpä oireyhtymät -30% tapauksista [18]. Ituradan mutaatioita liittyviä familiaalinen feokromosytooma sisältävät mutaatioita

RET

,

NF1

,

VHL

,

TMEM127

,

MAX

, ja geenit koodaavat proteiineja sukkinaattidehydrogenaasi monimutkainen (

SDHA

,

SDHB

,

SDHC

,

SDHD

ja

SDHAF2

). Täällä haimme meidän menetelmää perustaja mutaation havaitsemisesta joukko 30 feokromosytoomien /paragangliooma ulkopuoliselta potilaista. Näytteet täysin tunnettu kannalta ituradan mutaatioita, ja analysoitiin Illumina 610K SNP taulukot. LOH-analyysi paljasti kymmenen alueille LOH taajuus yli 20%, klo 1p, 3p, 3Q, 6Q, 11p, 11q, 17p, 17Q, 21 q, ja 22q (kuvio 5A, ylhäällä). Näillä alueilla, kasvain haplotypes rekonstruoitiin päässä B alleelifrekvensseiltään profiileja, ja analysoitiin FounderTracker havaitsemiseksi konservoituneen kromosomi segmentteihin. Tämä analyysi paljasti 2,34 cM alueella merkittäviä IBD at 11q23.1 (kuvio 5A, alhaalla). Kiinnostavaa kyllä, tämä kromosomi segmentti sisältää 32 geenejä, mukaan lukien

SDHD

on identtinen jonka syntyperää kaksi näytettä (HS_048 ja HS_158, kuvio 5B), jotka ovat juuri kaksi näytettä meidän kohortin joille c.64C T (p.Arg22X) ituradan

SDHD

mutaatio tunnistettiin (taulukko S1). Tämä havainto osoittaa, että p.Arg22X

SDHD

mutaatiot näissä kahdessa näennäisesti liity potilasta peräisin yhdestä perustaja, ja edelleen vahvistaa merkitystä meidän menetelmää ilmaista perustaja mutaatioiden syöpään.

( A) LOH-analyysi paljasti 10 kromosomi käsivarret LOH taajuus 20% meidän joukko 30 feokromosytoomien ja paragangliooma (ylhäällä). Nämä alueet analysoitiin FounderTracker havaita konservoitunutta haplotypes, paljastaen yksi merkittävä alue kromosomissa varteen 11 q (alhaalla). (B) visualisointi on merkittäviä alueen tunnistettu kromosomissa 11 kanssa genomiikkaa Viewer [44]. IBD pisteet esitetään sinisenä viiva yläpuolella kasvain haplotypes. Haplotypes ovat edustettuina sarjan sininen ja keltainen pystysuorat linjat, joka vastaa SNP kanssa vastaavasti ”A” ja ”B” genotyyppi, mukaan Illumina nimikkeistön. Merkittävä alue havaitsemat FounderTracker vastaa pitkä haplotyyppi, joka on identtinen kasvaimissa HS_048 ja HS_158, ja johtaa suureen IBD pisteet tällä segmentillä. Tämä alue sisältää 32 geenejä, kuten

SDHD

(merkitty punaisella).

arviointi voiman menetelmällä simuloidun datan

Lapsuus ACT on ihanteellinen esimerkkitapaus väestöpohjaisia ​​sidoksen kartoitus. Koska tämä tauti on erittäin harvinainen puuttuessa p.R337H

TP53

perustaja mutaatio, kaikki näytteet valitaan satunnaisotannalla kasvainten pitää tämä mutaatio. Useimmissa yhteyksissä, kasvaimet johtuvat tietyn perustaja mutaatio osuus vain osa syövistä populaatiossa. Olemme osoittaneet kanssa feokromosytooma /paragangliooma datajoukon että FounderTracker pystyi havaitsemaan perustaja mutaation läsnä vain 2 ulos 30 näytettä (7%). Edelleen arvioida suorituskykyä menetelmää tai tuotettu simuloitu data, johon me keinotekoisesti säilyneitä haplotyyppien eripituisia ja taajuudet. Me vertailukohtia FounderTracker analysoimalla saman simuloidun datan DASH algoritmin, äskettäin kehitetty havaitsemaan klustereita yksilöitä jakaa identtisen haplotyypin [7], jota on mukautettu meidän tarkoituksiin (katso materiaalit ja menetelmät). Tämä lähestymistapa tuotti hyviä tuloksia lapsuuden ACT datajoukon (kuva S3), validointi merkityksensä vertailukohteena menetelmällä.

Kaikki haplotyyppien säilytetty ≥50% näytteistä onnistuneesti havaittiin joko menetelmällä (taulukko 1). Sekä FounderTracker ja DASH pystyivät havaitsemaan haplotyyppien konservoitunut ≥15% näytteistä, joissa hyvä teho ( 0,9), mutta FounderTracker merkittävästi päihitti DASH matalan taajuusalueen (≤10%) (taulukko 1, kuvio 6). ROC käyrät osoittavat, että FounderTracker havaitsee toistuvia IBD segmenttejä korkea herkkyys ja spesifisyys alas vähimmäismäärä, joka riippuu pituudesta IBD segmentteihin. IBD kirjoitusten 5 cm havaitaan hyvä teho ( 0,9) peräisin taajuudella 5%, kun taas lyhyet segmentit 1 cm havaitaan samalla teholla vasta taajuuksilla ≥15%. Väärä löytö laskettuna kaikissa simulaatiot, olivat vähäiset molempien menetelmien (vastaavasti 8,6 x 10

-3 ja 5,4 × 10

-4 FounderTracker, ja DASH).

suorituskyky FounderTracker arvioitiin eri olosuhteissa, verrattuna DASH menetelmällä. Kyky kunkin menetelmän havaita konservoituneiden haplotyyppien perustettiin funktiona haplotyypin pituus (1-5 cm) esiintyvyys (2-10% näytteistä). Jokaisen kunnossa, keskimääräinen ROC käyrä määritettiin soveltamalla kunkin menetelmän 100 simuloitu aineistoja.

Simuloitu Tässä esitetyt tiedot vastaavat SNP sisällön Illumina 1M-Duov3 BeadChip (1199187 markkereita). Vaikutusten arvioimiseksi SNP tiheys suorituskyvystä menetelmän, analysoimme samaa simuloitu data, rajoittuu pelkästään 373397 SNP Illumina HumanCNV370-Quad siru. Vaikka oli hieman hajoamista havaitsemiseen lyhyt haplotyyppien (0,5 cm) Illumina CNV370 array, saimme samantasoinen suorituskyky sekä merkki tiheydet (kuva S4). On arvioitu, että 85% ihmisen genomin kesti haplotyypin korttelin 10 kb tai suurempaa Euroopan näytteissä [19] siten, että suurin osa yhteisen SNP hyvin vangiksi koko genomin genotyypityksen paneelit, jotka sisältävät 100000 markkereita tai enemmän, joko suoraan tai kytkentäepätasapaino- [20]. Tuloksemme ovat yhdenmukaisia ​​tämän luvun ja antaa tärkeää tietoa eri sovellettavuutta menetelmämme, mikä viittaa siihen, että teho saavutettavissa nykyisen sukupolven paneelit on lähellä maksimaalista voimaa IBD kartoitus.

käyntiaika of FounderTracker lineaarisesti liittyy näytteiden määrä ja SNP markkereita analysoitu. Esimerkiksi käsittely lapsuuden ACT aineisto (13 näytettä, 9762 SNP) otti 4 min 07 sekuntia, ja pisin meidän simulaatioita, varten aineisto 100 kromosomin 1 haplotyyppien (80158 SNP), kesti 2 tuntia 48 minuuttia yhden ytimen Intel Xeon X5470 neliytiminen suoritin 3,33 GHz. Kuten edellä todettiin, vähän teho lisääntyy voisi odottaa analyysin tiheämpi SNP dataa, joten datan määrä analysoitiin voidaan rajoittaa, mitä markkereita, nykyiseen SNP sisältö HD- paneelit.

keskustelu

Suurin osa perustajavaikutus havaittu tähän mennessä paljastettiin kohdennettuja tutkimuksia polymorfisten markkereiden ympärillä tunnettu syöpään liittyvien mutaatioita. Esittelemme tässä ensimmäinen systemaattinen lähestymistapa havaitsemiseksi perustaja mutaatioiden on genomin laajuisesti, kiinteiden SNP profiileista kasvainnäytteestä.

SNP paneelit käytetään laajasti syövän tutkimukseen kaksi tarkoitusta: löytö ituradan riskin variantit sidos tai yhdistyksen tutkimuksia, ja tunnistaminen toistuvia kromosomi uudelleenjärjestelyjä. Tutkijat tyypillisesti tutkia yksinomaan ituradan genomin assosiaatiota tutkimuksia, tai kasvain genomin analysointiin kromosomin uudelleenjärjestelyjä, vaan yhdistetty analyysi riskien alleelien ja kromosomipoikkeavuuksien on osoitettu olevan hedelmällistä [21]. Tässä tutkimuksessa käytimme LOH priorisoimaan alueita kiinnostavia IBD kartoitus. Yksi tämän menetelmän rajoituksista on se, että muut mekanismit, kuten esimerkiksi mutaation tai promoottorin hypermetylaatio, voivat inaktivoida villityypin vastine mutantti-geenin puuttuessa LOH. Aikaisemmat tutkimukset ovat osoittaneet, Loh olevan yhteinen ”toinen osuma” in ituradan mutaation kantajia [22], [23]. Meidän lähestymistapamme on siis todennäköisesti merkitystä suuressa osassa tapauksia. Lisäksi korkea-luottamus haplotyyppien voidaan päätellä kasvain SNP profiilit alueilla LOH. IBD tunnistus voidaan siten suorittaa tiukkoja parametrit, jolloin menetelmä erittäin spesifinen. Lopuksi LOH klo syöpä geenilokus todennäköisesti yleisempiä mutaation kantajia kuin ei-kantajia, kuten on jo osoitettu, että

BRCA

geenejä [24]. Tarkastelemalla vain näytteitä Loh kunkin ehdokkaan alueen, saatamme siis pystyä havaitsemaan konservoitunutta matalan haplotyyppien joka ei olisi havaittu merkittäviä harkitsemalla koko kasvain asetettu.

Ei nykyisten lähestymistapa oli täsmälleen suunniteltu järjestelmällistä havaitsemista perustaja mutaatioiden syöpä, mutta DASH -menetelmä klustereiden haplotypes jakaa identiteetin-by-laskeutuminen voidaan helposti mukauttaa meidän tarkoituksiin. Ero FounderTracker ja DASH piilee luonnehdinta merkittävästi toistuvat IBD alkaen pairwise IBD täsmää. DASH tunnistaa klustereita haplotyyppien säilyneet useita näytteitä. Sitten voidaan testata, onko jokin näistä haplotyyppien on merkittävästi yliedustettuna kasvaimissa verrattuna normaaleihin kontrolleihin. Rajoituksena tämä lähestymistapa on, että kun klusterit tunnistetaan, yhdistys testi ei ota huomioon pituus säilytetty haplotypes. Sitä vastoin FounderTracker lähestymistapa arvioi IBD pisteet, joka ottaa huomioon sekä taajuus ja kesto säilytetty haplotypes. Tämän seurauksena FounderTracker merkittävästi päihitti DASH havaitsemiseksi haplotyyppien säilytetty ≤10% näytteistä. Tämä on merkittävä ero työpaikan sovelluksissa, koska perustaja mutaatiot ovat todennäköisesti suhteellisen harvinaisia ​​useimmissa tapauksissa. Esimerkiksi perustaja mutaatio esiintyy vain 5% kasvaimia, jotka sijaitsevat konservoituneen haplotyyppi keskipituus 5 cm (kuten p.R337H

TP53

mutaatio Brasilian ACT) havaitaan, joiden teho on 0.92 kanssa FounderTracker versus 0 kanssa DASH (taulukko 1). Sitä paitsi haplotyyppi noin

SDHD

, säilytetty kaksi paragangliooma, ei havaita DASH (kuva S5). Toinen nykyistä menetelmää havaitsemiseksi IBD useita henkilöitä on Markovin ketju Monte Carlo (MCMC) lähestymistapa [6]. Kuitenkin tämä menetelmä on erittäin laskentakeskeisiä ja kirjoittajat kuvattu sen soveltaminen pienten tietomäärien vain (korkeintaan 15 näytettä ja 1278 SNP). Kun yritimme soveltaa tätä lähestymistapaa myös joukko tietoja lapsuuden lisämunuaisen kuoren kasvaimia, menetelmä ei lähentyä jälkeen useita päiviä. Sitä vastoin, FounderTracker pystyi käsittelemään samaa aineisto muutamassa minuutissa. Voimme päätellä, että MCMC ei ole kovin sopiva analysointiin HD- SNP array tiedot.

Me osoitamme, jossa simuloitu data, että menetelmä voi havaita konservoitunutta haplotyyppien vähintään 0,5 cm: n pituinen (kuvio S4) . Chapman

et al.

Osoitti, että kun 100 sukupolvien satunnainen pariutumisen on kasvava väestö, IBD kirjoitusten olisi keskipituus 0,6 cM [25]. Meidän menetelmä sopii siten havaitsemiseksi syöpään liittyvien mutaatioita, jotka vaikuttivat vähemmän kuin 100 sukupolvia sitten. Koska FounderTracker nojaa nolla jakelusta IBD tulokset tunnistaa merkittävästi säilyneitä haplotypes, suosittelemme FounderTracker käyttäjiä käyttämään viittaus näytettä samasta syntyperä kuin kasvain näytteet laskea null jakaumat. Puuttuessa Brasilian datasetin, käytimme CEU data 1000 Genomes hankkeen referenssinä analysointiin lisämunuaiskuoren kasvaimia, koska väestö Parana tila on pääasiassa eurooppalaista alkuperää [26].

Mitä taajuuden, FounderTracker voi havaita, suuritehoisia haplotyyppien säilytetty yli 5% näytteistä, riippuen pituudesta IBD segmentteihin. Osuus kasvainten kätkeminen perustaja mutaatio satunnaisessa väestönäyte riippuu pääasiallisesti geneettinen monimuotoisuus väestöstä ja taudin levinneisyys. Harvinaiset syövät, kuten lapsuuden ACT, jolla on korkeampi esiintyvyys tietyllä maantieteellisellä alueella ovat ihanteellisia IBD kartoitus, koska lähes kaikki tapaukset johtuvat perustaja mutaatio. Vuonna yleisiä sairauksia, kuten rintasyövän, korkean taajuuden perustaja mutaatioita alun perin kuvattu maantieteellisesti tai kulttuurisesti eristäneet populaatioita. Esimerkiksi

BRCA1

ja

BRCA2

perustaja mutaatiot alun perin löydettiin Ashkenazi juutalaisväestö [27], [28] ja Suomessa [29], tässä järjestyksessä. Kuitenkin laaja analyysi näiden kahden geenin lukuisissa maantieteellisillä alueilla on sittemmin paljastaneet yli 20 erilaista perustaja mutaatioita eri alueilla [30]. Nämä havainnot viittaavat siihen, että perustaja mutaatiot voivat olla yleisempiä kuin tällä hetkellä ajatellut. FounderTracker voidaan käyttää verkon kautta web-sovellus, ja lähdekoodi voidaan ladata kotisivultamme (https://cit2.ligue-cancer.net/FounderTracker).

Materiaalit ja menetelmät

potilaat ja etiikka selvitys

Kolmetoista ACT potilaiden brasilialaisen kohortin [31] otettiin mukana tässä tutkimuksessa. Eettinen hyväksyntä tutkimus saatiin Pequeno Príncipen sairaalan eettisen komitean (Curitiba, Brasilia) ja CONEP (Federal eettinen komitea Brasilia, Brasilia) vuonna 2009. Kaikissa tapauksissa jompikumpi vanhemmista tai laillisten edustajien allekirjoittivat tietoon perustuvan suostumuksen hyväksymässä muodossa paikallinen eettinen komitea. DNA uutettiin kasvain ja ääreisverenkierron kuten aiemmin on kuvattu [31].

TP53

mutaatio-analyysi suoritettiin kuten aiemmin on kuvattu [32].

Tuumorinäytteet kolmekymmentä potilailla, joilla on feokromosytooma tai paragangliooma Ranskan COMETE verkon keräämien Pompidou Euroopan Hospital, sisällytettiin Tämä tutkimus. Eettinen hyväksyntä tutkimus saatiin Institutional Review Board (CPP Paris-Cochin, tammikuu 2007). Kaikki potilaat edellyttäen kirjallinen lupa varten otetaan näytteitä ja myöhempien analyysejä. Kasvain-DNA uutettiin, kuten aiemmin on kuvattu [33]. Kliiniset

NF1

diagnoosi ja geneettinen testaus

RET

,

SDHA

,

SDHB

,

SDHC

,

SDHD

ja

VHL

suoritettiin, kuten aiemmin on kuvattu [33].

SNP array hybridisaatio- ja esikäsittely

13 lisämunuaiskuoren kasvainnäytteet analysoitiin Illumina HumanCNV370-Duo v1. 0 sirut, jotka sisältävät 370404 antureista, ja kuusi vastaaviin normaaleihin näytettä analysoitiin Illumina HumanCNV370-Quad v3.0 siruja, jotka sisältävät 373397 koettimia. 30 feokromosytoomien /paragangliooma analysoitiin Illumina Human610-Quad v1.0 siruja, jotka sisältävät 620901 koettimia. Hybridisaatio suoritettiin IntegraGen (Evry, Ranska), ohjeiden mukaisesti antamat array valmistaja. Raaka fluoresoivien signaalien tuotu Illumina BeadStudio ohjelmisto ja normalisoitu, kuten aiemmin on kuvattu [34], jolloin saatiin log R-suhde (LRR) ja B-alleelin frekvenssi (BAF) kunkin SNP. page:

https://mathgen.stats.ox.ac.uk/impute/impute_v2.html#download_reference_data.

Assessing

Vastaa