PLoS ONE: Identification of Key olevat prosessit Cancer Fenotyypit käyttäminen Biologinen Pathway Analysis

tiivistelmä

Syöpä on tunnustettu perheen geenipohjaisten sairauksia, joiden syyt ovat löydettävissä häiriöitä perus biologisia prosesseja. Yhä syvä luettelo kanoninen verkkojen yksilöitiin molekyylien vuorovaikutus geenien ja niiden tuotteita. Kuitenkin kartoitus tauti fenotyyppien muutoksiin näiden verkkojen vuorovaikutuksen tapahtuu epäsuorasti ja ei-systemaattisesti. Täällä objektiivisesti tunnistaa polkuja liittyy pahanlaatuinen lavastus, ja lopputulos syövässä soveltamalla analyyttistä lähestymistapaa, joka systemaattisesti arvioi eroja aktiivisuudessa ja johdonmukaisuutta vuorovaikutuksista kanonisen biologisia prosesseja. Käyttämällä suuria kokoelmia julkisesti saatavilla genominlaajuisten geeniekspressiota, tunnistamme pieni, yhteinen sarjaa väyliä – trkA-reseptoriin, Apoptosis vastaus DNA Damage, Ceramide, Telomerase, CD40L ja Calcineurin – joiden erot voimakkaasti erottaa erilaisia ​​kasvaintyypeille vastaavista normaalista näytteistä, ennustaa kasvaimen, ja erottaa fenotyypit kuten estrogeenireseptorin tila ja p53-mutaation tila. Väylät tunnistetaan tämän analyysin menesty yhtä hyvin tai paremmin kuin fenotyyppejä käytettiin alkuperäisessä tutkimuksessa ennustettaessa syövän lopputulokseen. Tämä lähestymistapa tarjoaa keinon käyttää genominlaajuisten luonnehdintoja kartoittaa keskeisiä biologisia prosesseja tärkeitä kliinisiä piirteitä taudin.

Citation: Efroni S, Schaefer CF, Buetow KH (2007) tunnistaminen Key olevat prosessit Cancer Fenotyypit käyttäminen biologinen Pathway Analysis. PLoS ONE 2 (5): E425. doi: 10,1371 /journal.pone.0000425

Academic Editor: Nick Monk, Sheffieldin yliopisto, Iso-Britannia

vastaanotettu: 05 tammikuu 2007; Hyväksytty: 29 maaliskuu 2007; Julkaistu: 09 toukokuu 2007

Tämä on avoin-yhteys artikkeli jaettu ehdoilla Creative Commons Public Domain ilmoitus, jonka mukaan, kun se on saatettu julkisia, tämä työ saa vapaasti kopioida, levittää, lähetetään, modifioitu, rakennettu, tai muuten käyttää kuka tahansa laillista tarkoitusta.

Rahoitus: Tämä tutkimus tukee sisäiset tutkimusohjelman NIH, National Cancer Institute.

Kilpailevat edut : kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Biologinen ilmiöt nousevat vaikutuksen seurauksena geenien ja niiden tuotteiden väyliä. Sairaudet syntyä muutos näiden monimutkaisten verkkojen [1] – [5]. Jotta mekanistisiin väitteitä, joilla täydennetään nykyiset menetelmät genominlaajuisia analyysi [6] – [9], me kartta kanoninen biologinen väyliä syöpään fenotyypit. Kaikkiaan 2011 Affymetrix GeneChip- array hybridisointeja saatu 9 eri julkisesti saatavilla tietolähteitä [10] – [17] analysoitiin. Hybridisaatiot edustivat 70 eri kasvaintyypeille (1348 näytettä). Lisäksi 83 erilaista näytettä normaalista histologia sisällytettiin (663 näytettä). Ilmentymistasot säätää RMA [18]. Määritelmä normaalin käytetään tässä sulkee pois sivullisten ja /tai kasvaimen vieressä näytteestä saatujen yksilöiden syöpään.

käyttö polkuja kuin puitteet analyysi ei ole sinänsä uusi. Näitä ovat projektio tunnettujen syövän geenien ja geenien ilmentyminen dataa reittejä [19], [20]. Mikä erottaa työ esitetään tässä on järjestelmällisen arvioinnin vuorovaikutuksen rakenteen poikki ennalta kanoninen verkoissa. Mittaamaan tilan vuorovaikutuksen se yhdistää tietoa geenistä valtion ja verkon rakenne. Useita geeni valtiot saattavat johtaa yhteiseen reitin pisteet. Toisaalta polku tulokset voivat osoittaa enemmän eroja kuin geeni allekirjoitukset.

Approaches to Pathway Analysis

Tämä tutkimus täydentää muuta työtä hyödyntäen reitin tiedot.

Tarkemmin Segal et. al. [6] määritelty biologinen moduulit ja puhdistettu ne joukon tilastollisesti merkitsevä moduuleja. He pystyivät käyttämään näitä moduuleita saada paremman näkökulman erilaisista biologisista prosesseista, jotka aktivoidaan ja deaktivoidaan erilaisissa kliinisissä olosuhteissa. Toteamme kaksi eroja, mitä esitämme täällä ja työtä Segal et. al. [6]: ensimmäinen biologinen moduuleja käytetään paperiteollisuudessa, mutta erittäin informatiivisia ja hyödyllisiä, ovat sisäisesti määritelty paperin. Määrittämiseksi geenien näistä moduuleista on peräisin saman datan, johon ne ovat myöhemmin käytetään. Kanoninen reitit käytämme ovat ulkoisesti määritelty riippumaton data analysoidaan, edustaa nykyinen käsitys alalla, eikä niitä saatu ad-hoc. Toinen, Segal et. al. eivät nimenomaisesti käyttää yhteyksien tai verkon rakenteen, joka vallitsee geenit, jotka käsittävät biologisen moduulit. Tulokset aktiivisuuden ja johdonmukaisuuden esittelemme täällä riippuvaisia ​​verkon rakenne ja erityiset suhteet (esimerkiksi esto ja edistäminen), jotka ovat piirteitä verkon tiedot.

Toinen tärkeä toimintamuoto on Rhodes et. al. [21], jossa ihmisen interactome verkkoa käytetään tunnistamaan aliverkot aktivoitu syöpä. Lähestymistapa Rhodes el. al. käyttää, toisin kuin yksi esitetään tässä, ei yritä laskennallisesti ja algoritmien korostaa eroja fenotyypit rakentamalla luokittelija noin mitattavissa verkkotoiminnot. Sen sijaan se luo aliverkot niiden yhdessä sarjaa geenien tunnistettu yli (tai alle) ilmaisua kunkin biologisen fenotyyppiin. Rhodes et. al. lähestymistapa ei hyödyntää verkon rakenne rakentaa aliverkkoon, mutta ei tee jatkokäytön tarkkailemalla ilmentäminen rinnakkain tai yhteistyössä hiljentäminen sarjaa geenejä, kuten on laita työssä esitetään tässä.

Bild et. al. [14] ja Glinski et. al. [22] osoittaa, että geeni allekirjoitukset määräytyy pieni joukko ennalta valittuun kanoninen polkuja voidaan erottaa kasvainten ominaisuuksiin. Työssään, he alkavat rajoitettu joukko väyliä, (esim. Bild et. Al. Käytetään 5 reittejä) ja osoittaa, että ne eroavat toisistaan ​​eri fenotyyppejä. Koska tämä lähestymistapa alkaa pieni joukko väyliä kirjoittajat päättivät tutkia, sillä ei ole kykyä löytää uusia koulutusjakson yhdistysten kanssa fenotyyppejä. Toisin kuin nykyinen työ, siinä ei käytetä objektiivista menetelmää tunnistaa joukko väyliä, jotka voivat syrjiä fenotyypit.

Gene joukko rikastus Analyysit [23] avulla kirjoittajat valita joukko geenejä ja määrittää niiden suhteellinen tilastollinen merkitys listan geenit, jotka erottavat fenotyypit. Gene setti rikastus alkaa lähtökohta yksittäisten geenien luokittelijoiden. Pathway jäsenyyden mitataan arvioida yhdistetyn maksuja. Jälleen menetelmä ei hyödyntää verkon rakenne, eikä se tarjoa systeemistä tilin yhdistetyn tiedon väyliä vähentää optimaalisen joukon luokittelussa prosesseja. Koska menetelmä alkaa erottelun yksittäisten geenien, se voi vain hyödyntää tätä tilastolliseen päättelyyn, ja ei selitä mitään eroja, jotka tulevat keskinäinen riippuvuus usean geenin vuorovaikutusta. Esimerkiksi, jos A-geenin näyttää permutate satunnaisesti kaksi fenotyyppiä ja geenin B näyttää permutate satunnaisesti kaksi fenotyyppiä sitten kukin geenit pisteet huonosti tilastollista merkitystä testi. Kuitenkin pisteet määritellään niiden yhteenlaskettu riippuvuus (esim. (Jos A niin B)) voi tarjota paljon enemmän syrjintää.

Menetelmä, Tomfohr, et. al. [24] on ehkä lähimpänä yksi esitetään tässä, että siinä tarkastellaan yhdistettyjä ryhmiä geenien ja riveissä niitä vastaavasti. Kuitenkin Tomfohr, et. al. Älä käytä verkon rakenne tiedon saamiseksi tulokset, mutta sen sijaan suorittaa singulaariarvohajotelma (SVD) ja valita tietyn metageeni, ja määrittää polun toimintaa kuin ilmaus tästä geenistä. Sellaisenaan, tulos ei hyödynnä keskinäinen riippuvuus verkon tekee työn edellä esitetty.

Methods

arvioiminen geenin asema:

Gene asema arvioitaessa verkossa vuorovaikutus lasketaan Havaintojen yhtenä kahden vaihtoehtoisen todetaan: alas ja ylös. Voidakseen tunnistaa, onko geeni sijaitsee ”alas” -tilaan tai ”ylös” -tilassa, katsomme sen (RMA säädetty [18]) ekspressioarvo näytteessä verrattuna ilmentymisen arvoja saman geenin kaikissa muut näytteet. Voidakseen majoittaa lukuisia todennäköisyysjakaumia, käytämme gammajakauman templaattina sekä ”alas” jakelun muodossa sekä ”ylös” jakelussa, ja uudelleen ongelma seoksena kaksi gammajakauman. Tukahdutetaan muoto noudattaa usein eksponentiaalinen jakauma, joka on yhdessä tapauksessa on gammajakauman. Mainostettu valtio noudattaa usein vastaavassa muodossa normaalijakaumaa, joka voidaan arvioida gamma jakaminen suuren keskiarvon. Per jokainen koetinsarjaa mitattuna mikrosiru, katsomme ilmaisun jakelun ja yrittää sovittaa tätä jakelua osaksi seoksen kahdesta gamma jakaumat. Teemme tämän käyttämällä odotusarvon maksimointi (EM) algoritmia, iteroimalla yli data tavalla, joka takaa kasvu todennäköisyys sovittamalla tietojen mukaan mallinnettu jakaumat. Kun kyseessä on kaksi gamma jakaumien, me ensin jakaa tietoja kahteen ryhmään: ”down” arvot ja ”ylös” arvoja. Määrä geenejä ”ylös” ryhmä on

N

U

määrä ja geenien tukahdutettu ryhmä on

N

D

. Tunnetun todennäköisyydet ovat siis:

Oletetaan kunkin ryhmän jakelee mukaan gammajakauman:

tavoitteena EM-algoritmi on antaa meille mahdollisimman-todennäköisyyden estimaatit

U, b

U

arvot edisti ryhmän sekä

D, b

D

arvot tukahdutetaan ryhmä. Lisäksi se laskee suurimman todennäköisyyden arvio seoksen kertoimien, η

1, η

2.

Oletetaan, että ekspression levinneisyys kunkin geenin joko peräisin seoksesta, kahden jakauman (yksi ”ylös” tapaus ja toinen ”alas” tapaus) tai yhdestä jakelu (esimerkiksi silloin, kun geeni on ”ylös” kaikissa näytteissä meillä on). Me määrittää, kuinka monta taustalla jakaumat (yksi tai kaksi) käyttämällä EM-algoritmia yhdistettynä mallin valintatapa, katso alla.

Saat suurimman tukin todennäköisyyttä, meidän täytyy löytää maksimia lisätoimintokortit

Q

[25]: whereHere,

θ

on kokoelma parametreja, jotka määrittävät jakelun, ja yläindeksi 0 nimeää suuruudet, jotka oli määritelty edellisessä iteraation.

Saat maksimit, me erottaa

Q

suhteen mallin parametrien ja verrata zero.And coefficientswhere Ψ (

x

) on psi toiminto.

käyttämällä Lagrangen kertoimet sisällyttää pakon meidän täytyy maksimoida tavoite functionwith suhteen

η

i

, me deriveand obtainWe ratkaista numeerisesti (käyttäen MATLAB) jokaisessa iteratiivinen vaiheessa, kunnes saavuttavat joitakin ennalta lähentymiskriteeri.

valinta optimaalinen määrä jakaumat:

on selvää, että enemmän jakaumat otamme kuin meidän pohjalta yleisestä jakaumat, sitä paremmin sopivaksi meillä on tietoja ja parempi todennäköisyys on. Ajatellaanpa esimerkiksi, kuten monet jakaumat kuin on datapisteitä. Joka sopisi tiedot tarkasti ja tuottaa maksimaalinen todennäköisyyttä. Tämän ongelman ratkaisemiseksi ja pystyä valitsemaan optimaalinen määrä, vertaamme mallit, joissa on eri määrä jakaumat käyttämällä Bayes Information Criterion (BIC) [26], laskettu asThis kustannusfunktio kompensoi lisäkorotus monimutkaisuutta. Tilastollisen mallin valittu on yksi suurimmista BIC.

Laske Ja samoin: Mutta tarvitsemme todennäköisyys olemisen ”tukenut” tilassa erityinen ilmaus arvo: Ja sincewe voi saada tarvittavat arvot: esimerkiksi geenin ilmentymistä CDKN1A että aineisto [13] (kokoelma 698 kasvainnäytteestä) tämän jälkeen jakelu (katso kuva 1):

ylös /alas vaatii geeni valtiot perustuvat ekspressioarvo luokiteltu asuvat yhdessä kahden erillisen jakaumat.

kaksi erillistä jakaumat (alas ja ylös) ovat ilmeisiä ja algoritmi antaa parametrit kaksi gamma jakaumat.

Pathway aktiivisuus ja polku johdonmukaisuus

Pathway johdonmukaisuuden pisteet: Voit selvittää reitin johdonmukaisuutta pisteet tietyn signalointireitin näytteessä, me seuraavasti:

Jokainen polku on kokoelma vuorovaikutusta. Input geenit ja ulostulo geenit määrittävät jokaisen vuorovaikutuksen. Kunkin vuorovaikutus koulutusjakson, me ensin katsoa tulo geenit ja määrittämään, kunkin tällaisen geenin todennäköisyys ollessa ”alas” tai ”ylös” -tilaan (katso ”geeni tila” yllä) B

sitten määrittää todennäköisyys materialization erityisen vuorovaikutuksen koska yhteinen todennäköisyys kaikki tarvittavat komponentit (geenit) B

Seuraavaksi katsomme molekyyli- tuotoksen vuorovaikutusta. Yleensä tämä ulostulo on luettelo geenejä, josta meillä vahvistaa todennäköisyyttä ollessa ”alas” tai ”ylös” -tilaan (katso ”geeni tila” yllä) B

Seuraavaksi laskemme todennäköisyys ulostulo geeni (t) on yhdessä kahdesta tilasta, alle vaaditun todennäköisyys vuorovaikutuksen (laskettuna (b)) b

Lopuksi saada koulutusjakson johdonmukaisuus pisteet, laskemme johdonmukaisuutta pisteet jokaisen vuorovaikutuksen että polku ja keskimäärin tulokset kaikkien vuorovaikutuksia, joille pystyimme saada pisteet. Kuviossa 2 me osoittavat esimerkiksi laskettaessa konsistenssi vuorovaikutuksen otettu polku ”Signaling välittämiä tapahtumia Stem cell factor receptor (c-Kit)”, joka on yksi NCI-Nature Kuratoidut tapoja valmistaa Pathway Interaction Database (PID ) [27]. Erityiset vaiheet laskea johdonmukaisuus tässä esimerkissä ovat:

Muodosta todennäköisyyksiä kaikkia geenien vuorovaikutukseen. Tämä tapahtuu vaiheiden mukaisesti kuvattu alla (katso ”geeni tila” -osiossa). Arvot saadaan ovat: P (CREBBP) = 0,95; P (STAT5A) = 0,8; P (KIT) = 0,7

Laske yhteinen todennäköisyys aktiivisen vuorovaikutuksen. Koska tulo molekyylien vuorovaikutus eivät ole co-riippuvainen, yhteinen todennäköisyys vuorovaikutuksen on P (CREBBP) × P (STAT5A) = 0,95 x 0,8 = 0,76

Laske todennäköisyys, että lähtö molekyyli on Tämän vuorovaikutuksen tuloksena. Koska molekyyli on yksinomaan riippuvainen vuorovaikutus todennäköisyys on yksinkertainen:

Iteroi tämä laskenta kaikissa vuorovaikutusten kautta. Lopullinen pistemäärä koulutusjakson on keskiarvo kaikkien vuorovaikutusten.

signalointia pistemäärä on keskiarvo yli toiminnan vuorovaikutukset polun. Esimerkiksi edellisessä esimerkissä, vuorovaikutus aktiivisuus on 0,76. Tärkein etu laskettaessa polku toimintaan päälle koulutusjakson koostumukseltaan on, että toiminta voidaan laskea, vaikka ei ole riittävästi tietoa työskennellä tuotos, kuten on laita esimerkiksi silloin, kun vuorovaikutus perustuu aktivoimalla tai muuttamalla molekyylien ilman sukupolven uuden molekyylin tuotanto. Tällöin voimme vielä laskea aktiivisuutta, vaikka johdonmukaisuus menettää merkityksensä.

Katso menetelmät lisätietoja.

Valitsemalla vähimmäismäärää väyliä luokitella fenotyyppiin

Koska saamme signalointia ja yhdenmukaisuuden tulokset kunkin reitin, pystymme muuntamaan edustuksen kunkin bio-näyte luettelosta geenin ilmentymisen mittauksen osaksi romaani esitys, näytetään jokaisen näytteen keräämisen signalointia ja johdonmukaisuus tulokset. Koska käytämme tätä edustusta erottaa fenotyyppejä, haluamme löytää minimaalinen joukko väyliä tulokset joka pystyy tekemään eron fenotyyppinen luokkiin. Käytämme ominaisuus valikoima valita optimaalinen vähimmäismäärää (katso tulokset). Käytimme erilaisia ​​menetelmiä piirreirrotuksen ja ominaisuus luokittelun [28], [29], mukaan lukien eteenpäin valinta, taaksepäin valinta, ja kelluva hakuun [29]. Nämä menetelmät auttaa poistamaan koulutusjakson tulokset, jotka eivät edistä tehdä ero ja korostamalla tiettyjä reittejä, jotka yhdessä optimaalisesti luokitusta nopeudella.

Pathway metrinen ennustaa lopputulosta

edustaa kukin bio-näytteen avulla sen polku mittarit avulla voimme etsiä kuvioita kokoelma polkuja. Käyttämällä klusterointialgoritmeja, näemme, että polku metrimittoja eristää näytteistä ryhmiin. Jos katsomme selviytyminen malleja näiden ryhmien, näemme, että joissakin tapauksissa ja joidenkin polkuja, ryhmät korreloi selvästi kuvioita säilymiseen.

Tulokset

analyysi soveltaa tässä kohtelee polku verkostona geenit, joiden vuorovaikutuksia loogisesti arvioidaan koulutusjakson yhteydessä tuottaa suhdesarjoja. Biologinen polku rakenne tiedot on saatu julkisista lähteistä [27], [30], [31].

Jokainen polku arvioidaan johdonmukaisuuden ja toimintaa. Polku johdonmukaisuus pisteet lasketaan keskiarvo todennäköisyys loogisen johdonmukaisuuden kokoelma vuorovaikutusten koska laskettu valtioiden geenien (katso menetelmät). Polku aktiivisuus pisteet lasketaan keskiarvo todennäköisyys koulutusjakson yksittäisten yhteisvaikutuksia on aktiivinen annettiin laskettu geenin valtioissa. Käyttämällä perusperiaatteet koneen ohjattu oppiminen [28], [29] luokittelua algoritmin, joka erottaa kunkin onkogeeniset fenotyyppiä (esim. Syöpä näyte jae normaali) tuotettiin ja validoitu. Perustuen yksinkertaisuus ja vertailukelpoisuuden vaihtoehtoisten lähestymistapojen testattu, Bayes lineaarinen erotteluanalyysi luokitin käytettiin.

Ensin luokitus algoritmi johdettiin erottamaan erilaisia ​​syövän fenotyypit normaaleista fenotyyppi kudoksista. Luokittelija johdettu 1800 näytteestä opetusjoukolla (10-kertainen validointi) osoitti 98% onnistuminen riippumaton validointitestiä joukko 211 näytettä (katso kuva 3 ja taulukko 1).

Jokainen paneeli kuvassa vastaa erilaisen fenotyypin ero, mukaan paneeli kuvatekstit. Vaaka-akselin kussakin paneelissa vastaa yksiulotteinen projektio laskettu luokittelun algoritmin, joka merkitsee välinen etäisyys biologisia näytteitä, mukaan moniulotteiseen reitin mittareita. Pystyakselilla on värinää hajonta näytteistä mahdollistaa selkeän kuvan erottaminen.

Koska lineaarinen luokittelijoiden kääntää jokaisen koulutusjaksojen ongelman osaksi muuttujan luokittelija, se on mahdollista ominaisuus analyysi tunnistaa osajoukot luokittelijan muuttujat (polkuja) että, ryhmänä, erottaa fenotyypit suurella tarkkuudella. Ominaisuus valinta käytettiin tunnistamaan joukko osoittaa optimaalista 98% tarkkuudella alkuperäisestä luokituksen validoinnissa näytteen analysointia. Se koostuu aktiivisuuspisteytykset kuusi reittejä: trkA Pathway, DNA Damage koulutusjakson Ceramide Pathway, Telomerase Pathway, CD40L Pathway ja Calcineurin Pathway.

Syöpä on sairaus suuri fenotyyppisten ja molekyylien heterogeenisyys. Jopa tietyssä elimessä sivusto, fenotyyppinen heterogeenisyys liittyy merkittäviä eroja syövän lopputulokseen. Sen vuoksi lisäkoron tunnistaa molekyyliprosessien että taustalla fenotyyppisen eroja ja että ennustaa lopputulos. Siksi johdettu allekirjoitusta erilaisia ​​alatyyppejä rintasyöpään. Näitä alatyyppejä ovat: histologinen (Elston laadut 1 vs. 3, tai asteet 2 vs. 3); P53 tila (mutatoitunut /villityyppi); estrogeenireseptoripositiiviset /negatiivinen tila (ER +/-); ja progesteroni reseptorin positiivinen /negatiivinen tila (PRK +/-). Suorituskyky luokittelijoiden näkyy kuvassa 3. Kaikissa tapauksissa luokittelijoiden jossa pieni joukko väyliä (kolmesta kuusi) saavuttaa korkean tarkkuuden (83%: sta 95%). Taulukossa 1 on esitetty eri reitin ryhmien luokitella eri fenotyyppejä.

vieressä arvioitiin kykyä syövän alatyypin erityisiä allekirjoituksia osittaa 236 rintasyövän näytteiden tuloksista. Sen jälkeen valvomatta ryhmittely syöpänäytteissä käyttäen reittejä tunnistettu edellä, Kaplan Meier analyysit suoritettiin (kuva 4). Kolmessa tapauksessa, yksi väylä alatyypin allekirjoitus merkittävästi ennustettu tulos: vuorokausirytmin polku, mistä luokka 1/3 allekirjoituksen (P = 2.9E-11); Sonic Hedgehog-reitin, mistä luokka 2/3 allekirjoituksen (P = 4E-8); ja agriini in postsynaptisiin erilaistuminen, mistä P53 allekirjoitus (P = 4.6E-7). Kolme reittejä PGR +/- allekirjoituksen erotteli näytteet kahteen ryhmään, joiden P-arvo 0,0001, jossa Bone Remodelling koulutusjakson kirjanpito suurimman vaikutuksen. Lisäksi viisi reittejä ER +/- allekirjoituksen erottaa näytteet kahteen ryhmään, joiden P-arvo on 0,004, ja SREBP reitti osuus suurin vaikutus.

(A) (1) Kaplan -Meier selviytyminen juoni rintasyöpäpotilaiden välillä [15] ryhmiteltynä klustereiden perustuu signalointia. Paneeli (2) (A) esittää aktiivisuutta pisteet Sonic hedgehog-reitin värillinen mukaan kuuluminen jompaankumpaan vastaavasti värillinen eloonjäämiskäyrien in (1); (B) Sama analyysit tehdään rintasyöpäpotilaiden välillä [15], joka perustuu reitin luun (ks tekstissä reitin valinta). (C) Kaplan Meier selviytymisen tontteja keuhkosyöpään potilaan tietoja [17] ryhmiteltynä aktiivisuutta Csk reitin ja (D) NFKβ kautta. Jokaisessa paneelin (2) ala-paneelissa näkyy vaikutusvaltaisin polun metriikka pois ryhmän kerrostamiselimen polkuja. Tämä ei tarkoita, että polku edustaa vastaa koko erottamista kahteen ryhmään.

On tärkeää huomata, että useat havainnot kirjallisuudessa esiin itsenäisesti meidän koulutusjakson analyysi rintasyövän näytteet. Koska on tärkeää, että ER +/- ero hallinnan rintasyöpään on vakiintunut, me katsoimme jokaisen näistä alaryhmien erikseen. On havaittu [32], että trkA Pathway (tunnistettu sekä geneerisiä onkogeeninen allekirjoitus ja luokka 2/3 allekirjoitus) on merkittävä rooli ER- tapauksissa. Meidän analyysi osoittaa, että geneerinen onkogeeninen allekirjoituksen erottaa ER- näytteet kahteen ryhmään (P = 4.6E-9), trkA reitti osuus suurimman vaikutuksen, korkea-aktiivisten tämän reitin korreloi huonoon ennusteeseen. Samoin on havaittu [33], [34], että beeta-kateniinin on merkittävä rooli vastauksena tamoksifeeni, standardin kohtelu ER + sairaus. Analysoida luonne tamoksifeenin aiheuttama vaste, me johdettu luokittelija erottaa ER + tapauksissa, jotka oli käsitelty tamoksifeenia niistä tapauksista, joita ei ole lämpökäsitelty ja sitten käyttivät reittejä tuloksena allekirjoituksen klusterin tapauksissa lopputulos . Beta-kateniinin reitin tullut merkittävin (P = 1E-13) reitin ennustamaan lopputuloksen.

Jo pitkään on esitetty, että molekyyli luokituksia syöpä voi olla kyky ylittää elin- tai kudosspesifisiä määritelmien . Tarkemmin sanottuna se on ehdotettu, että molekyyli määritelmiä, jotka heijastavat yleismaailmallisia ominaisuudet solutyypin tai ontologian ja jotka tukevat yhteinen molekyyli etiologia voi syntyä poikki elin sivuston määritelmiä. Sen arvioimiseksi, onko allekirjoitukset havaittu edellä syöpä rintaepiteelissä voi yleistää muihin syöpiin, tutkimme heidän kykyään ennustaa fenotyyppejä keuhkojen ja paksusuolen syöpä. Käytimme allekirjoitukset, jotka on saatu rintasyöpään alatyyppien klusterin keuhkosyöpä tulokset (kuvio 4). Väylät ennustavat tulos sisälsi IL-7 Pathway (P = 0,002) ja Csk Pathway (P = 3E-11). Aiemmin on huomattava, että nämä reitit ovat sidoksissa lopputulos keuhkosyöpä [35], [36]

Lopuksi tutkimme yleisen kasvaimia synnyttävän allekirjoitus kykyä ennustaa elimen päällä tietyn tuloksen. Mielenkiintoista on, että allekirjoitus polkuja erotti 236 rintasyövän näytteet viiteen eri selviytymisen alaryhmien (P = 2E-8) ja 90 keuhkosyövän näytteet kahteen eri alaryhmään (P = 5E-17).

Keskustelu

edellä olevat tulokset osoittavat, että käyttämällä polun kuin analyysiyksikkö voi lisätä nykyisen yksittäisten geeni lähestymistapoja kartoitus fenotyypin taustalla molekyylitason prosessiin. Tavoite tunnistaminen prosessien aikaisemmin yhdistetty fenotyypit hyödyntäen genominlaajuisten aineistoja tarjoaa osittainen validointi havaitun tuloksia. Hiljattain havaittu prosessi kuvaukset ja fenotyyppejä, kuitenkin selvästi vaativat joko todentamista riippumattomista tietomääriä tai kokeellista vahvistusta.

havaintojen kautta analyysin ovat provosoivia. Monet näistä reiteistä (esim. Apoptoosin, telomere ylläpito) on aikaisemmin kuvattu yleisen osien syövän synnyn [2]. Lisäksi prosessit on tunnistettu mahdollisesti taustalla yhteinen syöpään liittyvät fenotyypit, kuten tulehdus. Mielenkiintoista, uudet reitit tunnistetaan myös osana yleistä onkogeenisten allekirjoituksen kuten esitetään kuuden väyliä kollektiivinen (esim Ceramide ja Calcineurin polkuja). Viimeaikainen kiinnostus Ceramide tukee tätä hypoteesia. Ceramide on pitkään tiedossa olevan osallisena apoptoosin [37] – [39] ja viimeaikainen työ etsii osuvuutta keramidiin syövän [40] – [42] ja syövän hoidossa [43], [44]. Samanlaisia ​​kiinnostus on kehittynyt kalsineuriinin. Kun taas kiinnostusta aiemmin vain toimintaansa immuunivaste, se on nyt tulossa tunnustettu hallitseva osallistuja kasvaimen synnyssä [45], [46]. Yhdistelmä Tästä reittejä voi määrittää keskeisiä prosesseja, jotka ovat tyypillisiä universaali kantasolujen tyyppi.

Käänteisesti polun analyysi syövän sub-fenotyypit voivat myös tarjota uusia mekanistista oivalluksia, jotka paljastavat taustalla biologia. Esimerkiksi tamoksifeenin on tehokasta hoidettaessa joissakin tapauksissa ER + rintasyöpä. Näissä tapauksissa, tamoksifeeni on vaikuttaa aktiivisuuteen vuorovaikutuksen verkkoja. Näin ollen on loogista oletuksen, että siellä on havaittavissa eroja verkkotoimintaa välillä niissä tapauksissa, joissa tamoksifeeni on tehokas ja niissä tapauksissa, joissa lääke ei ole tehokasta. Lähestymistapamme käyttää polku allekirjoituksia ennustaa varianssia lopputulokseen, joka otetaan mittana lääkkeen tehokkuutta. Me spekuloida, että lähestymistapamme voi paljastaa niihin verkkoihin, joita molemmat aktivoituvat eri tavalla vastauksena hoitoon tamoksifeenin ja tärkeää kasvaimen kasvua ja kehittymistä.

Sovellettu lähestymistapa tässä on yhtymäkohtia käyttöön geenin karttojen kääntämiseen fenotyyppien osaksi molekyyli verkkotunnus. Ensinnäkin polkumalleja edustavat toistettavia puitteet, jotka voidaan testata eri tutkimuksissa ja pidentää lisää tietoa tulee saataville. Myös reittejä ja niiden rakenne tarjoavat korkeamman asteen rakentaa arvioimiseksi rooli geenien.

Jokainen vuorovaikutus polku edellyttää panos useiden geenin havaintoja. Jokainen yksittäinen geeni aktiivisuuden taso vaikuttaa vain yhteydessä muiden osallistuvien geenien vuorovaikutuksen prosessin sisällä verkkoon. Tästä on osoituksena se havainto, että emme voineet johtaa tehokkaaseen luokittelijoiden, suoraan geeni-tila-arvojen vuoksi (geenit säveltää tärkein kuusi polkuja).

On myös mielenkiintoista, että viisi kuudesta reittejä käytämme luokitella normaalin ja kasvaimen näytteet muodostavat yhden yhdistetyn verkon (kuvio 5, telomeraasin reitti pysyy kytkemättä). Tämä yhteenliittäminen saattaa tarjota uusia mahdollisuuksia kehittää interventioita. Tieto yhteydet voivat ehdottaa vaihtoehtoisia tavoitteita, jotka olisi useita reitin vaikutuksia. Vähän, se voi sallia tunnistamisen monimutkaisuutta liittyy kohdistinvalinta ennen intervention suunnitteluun.

liittyi reitit väri jaettu solmuja.

On selvää, että probabilistic luokittelu geenejä vaihtoehtoisia tiloja alas ja ylös on yksinkertaistaa huomattavasti monimutkaisempia malleja geenin käyttäytymistä ja toimintaa. Kuitenkin empiirinen arviointi havaitun datan toteaa geeniekspressiomalleja yleisesti mahtuu yksi kahden vaihtoehtoisen ekspressiotason jakaumat. Lisäksi tällainen yksinkertaistaminen on osoittautunut arvokkaaksi muilla tutkimusaloilla. Esimerkiksi yksinkertaistaminen että abstraktit digitaaliset logiikka taustalla jatkuvan virtauksen elektronien piirit on mahdollistanut laitteiden suunnittelussa on häkellyttävän monimutkaisia ​​toimintoja [47].

On selvää, että nykyinen tietämys biologinen reittejä on epätäydellinen ja epätäydellinen. Sinänsä prosessit tunnistettu lähes varmasti ole ainoa vaikuttavia tekijöitä fenotyypit kiinnostusta. Kuitenkin, jos prosessit on tunnistettu, ne toimivat tärkeinä tavoitteita lisätutkimuksia. Lisäksi prosessi lähestymistapa mahdollistaa yhden erottaa mikä komponenttien monimutkaisia ​​verkostoja, joissa geenit osallistuvat differentiaalisesti osaltaan fenotyypin kiinnostava. Sekakäyttö toiminnan ja johdonmukaisuuden pisteet sallii syrjinnän prosessien aktivoitu, koska fenotyypin verrattuna joiden logiikka vaihtelee fenotyyppejä. Jälkimmäinen (johdonmukaisuus), mahdollisesti on syy johtuu fenotyyppi ja ehdottaa ehdokasta, jotka ovat muuttuneet. Kuitenkin hyödyntämällä geenien ilmentyminen tietojen johdonmukaisuus tulokset voidaan lasketaan yhteisvaikutukset transkriptio tapahtumia, rajoittamalla niiden erottelukykyä.

Vastaa