PLoS ONE: Clinical arvo Prognoosi Gene Expression allekirjoituksista kolorektaalisyövässä: järjestelmällinen katsaus

tiivistelmä

Johdanto

Perinteinen pysähdyspaikkojen järjestelmä on riittämätön tunnistamaan ne potilaat, joilla on vaiheen II peräsuolen syöpä (CRC) on suuri riski toistumisen tai vaiheen III CRC vähäinen riski. Useita geeniekspression allekirjoitusten ennustaa CRC ennuste on ehdotettu, mutta mikään käytetään rutiininomaisesti klinikalla. Tavoitteena työ oli arvioida ennustuksen kyky ja mahdolliset kliiniset hyödyllisyyttä allekirjoituksista sarjassa riippumaton aineistojen.

Methods

kirjallisuuskatsauksen tunnistettu 31 geeniekspressiota allekirjoituksia käytetään geenien ilmentymisen data ennustaa ennusteen CRC kudoksessa. Haku perustui PubMed tietokantaan ja rajoitettiin julkaistuista tammikuusta 2004 joulukuun 2011 Yksitoista CRC geenin ilmentymisen mittausmuistien tulokseen tietoa tunnistettiin ja ladata julkisista arkistot. Random Forest luokittelija oli tarkoitus rakentaa ennustavia geenistä luetteloista. Matthews korrelaatiokerroin valittiin mittana luokittelun tarkkuutta ja siihen liittyvän p-arvon avulla arvioitiin yhdessä ennusteeseen. Kliinistä hyödyllisyyttä arviointi, positiiviset ja negatiiviset jälkeinen testejä todennäköisyydet laskettiin vaiheessa II ja III näytteitä.

Tulokset

Viisi geeni allekirjoitukset osoittivat merkittävää yhteyttä ennusteeseen ja antavat riittävän ennustetarkkuus omassa koulutus aineistot. Kuitenkin kaikki allekirjoitukset oli pieni toistettavuus riippumatonta tietoa. Kerrostunut analyysit vaiheelta tai mikrosatelliittien epävakaus tila osoitti merkittävää yhteyttä mutta rajoitetusti syrjintää kyky, erityisesti II vaiheessa kasvaimia. From kliininen näkökulma, kaikkein ennustavan allekirjoitukset oli pieni mutta merkittävä parannus klassisen lavastus järjestelmä.

Johtopäätökset

Julkaistut allekirjoitukset osoittavat alhaiset ennusteen tarkkuutta, mutta kohtalaisia ​​kliinisiä hyödyllisyyttä. Vaikka geeniekspression data voi ilmoittaa prognoosi, parempi strategioita allekirjoituksen validointi riittävät edistämään niiden laajan käytön klinikalla.

Citation: Sanz-Pamplona R, Berenguer A, Cordero D, Riccadonna S, Solé X, CROUS -Bou M, et al. (2012) Clinical arvo Prognoosi Gene Expression allekirjoituksista kolorektaalisyövässä: järjestelmällinen katsaus. PLoS ONE 7 (11): e48877. doi: 10,1371 /journal.pone.0048877

Editor: Wayne A. Phillips, Peter MacCallum Cancer Centre, Australia

vastaanotettu: toukokuu 30, 2012; Hyväksytty: 02 lokakuu 2012; Julkaistu: 07 marraskuu 2012

Copyright: © 2012 Sanz-Pamplona et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä tutkimus tukivat Euroopan komissio myöntää FP7-COOP-Health-2007-B HiPerDART. Myös Instituto de Salud Carlos III avustuksia (FIS PI08 /1635, FIS PI08 /1359 ja FIS PI09-01037), CIBERESP CB07 /02/2005 Espanjan Association syöpää vastaan ​​(AECC) Tiedesäätiö, ja Katalonian hallitus DURSI apurahan 2009SGR1489 . Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

peräsuolen syöpä (CRC) on kolmanneksi yleisin syöpä maailmassa ja toiseksi suurin syy syövän kuolemaan. Viime vuosikymmeninä, ilmaantuvuus on kasvanut, kun taas kuolleisuus on hitaasti laskenut [1]. Merkittävä piirre CRC on ero ennusteen aikaisin ja loppuvaiheissa tauti: vaiheen I ja II on kohtalainen riski taudin uusiutumisen jälkeen kirurgisen resektion, kun taas potilailla, joilla on vaiheen III on suurempi mahdollisuus toistumisen [2]. Tunnustettu kliiniset riskitekijät uusiutumisen ovat hätä esitys, huonosti eriytetty kasvain, syvyys kasvaimen invaasio, ja vieressä-elimet (T4) [3] – [5]. Nämä tekijät eivät riitä tunnistamaan ne potilaat, joilla on vaiheen II CRC suuri riski toistumista ja taka etäpesäke tai ne potilaat, joilla on vaiheen III CRC vähäinen riski [6], mikä potentiaali alle-hoitoa tai over-hoito [3].

Colon syöpäsolujen leviämiseen on tiukasti säännelty prosessi, joka vaatii poikkeamia geenien ilmentyminen mahdollistaa syöpäsolujen edetäkseen eri vaiheet, kunnes ne asuttaa kaukainen elin [7]. Todennäköisesti muutokset ovat tarpeen toistuminen ovat jo läsnä ensisijainen paksusuolen syöpä, jonka pitäisi mahdollistaa tunnistaa ennustetekijöiden allekirjoituksista [8] – [10]. Gene-ilmentyminen profilointi perustuvissa määrityksissä ovat olleet menestyksellisiä ennustetyövälineenä rintasyövässä [11], [12]. Kuitenkin, ei allekirjoitusta on hyväksytty rutiininomaisessa kliinisessä käytännössä CRC huolimatta suuri määrä geeniekspressioprofilointi tutkimuksia ennusteeseen ei ole tehty.

Tämän työn tarkoituksena oli testata ennustava kyky näiden julkaistu allekirjoitusten ennustetekijöitä merkkiaineiden huomattava määrä riippumattomia aineistoja, jotta ymmärtää niiden vahvuudet ja heikkoudet ja tunnistaa, jos jokin niistä voidaan käyttää kliinisesti ohjaamaan päätöksiä adjuvanttihoito potilaille vaiheen II tai III CRC.

Materiaalit ja menetelmät

Julkaistu Gene Expression allekirjoitukset ja validointi Tietoaineistot

systemaattinen kirjallisuuskatsaus tehtiin tunnistaa tutkimuksista, joissa käytettiin geenien ilmentyminen tietojen ennustaa ennusteen CRC [13]. Haku perustui PubMed tietokantaan ja rajoitettiin viime paperit kasvavan voimassaoloa (tammikuusta 2004 joulukuu 2011). Tiedostot S1-S2, taulukko S1 ja kuvio 1 yksityiskohtaisesti selektioprotokollaa ja PRISM tarkistuslista. Artikkelit säädettyä luettelon ilmentyvät eri geenien primaarikasvaimen näytteissä liittyy CRC ennusteeseen olivat mukana tutkimuksessamme. Me erotuksetta viitata näihin luetteloihin geenejä allekirjoitukset ”tai” profiileja ”. Tutkimukset perustuvat kudosten microarray ja ne, jotka yksinomaan keskittyivät eroja vaiheiden välillä tai primaarikasvaimen ja etäpesäkkeitä jätettiin pois. Tutkimukset lopuksi mukana analyysi on kuvattu taulukossa 1 [14] – [43]. Julkisesti saatavilla aineistoja kanssa koko genomin geenin ilmentymisen toimenpiteitä CRC primaarikasvaimen näytteet tunnistettiin ja ladata GEO [44] ja ArrayExpress [45] microarray tietovarastojen (taulukot 2 ja 3). Esikäsitellyt sarjan matriiseja alun perin tekijät käytettiin analyysimme.

Koska eri alustoilla ja piirre tunnisteet käytettiin allekirjoituksia ja geeniekspression aineistot, käännös viralliseen Gene Symbol tehtiin, jotta yhteinen merkintä. Tämä käännös suoritettiin käyttäen Universal Protein Resource merkintä tietokantaan [46], online-varasto Hugo Gene nimikkeistökomitealle [47] ja siru merkintätiedostoja päässä Affymetrix verkkosivuilla [48]. Väistämättä, ei löytynyt joitakin piirteitä joissakin aineistot ja ne katosivat myöhempää analysointia varten (File S3).

Tilastollinen analyysi

Koska seuranta-aika ei ollut käytettävissä useimmissa aineistot, binäärinen tulos määriteltiin ennuste tila (taulukko 2). Aina kun mahdollista, vähintään kolmen vuoden seurannan aikana oli tarpeen potilailla ilman kasvaimen uusiutumisen. Kuitenkin kaksi aineistoja ilman seurata tietoja sisällytettiin (GSE5206 ja GSE10402) lisäämään otoksen kokoa. Vaihe IV yksilöt olivat mukana analyysissä toistuminen tapahtumia kuin se oli odotettavissa, että erityinen ilmaus muutoksia köyhien prognostisten näytteet säilyvät muuttumattomina primaarikasvaimen kun etäpesäkkeiden on tapahtunut. Kun tiedot oli saatavilla, Alaryhmäanalyysissa suoritettiin olevat vaiheen ja microsatellite epävakauden tila (MSS /MSI).

Jokainen allekirjoitus kykyä ennustaa ennuste oli testattu riippumattomasti kussakin aineisto Binäärisellä luokitus lähestymistapaa käyttäen

Random Forest

ensemble luokittelijan (RF) [49], [50]. Metsät kasvatettiin suuri määrä puita (5.000), jotta voidaan varmistaa out-of-pussin virhe lähentyminen. Vähimmäiskoko terminaali solmut asetettiin yhteen. Allekirjoituksia arvioinnin tarkkuus toimenpiteitä laskettu 10-kertainen ristivalidointi (10CV) prosessi, jossa väliseinät stratifioitiin perustuvat tuloksen. Sisäkkäisiä tässä prosessissa, määrä ehdokkaan muuttujien kunkin jakaantuneen valittiin minimoimaan out-of-bag virhe. Kuten ehdotetaan [51], alinäytteenottoyksiköstä toteutettiin ilman korvaamista ja käyttäen samoja havaintojen määrä kussakin ennusteeseen ryhmässä (0,632 kertaa taajuus pienin ryhmä). Puutteen vuoksi tasapainon tuloksista ryhmissä joissakin aineistoja, RF osoitti suuntaus mieluiten luokitella osaksi yleisin ryhmä. Tämän korjaamiseksi artefakti, luokitusta äänestys cutoff muutettiin mukaan vastaavan ennusteen ryhmän taajuuksia. Kaikki nämä analyysit suoritettiin käyttäen R paketti randomForest [52].

Vahvista tuloksemme, säteittäinen ydin Support Vector Machine (SVM), joka luokittelija käytettiin myös [53], [54]. Johtuen epätasapaino, samalla artefakti edellä kuvattu havaittiin sovellettaessa vaatimuksia SVM luokittelija. Joten, yritimme korjata sitä käyttämällä alle-näytteenottostrategiaa seuraavasti [55]: i) valita kaikki näytteet harvemmin ryhmä; ii) valita satunnaisesti sama määrä näytteitä useammin ryhmä; iii) toista prosessi 25 kertaa; iv) määritellä ennustettu tarrat tuloksesta ryhmän taajuuksia äänestää suhteessa raja luokittelua sääntö. 10CV Prosessi suoritettiin laskea tarkkuus toimenpiteitä sisäkkäisiä 10CV parametrien viritys, molemmat kerrostunut jonka lopputulos ryhmiä. Monenlaisia ​​arvojen kustannusten ja radial ytimen parametreja arvioitiin virityksen aikana (20 yhtä kaukana arvot 0,001-1,000 vuonna logaritmi mittakaavassa; 11 tasaisin arvot vaihtelevat 0,05 ×

p

20 ×

p

, joka

p

useita ominaisuuksia kussakin tapauksessa). Kaikki nämä analyysi tehtiin kanssa R paketti

svmpath

[56].

Matthews Korrelaatiokerroin (MCC) [57] valittiin mittana luokitustarkkuudesta [58]. Tämä indeksi yhdistää testi herkkyys ja spesifisyys. Se vaihtelee -1-1 ja sen tulkinta on samanlainen kuin Pearsonin korrelaatiokerroin. Yhteydessä luokittelun ongelma on odotettavissa, että MCC vaihtelee 0 (ei ennustaminen kyky ollenkaan) ja +1 (täydellinen ennustaminen) negatiiviset arvot lähellä nollaa mahdollisesti esiintyvät satunnaisesti luokittelijoiden johtuen näytteen vaihtelu. MCC-arvot ovat alle 0,3 voidaan pitää osoituksena alhainen ennustearvo koska ne vastaavat alle 65% tarkkuudella tasapainoisessa tietoja. Herkkyys, spesifisyys ja yleinen tarkkuus hinnat laskettiin myös tulkintaa varten.

potentiaali käyttökelpoisuus allekirjoitukset kliinistä käytäntöä arvioitiin avulla positiiviset ja negatiiviset todennäköisyys tunnusluvut (LR +, lR-) ja ennustetun positiivinen ja negatiivisen testin jälkeen uusiutumisen todennäköisyydet (PPTpr, NPTpr) vaiheessa II ja III näytteet erikseen [59].

Yhteenvetona allekirjoitus globaalia suorituskykyä, kukin toimenpiteiden edellä on kerätty useista aineistoja ainutlaatuinen indeksin painoja suhteessa kunkin aineisto otoskoko. Jotta voitaisiin pienentää epävakautta ja puolueellisuudesta ristivalidointi arvioita, aineistoja, joissa on alle 10 näytettä per ryhmä ja ne, joita käytetään johtaminen profiilin alkuperäisessä tutkimuksessa suljettiin pois laskennat [60].

merkitys MCC, tarkkuus, herkkyys, spesifisyys, LR +, lR-, ja erot PPTpr ja NPTpr arvioitiin käyttäen null jakaumat 100.000 permutaatiot. Laskennat tehtiin yhteydessä teoreettinen viitekehys permutaatio testeissä [61] toteutettuna R paketti

kolikon

[62]. Välein 95% rakennettiin käyttäen Bias Korjattu ja Accelerated bootstrap (BCA) menetelmää 5,000 resamples ositettu ennuste ryhmä [63]. Empiirinen vaikutus arvot arvioitiin tavallisella jackknife menetelmällä. Nämä laskelmat tehtiin käyttäen R paketti

boot

[64]. Kaikissa tapauksissa, muunnelmia ja rs suoritettiin suoraan ennustetut arvot, jonka alkuperäinen malleja eikä remodeling tehtiin. Koska tämä strategia ei oteta huomioon riippuvuus ennusteet epäsuorasti asettamat 10CV, se voisi mahdollisesti säilyttää jonkin verran vaikutusta kieltäytyä Nollahypoteesina että tilastolliset testit kun vaikutukset ovat pieniä. [65]

Tulokset

Global ennuste suorittaminen Julkaistu allekirjoitukset

kirjallisuudesta tunnistettiin 29 paperit raportointi 31 allekirjoitusta ehdotetaan voimassa useita geeni kasvaimeen tulos luokitustyökalua (taulukko 1 ja File S4). Lähes kaikki allekirjoitukset perustuivat microarray kokeiluja lukuun ottamatta kolmea allekirjoitusta saatujen PCR kokeita (

OC10, PL10, SC09

). Määrä geenejä (allekirjoitus koko) vaihteli 3 537.

Huolimatta suosituksista tarjota raakadata microarray kokeiluja, koulutus aineistot olivat julkisesti saatavilla vain viisi allekirjoitusta:

ST09, SM09, BD07, LN07

ja

VL10

. Kuusi ylimääräistä geenin ilmentymisen aineistoja tietoa toistuminen havaittiin GEO ja ArrayExpress, yhteensä 11 aineistoja analysoitaviksi (taulukko 2).

kaikki yhdistelmät allekirjoitukset ja aineistoja, MCC ja vastaava p -arvo laskettiin. Kuviossa 2 on esitetty värikartta MCC arvojen (tarkempia tietoja File S5 ja kuvio S1). Kuten odotettua, viisi allekirjoitusta, jossa koulutus oli saatavilla osoitti merkittäviä yhdistys ja kohtuullinen ennustavan tarkkuus näiden koulutukseen aineistot (musta-kirkas soluja vasemmassa yläreunassa neljänneksessä juoni kuvassa 2). Kaikista näistä allekirjoitukset, MCC-arvot olivat suurempia kuin 0,35, paitsi

VL10

ja aineisto GSE17536 (MCC = 0,32). Kuitenkin riippumattoman aineistot suorituskyky oli heterogeeninen ja yksikään näistä viidestä allekirjoitusten voisi lisääntyä, aste ennustava kyky näkyy koulutuksessa aineistot. Kun loput 26 allekirjoitusta (niitä ilman koulutusta asetettu saatavilla) arvioitiin 11 aineistoja, saatiin samanlaisia ​​tuloksia: jotkut allekirjoitukset osoitti merkittävää yhteyttä potilaiden hoitotuloksiin mutta syrjinnän tarkkuus oli alhainen tai kohtalainen.

rivit vastaavat allekirjoituksia ja sarakkeita aineistoja. Viimeinen sarake näyttää yhdistetyssä MCC poikki aineistoja käyttäen otoskoko painoina. Mustia viivoja rajata viiden ensimmäisen allekirjoitukset joista koulutukseen aineistoja oli saatavilla (solut korostettu mustalla). Solut edustavat allekirjoituksia ja aineistoja käyttää oikeuttamaan niitä on korostettu sinisellä. Väriskaala edustaa MCC arvot: tummempi väri, sitä korkeampi MCC (katso legenda). Negatiiviset arvot romahtivat nollaan.

Globaali MCC laskettiin kunkin allekirjoituksen tiivistää niiden ennustava kyky poikki aineistot (katso kuva 2). Allekirjoitukset

BT04

ja

KN11

tullut kaikkein ennakoivaa, molemmissa MCC arvoon 0,25 (95% CI 0,19-0,31 ja 0,19-0,30, p-arvot 10

5). Vaikka lähes kaikki allekirjoitukset saavutti 5%: n merkitsevyystaso tässä pool arvioon, joka yhdistää 396 tapahtumien 1077 potilasta, vain kolme allekirjoitusta ylitä 0,20 maailmanlaajuinen MCC. Suurin arvo saatu osuus luokiteltu oikein tapauksia oli vain 63% (

BT04,

herkkyys = 65% ja spesifisyys = 61%) ja se vaihteli 52-61% jäljellä profiilien (taulukko 4, File S6).

arvioimiseksi vaikutusta tilastollisten menetelmien tuloksissa, uudelleen analyysit tehtiin käyttämällä vaihtoehtoista menetelmää (SVM). Vaikka jotkut vaihtelut allekirjoitukset sijoitusta suorituskyvyn havaittiin, samanlaisia ​​tuloksia saatiin kannalta yhdistettyä omien asiakaskeskusten (Kuva S2 ja File S7).

alaryhmäanalyysi: Ennuste suorituskyky Julkaisija allekirjoitukset stratifioituna Stage tai MSI tila

jotta voidaan arvioida allekirjoitukset ”onnistumisesta tietyillä alaryhmiä kasvaimia, on kerrostettu analyysi tehtiin mukaisesti (vaihe II /III vaihe) ja microsatellite epävakaus tila (MSS /MSI), kun nämä tiedot oli saatavilla ( katso taulukko 3). Aineistot vaikuttavat vähemmän kuin 10 tapahtumaa jätettiin pois.

Samanlainen analyysi, mukaan lukien kaikki näytteet, suorituskyky allekirjoitusten oli heterogeeninen, kun vaiheen II ja III kasvaimen näytteet analysoitiin erikseen (kuviot S3 ja S4) . Yhdistettyihin MCC, 17 allekirjoitusta vaiheessa II ja 22 allekirjoitusta vaiheessa III osoitti merkittävää yhteyttä ennusteeseen (p-arvo 0,05). Kuusi allekirjoitukset sijoittui kärkikymmenikköön molemmissa osa-analyysejä. MCC saadut arvot vaiheessa II olivat paljon pienemmät kuin vaiheen III. Toisessa vaiheessa, paras globaali MCC saavutettiin

YM06

(MCC = 0,21; 95% CI +0,11-0,31) ja

BT04

(MCC = 0,20; 95% CI 0,10-0,31) . Vaiheessa III, kaksi parasta allekirjoitukset olivat

AJ08

(MCC = 0,42; 95% CI +0,28-0,55) ja

VL10

(MCC = 0,40; 95% CI 0,23-0,55). Taulukko 4, Files S5, S6 ja S7; ja kuviot S3, S4, S5, S6, S7 ja S8 sisältävät lisätietoja.

MSI tila oli olemassa vain kaksi aineistoja (GSE13294 ja GSE18088). Analysointiin MSS näytteiden ne MCC arvot saavutettu merkitys oli kohtalainen (+0,19-,38) ja vain kolme allekirjoitusta osoitti yhdistys molemmissa aineistot (p-arvo 0,1). Mitä MSI osajoukko, vain allekirjoitus

HO09

edellyttäen kohtuullisen luokitustarkkuudesta (MCC = 0,30) (File S5).

Potential Clinical arvo Allekirjoitukset vaiheessa II ja III kasvaimet

huolimatta alhaisesta syrjintä kyky (osoittaman yhdistettiin MCC), allekirjoitukset voi silti olla käyttökelpoisuus kliinisessä työssä. Lyhyesti, hyödyllinen kliininen koe näyttää yleensä suuria LR + ja alhainen lR- joka kääntää enemmän diskriminantti testin jälkeen tapahtuma todennäköisyydet: korkea PPTpr ja alhainen NPTpr verrattuna

a priori

odotettavissa tapahtuma suhteessa. Joten, vaikka testit alhainen syrjintää kyky mukaan puhdasta tilastotieto kriteerit voivat vielä olla käyttökelpoinen kliinisessä käytössä, jos PPTpr ja NPTpr ovat merkittävästi tarpeeksi kaukana todennäköisyys odotettavissa väestön kun mitään Testi suoritetaan. Tutkia tätä asiaa, positiiviset ja negatiiviset testin jälkeen todennäköisyydet toistumisen laskettiin vaiheiden II ja III. Tunnetun toistuminen riski potilailla, joilla on CRC oletettiin 20% toisessa vaiheessa ja 34% vaiheessa III [4], [66].

Saat parhaat allekirjoituksen vaiheessa II (

YM06

), post-testi toistumisen todennäköisyys, että korkean riskin ryhmään nousi 28%, ja että matalan riskin ryhmään ennuste oli 12% todennäköisyys toistumisen (16% absoluuttinen ero, kuvio 3A). Paras profiili vaiheen III (

AJ08

) kasvoi 56% testin jälkeen todennäköisyys toistumisen varten korkean riskin ryhmään, kun taas testin jälkeinen todennäköisyys oli 18% matalan riskin ryhmässä (38 % absoluuttinen ero, kuvio 3B). Yksityiskohtaiset tulokset kaikkien allekirjoitukset näkyvät tiedostot S6 ja S7.

yleisyys todennäköisyys toistumisen vaiheessa II ja III oletettiin olevan 20 ja 34% vastaavasti. Allekirjoitukset on lueteltu alenevassa järjestyksessä jälkeisten testien todennäköisyys eroja.

Keskustelu

tunnistaminen molekyyli ennustetekijöiden helpottavia välineitä hoitopäätöksiä on tärkeä askel yksilöllisen potilaan hoito [10] . Kirjoittajat raportoivat perinpohjainen julkaistu monen geenin ennustetekijöiden luokittelijoiden kolorektaalisyövässä, analysoimalla niiden ulkoinen pätevyys on suuri määrä riippumattomia aineistoja yhteensä yli 1,000 potilasta. Tässä työssä on keskittynyt kaksi tavoitetta, joita tarkoitetaan kahta pääosat analyysi: arvioida globaalin suorituskykyä allekirjoitukset tilastollisesta näkökulmasta, jossa kaikki vaiheet olivat mukana, ja arvioida niiden mahdollista kliinistä käyttökelpoisuutta, rajattu vaiheen II ja III CRC potilaita, asianmukaisin tarkkuus toimenpiteitä (testin jälkeen todennäköisyydet).

meta-analyysi geeniekspressioprofiilien II vaiheessa CRC on aikaisemmin raportoinut Lu

et al.

[67]. Tässä tutkimuksessa lupaavia tuloksia on raportoitu koskien ennakoivaa tarkkuutta, mutta analyysi rajoittui samoja aineistoja ja ennusteet käytetty alkuperäisessä tutkimuksessa. Tietääksemme, meidän tutkimus on ensimmäinen meta-analyysissä, jossa ennustamisen tarkkuutta monta allekirjoitusta mitataan suuri joukko riippumattomia CRC näytteiden arvioimiseksi ulkoisia pätevyyttä ja niiden jälkeen mahdollisten käyttökelpoisuutta klinikoilla.

Mitä maailmanlaajuinen suorituskyky, tuloksemme osoittavat, että heidän koulutuksensa aineisto, useimmat allekirjoitukset oli merkittävää yhteyttä ennustetta ja voisi kohtuudella ennustaa. Kuitenkaan yksikään allekirjoitusten tyydyttävästi, kun ennuste kykyä arvioitiin riippumattomien aineistoja. Paras yhdistettiin MCC oli 0,25 (

BT04

), jotka tulisi ottaa huomioon alhainen luokitus arvo. Vertailua vaihe tarjoaa MCC 0,23 (tietoja ei esitetty).

Seuraavaksi keskityttiin erityistä suorituskykyä allekirjoitusten vaiheen II ja III potilaat, jotka hyötyisivät enemmän tarkkaa ennustetta ennusteen vuodesta adjuvanttihoitoa voitaisiin räätälöidä niiden ennustettu uusiutumisen riskiä. Vaikka yhdessä lopputulokseen havaittiin 17 allekirjoitusta vaiheessa II, niiden ennustava kyky voidaan pitää vain köyhiä tilastollisesti tarkasteltuna. Muuten MCC arvot vaiheen III havaittiin olevan lähes kaksinkertainen kuin vaiheessa II. Kuitenkin vain kahdeksan allekirjoituksia saavutti 0,30 yhdistettiin MCC arvo, pidetään osoituksena kohtalainen ennustearvoa.

Vaikka huonoja tuloksia havaittiin kannalta luokittelun tarkkuutta, melkein kaikki profiilit (30) osoitti merkittävää yhteyttä ennuste kun testattu riippumaton aineistot (p-arvo 0,05). Huomaa, kuitenkin, että merkittävää yhteyttä ainoastaan ​​sitä, että allekirjoituksen ennustus ei ole täysin satunnainen (MCC = 0). Association ei riitä olla hyödyllinen, koska tarpeeksi otoskoko, pienet vaikutukset voivat olla merkittäviä. Parempi indikaattorit mahdollisten hyödyllisyys kuin merkityksestä ovat suuruus herkkyyden ja spesifisyyden tai johdetut toimet, kuten MCC tai todennäköisyys tunnusluvut, jotka mittaavat kyky oikein luokitella potilaita niiden tuloksista.

Huolimatta näistä pettymyksen tulosten mukaan puhtaan tilastollisen kriteerit syrjinnän kyky, allekirjoitukset saattaa silti olla hyödyllinen kliinisessä käytössä, jos ne tarjoavat lisäriski kerrostuneisuus sisällä tunnettuja osapopulaatiosta määritelty kliiniset muuttujia. Positiivinen ja negatiivinen testin jälkeen todennäköisyydet uusiutumisen laskettiin ositettu vaiheessa tunnistamaan aste ennusteen syrjintää pidemmälle vaiheessa. Tulokset paras allekirjoituksen vaiheessa II näytteissä (

YM06

) kohtalaisen muutettiin 20%: n luostari toistuminen todennäköisyys on 28% ja 12% positiivisen ja negatiivisen testin jälkeen tulos, vastaavasti. Tämä erotteleva kyky ei ole täysin tyydyttävä, koska suuria väärien negatiivisten ja positiivisten että se aiheuttaa, mutta saattaa edistää tunnistamisen vaiheen II potilaista on suuri riski toistumista johtaa paremman kuvan adjuvanttihoitoa [6]. Paras allekirjoitus vaiheen III potilaat (

AJ08

) johti suurempaan syrjintään riskiryhmiin, joiden ero positiivisen ja negatiivisen testin jälkeen todennäköisyydet 38%. Kuitenkin alhaisen riskin ryhmä oli vielä suhteellisen suuri toistumisen todennäköisyys 18%, liian korkea suositella välttämään adjuvanttihoitoa kuin se ilmoitetaan nykyään.

Mahdolliset selitä näitä vaatimattomia tuloksia on otettava huomioon. Tilastollisesti näkökulmasta, teknisiä ongelmia, kuten alhainen otoskoko, geenien lukumäärän mukana luokittelija, käännöksen välillä alustojen tai kohortti heterogeenisuus, muun muassa on raportoitu mahdollisina selityksiä puute kliinistä käännöksen genomista luokittelijoiden ( katso viitteet [68], [69], [70]). Meidän tapauksessamme ja joidenkin allekirjoitusten, vain yhdessä ennusteen ilmoitettiin alkuteoksen, joten kirjoittajat tunnustetaan epäsuorasti huono luokitus kyky. Niissä profiileja, raportoitu olevan erittäin erotteleva, syynä voi olla huono hallittavuus yli istuva koulutukseen menetelmiä, koska ulkoinen validointi suoritettiin vain kolmessa tutkimuksessa ja testinäytteet koot olivat pieniä (

JG08

,

WN10

ja

YM06

, katso taulukko 1). Tarve kartoittaa mittapäistä geenien allekirjoituksia, jotka olivat käyttäneet eri alustoille myös saattanut vaikuttaa tuloksiin, koska tiedetään, että jopa useita koettimia saman geenin samalle alustalle voi näyttää tärkeitä vaihtelua. Emme havainneet kuitenkin, että alusta oli merkityksellinen vaikutus MCC arvioihin.

Low tietojen saatavuutta ja heterogeenisuus kliinisiä tietoja on ominaista käyttää julkisia aineistoja ja tämä on merkittävä este toistettavuutta ja integraatio julkaistu microarray tutkimuksia [71]. Aineistot eroavat potilasryhmät, kriteereillä ja lopputulos määritelmiä. Tarkka ja homogeeninen määrittely lopputulokseen eri puolilla aineistot olisi toivottavaa, jotta saadaan tarkka arvio allekirjoitusten ennustetta kyky. Kuitenkin heterogeenisyys aineistot mahdollistaa entistä käytännön analyysiä ja arvioiden tulisi heijastaa odotetut tulokset, kun profiilit käytettiin todellisia käytännössä, koska sairaalat ovat myös heterogeenisiä. Koska eri tuloksia on tarkoitus korreloivan [72], päätimme etusijalle Vähimmäisotos saatavuus saada tarkempia arvioita ja välttää epävarmuuden käyttöön aineistoja, joissa on alle 10 tapahtumaa [60]. Vaatimus mittaisen vähintään seurata myös mahdollisuus maksimoi otoskoko ja tukivat kirjallisuudessa: se on kuvattu, että useimmat näistä pahenemisvaiheiden esiintyä 3 vuoden kuluessa leikkauksen jälkeen ja sitä suositellaan käytettäväksi päätepisteenä liitännäishoidoissa kliinisissä kokeissa [ ,,,0],73]. Hoitomallilla seurasi saaneista potilaista ei pidetty, koska tämä tieto ei ollut saatavilla useimmissa analysoitu aineistot.

Potilaat diagnosoitu vaiheen IV sisällytettiin ja katsottiin toistuva tapahtumia arvioida globaalin suorituskykyä. Tämä epäsuorasti oletetaan, että molekyyli muuttuu pelissä kuljettaja rooli taudin pahenemiseen pysyvät muuttumattomina primaarikasvaimen jälkeen toistuminen on tapahtunut. Vaikka tämä perusolettamuksia voisi olla kyseenalainen, se jakoivat monet alkuperäiset analysoidut tutkimukset, jotka sisältyvät vaihe IV aiheita heidän koulutukseen ja testi aineistot (

AJ08

,

BT04

,

EC05

,

HO09

,

JS09 ​​

,

LN07G

,

LN07NZ

,

PL10

,

SC09

,

SL10

,

SM09

,

ST09

,

VL10

ja

YM06

).

Mistä biologinen näkökulmasta tämä maltillinen ennuste kyky voidaan selittää heterogeenisyys kasvainsolupopulaatioissa jotka voisivat laimentaa ennustetta molekyyli signaali. On hyvin tunnettua, että CRC kasvaimet koostuvat paitsi kasvaimen epiteelisoluihin, mutta myös syöpään liittyvä strooman fibroblasteissa (valuuttalisiin), endoteelisoluja tai tulehdussolujen, muun muassa [74]. Lisäksi nämä syöpäsolut leviämisrintamassa eroavat pääasiassa kasvain massa [75]. Ongelma kasvain irtotavarana heterogeenisuus voidaan voittaa eristämällä spesifisten solujen populaatiot laser mikrodissektion tekniikka [76]. Tässä suhteessa yksi yhdestätoista näytteen sarjaa käytettiin tässä tutkimuksessa (GSE12945) käytetään tätä tekniikkaa hybridisoituvat spesifisesti RNA kasvainsoluista. Kirurginen yksilöitä muista näytejoukoille tarkisti patologi arvioi vähintään kasvain pitoisuus 80% (GSE5206, GSE18088, E-MEXP-1245). Emme kuitenkaan eivät havainneet merkittäviä eroja allekirjoituksia tasoa koskevat kasvain-solu rikastamiseen käytetty menetelmä.

Geeni luettelot mukana tässä tutkimuksessa oli vain vähän päällekkäisyyttä: ulos 1.530 geenien raportoitu 31 profiileja, vain kaksi oli yhteinen neljä allekirjoitusta; 10 jaettiin kolme allekirjoitusta ja 102 oli läsnä kaksi profiilia. Tämä tulos ei ollut odottamatonta, koska se on aiemmin raportoitu [77], [78]. Puute geeni päällekkäisyys on yleensä tulkitaan ikään kuin jokainen allekirjoitus on satunnaisotannalla pienessä määrässä geenejä suuremman allekirjoitus, joka edustaa mukana reittejä [79], [80].

Colon ja peräsuolen kasvaimet ovat olleet sisältyvät umpimähkään tässä työssä, sillä aiemmassa raportissa osoitimme, ettei välillä on merkittäviä eroja paksusuolen ja peräsuolen kasvaimia transcriptomic tasolla [81]. Kuitenkin tämä päätös saattaa selittää joitakin Huonosta allekirjoituksia, koska tiedetään, että leikkaus laatu on tärkeä ennustetekijä peräsuolen syövän ja vähemmän tärkeitä paksusuolessa [82]. Tiedoissa käytetään tässä työssä, ei merkittävää assosioitunut ennustetta ja kasvaimen sijainti (tuloksia ei ole esitetty).

Valinta tilastoinnin analyysejä oli tärkeä asia. Tarkoituksena Tämän analyysin oli testatakseen julkaistun ennustetekijöiden allekirjoitusten riippumaton aineistot kuin yrittää toistaa niitä käyttämällä alkuperäistä menetelmää. Tässä yhteydessä

Random Forest

herää tehokkaan menetelmän, joka toimii erittäin hyvin verrattuna muihin kilpailijoihin [49], [83]. Kuten odotettua, allekirjoitukset testattiin heidän koulutukseen aineisto osoitti korkeinta tarkkuutta. Lisäksi olemme onnistuneet kopioinnista vahvistustulokset kolme viidestä allekirjoitukset, joista tietoja oli saatavilla (

SM09

,

VL10

ja

JS09 ​​

). Kuitenkin yhdessä ennuste ei havaittu profiilin

ST09

vuonna aineisto GSE12945, ja se havaittiin ainoastaan ​​yksi kolmesta riippumatonta validointi aineistoja, jotka sisältyvät tässä työssä profiilin

SL10

, vaikka hyvä suoritus on alun perin raportoitu (katso taulukko 1, kuva 2 ja Tiedosto S5). Syy voi olla se, että menetelmää käytimme ei vangita hyvin ennustetta arvo on noin allekirjoitukset, jotka saattavat on kehitetty pidemmälle viety algoritmeja määritellä riskin ennustaminen alkuperäisessä tutkimuksessa. Koska tämä oli todettu rajoite tätä työtä, analyysit olivat redone vaihtoehtoisia menetelmiä käyttäen (SVM), joka antoi samanlaisia ​​tuloksia (kuviot S2, S5 ja S6, File S7). Vuonna

ST09

profiilin, puoliksi valvottu lähestymistapa käytettiin taas

SL10

lähin-centroid lähestymistapaa sovellettiin jota ei oikein kuvattu paperissa.

SL10

kehitettiin Agilent alustan ja kartoitus koettimien eri validointiympäristöjä käytetty aineistoja voisi olla lisäys aiheuttaa eroavuuksia.

Vaikka joitakin teoksia raportoitu, että yksinkertaisemmat menetelmät valvottuihin

Vastaa