PLoS ONE: Unlocking biomarkkereiden Discovery: Large Scale soveltaminen Aptameerin proteomiikan tekniikka Early Detection of Lung Cancer

tiivistelmä

Background

Keuhkosyöpä on johtava syy syöpäkuolemista maailmanlaajuisesti. Diagnoosi tarvitaan tunnistaa varhaisessa vaiheessa keuhkosyöpään koska se voidaan kovettaa kirurgisesti. Kuitenkin useimmat tapaukset diagnosoidaan liian myöhään parantava leikkaus. Tässä esittelemme laajan kliinisen biomarkkereiden tutkimuksessa keuhkosyöpään ja ensimmäinen laajamittainen kliininen käyttö uuden Aptameerin perustuva proteomic tekniikka löytää veren proteiini biomarkkereita taudin.

Menetelmät /Principal Havainnot

Teimme Monikeskustutkimusta tapaus-control tutkimus arkistoidaan seeruminäytteistä 1326 aiheista neljä riippumatonta tutkimusta ei-pienisoluinen keuhkosyöpä (NSCLC) pitkäaikaisten tupakka-altistuneista populaatioista. Seerumit kerättiin ja käsitelty yhdenmukaisin protokollia. Asia seerumit kerättiin 291 potilaista 8 viikon kuluessa ensimmäisestä biopsialla keuhkosyövän ja ennen kasvaimen poistoa kirurgisesti. Kontrolliseerumeita kerättiin 1035 oireeton TET kanssa ≥10 Pack-vuotta tupakoinnin. Mittasimme 813 proteiinit kussakin näytteessä uudella aptameeriin-pohjainen proteomic tekniikka, jonka tunnuksena 44 ehdokasta biomarkkereita, ja kehitti 12-proteiini paneeli (kadheriinin-1, CD30-ligandi, endostatiini, HSP90α, LRIG3, MIP-4, pleiotrophin, PRKCI, RGM-C, SCF-sR, SL-selektiini, ja KYLLÄ), jossa erotetaan NSCLC tarkastuksissa 91% herkkyys ja 84% tarkkuus rajat validoitu koulutusta ja 89% herkkyys ja 83% tarkkuus erillisessä todentaminen joukko, joilla on samanlaiset suorituskyky varhaisen ja myöhäisen vaiheen NSCLC.

Johtopäätökset /merkitys

Tämä tutkimus on merkittävä edistysaskel kliinisissä proteomiikan alueella korkean tyydyttämättömiä kliinisen tarpeen. Analyysimme ylittää leveys ja dynaaminen alue proteomiin kuulusteltu aiemmin julkaistujen kliinisten tutkimusten laaja seerumin proteomista profilointi alustoilla kuten massaspektrometria, vasta-paneelit, ja autovasta taulukot. Herkkyys ja meidän 12-biomarkkereiden paneeli parantaa entisestään julkaistu proteiinin ja geenin ilmentymisen paneelit. Erilliset todentaminen luokittelija suorituskyky antaa näyttöä vastaan ​​yli istuva ja on rohkaisevaa Seuraavassa kehitysvaiheessa, itsenäinen validointi. Tämä huolellinen tutkiminen antaa hyvän pohjan kehittää testejä kipeästi tunnistaa varhaisessa vaiheessa keuhkosyöpään.

Citation: Ostroff RM, Bigbee WL, Franklin W, Gold L, Mehan M, Miller YE, et al. (2010) Lukituksen biomarkkereiden Discovery: Large Scale soveltaminen Aptameerin proteomiikan tekniikka Early Detection of Lung Cancer. PLoS ONE 5 (12): e15003. doi: 10,1371 /journal.pone.0015003

Editor: Irina Agoulnik, Florida International University, Yhdysvallat

vastaanotettu: 06 elokuu 2010; Hyväksytty: 07 lokakuu 2010; Julkaistu: 7. joulukuuta 2010

Copyright: © 2010 Ostroff et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Keuhkosyöpä potilaan ja Pluss ohjaus aihe karttuminen ja merkintä yhdessä verinäytteen keräämistä, käsittelyä ja varastointia yliopiston Pittsburgh Cancer Institute tukivat Erikoistunut ohjelmat Research Excellence (SPORE) avustusta National Cancer Institute (NCI) Yhdysvaltain kansallisen Institutes of Health (NIH) on Yhdysvaltojen in Lung Cancer (P50 CA090440) JMS. Keuhkosyöpä tutkimukset NYU tukivat avustusta Early Detection Research Network (EDRN) NCI NIH että Yhdysvaltojen ja Stephen E. Banner rahaston Keuhkosyöpä HIP, ja biomarkkereiden avustusta NCI of NIH että Yhdysvaltojen (5U01CA086137) ja WR. Keuhkosyöpä opintojaan Roswell Park Cancer Institute tuettiin osittain jota Cancer Center Support Grant (5P30CA016056) NCI NIH että Yhdysvallat. University of Colorado maksuja tätä tutkimusta tuettiin itiöitä avustusta NCI NIH että Yhdysvaltojen (P50-CA58187) ja avustusta EDRN NCI NIH että Yhdysvallat (U01 -CA85070). SomaLogic rahoitti proteomic biomarkkereiden tutkimusta. SomaLogic oli rooli tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen. Rahoittajat muu kuin SomaLogic ei ollut roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat lukenut lehden politiikan ja konfliktien jälkeen. R Ostroff, L Gold, M Mehan A Stewart, J Walker, S Williams, D Zichi, E Brody ovat koko ajan työntekijöitä SomaLogic. Tämä ei muuta tekijöiden noudattamista PLoS ONE politiikan tietojen jakamista ja materiaaleja.

Johdanto

Keuhkosyöpä on johtava syy syöpäkuolemista, koska ~84% tapauksista diagnosoidaan edennyt pitkälle [1] – [3]. Maailmanlaajuisesti vuonna 2008, ~1.5 miljoonaa ihmistä oli diagnosoitu ja ~1.3 miljoonaa kuollut [4] – eloonjäämisprosentti muuttumattomana vuodesta 1960. Kuitenkin potilaat diagnosoidaan varhaisessa vaiheessa ja leikkaukseen kokemusta 86% kaiken kaikkiaan 5 vuoden pysyvyys [2], [3]. Uusi diagnostiikka Tarvitaan siis tunnistaa varhaisessa vaiheessa keuhkosyöpään.

Kuluneen vuosikymmenen kliininen hyöty pieniannoksisen TT on arvioitu [5] – [8] siinä toivossa, että korkean resoluution kuvantamisen avulla havaita keuhkosyöpään aikaisemmin ja parantaa hoitotuloksia, paljon kuin seulonta on tehnyt rintasyövän ja paksusuolen ja peräsuolen syöpiä [9]. Lopulliset johtopäätökset CT seulontaa ja keuhkosyöpäkuolleisuus odottavat tuloksia satunnaistettua tutkimusta Yhdysvalloissa [8] ja Eurooppa [10] – [13]. CT voi havaita pieniä, varhaisvaiheen keuhkotuumoreita, mutta erottaa harvinaisia ​​syöpiä yhteisistä lieviä sairauksia on vaikea ja se on johtanut tarpeettomiin menettelyihin, säteilyaltistusta, ahdistusta, ja kustannukset [6], [14] – [16]. Me (JMS, JLW, ja työtovereiden) raportoi äskettäin tällaisia ​​päätelmiä Pittsburgh Lung Screening Study (Pluss), suurin yksittäinen laitos CT seulonta tutkimuksessa raportoitu tähän mennessä [5].

Muita biomarkkerit ovat myös haettu [17]. Proteiinit ovat houkuttelevia, koska ne ovat välittömästi toimenpiteen fenotyypin, toisin kuin DNA, joka tarjoaa genotyyppi, suurelta osin toimenpide sairauden riskin [18]. Yhden proteiini biomarkkerit ovat perusta molekyylidiagnostiikassa klinikalla tänään. On yleisesti uskotaan, että useita biomarkkereita voitaisiin parantaa herkkyyttä ja spesifisyyttä diagnostisten testien ja että monimutkaiset sairauksia, kuten syöpää muuttaa pitoisuuksia useiden proteiinien [19]. Kuitenkin löytää useita proteiini biomarkkerit mittaamalla monien proteiinien samanaikaisesti (proteomiikka) monimutkaisissa näytteissä kuten veri on osoittautunut vaikeaksi syistä kattavuus, tarkkuus, suoritusteho, preanalytical vaihtelevuus, ja kustannukset [20].

Jotta biomarkkereiden löytö kehitimme uuden proteomic tekniikka, joka perustuu uuden sukupolven aptameerin proteiinia sitovien reagenssien ja on mahdollisesti laaja soveltaminen [18]. Nykyinen määritys mittaa 813 ihmisen erilaisiin proteiineihin vain 15 ui verta alhainen Toteamisrajojen (kolmetoista keskiarvo ja niin alhainen kuin 100 fM), 7 tukit yleistä dynaaminen alue, ja korkea toistettavuus (5% mediaani variaatiokerroin) [ ,,,0],18]. Tässä esittelemme ensimmäinen suuri kliininen käyttö meidän proteomiikka tekniikka löytää veren proteiini biomarkkerit suuressa monikeskustutkimuksessa tapaus-control tehdyssä arkistoituja näytteitä 1326 aiheista neljä riippumatonta tutkimusta ei-pienisoluinen keuhkosyöpä (NSCLC) in pitkäaikainen tupakka-altistuneista väestöryhmistä.

Materiaalit ja menetelmät

Ethics lausunto

Kaikki näytteet kerättiin tutkimukseen osallistuneista saatuaan kirjallinen suostumus kliinisessä tutkimuksessa protokollia hyväksymä seuraavat institutionaalisten tarkastuslautakunta: The University of Pittsburgh Institutional Review Board (Pitt); New York University School of Medicine Institutional Review Board (NYU); Roswellin Park Cancer Institute Institutional Review Board (HE); ja Cape Cod Healthcare Institutional Review Board (BS).

Tutkimusasetelma

Tämän tutkimuksen tavoitteena oli löytää biomarkkerit, jotka syrjivät NSCLC tupakoitsijoiden kanssa ≥10 vuotta tupakoinnin historiaa, jotta kouluttaa ja rajat vahvistaa monen biomarkkereiden luokittelija NSCLC täyttämään ennalta määritellyt ansaintakriteerit ja tarkistaa suorituskykyä tässä luokittelija erillisellä joukko sokeita näytteitä. Yleinen tutkimuksen suunnittelu on esitetty kuviossa 1. Me suunniteltu ja toteutettu tämän tutkimuksen nykyisiä tiukkoja standardeja biomarkkereiden kliinisten tutkimusten [21] – [23] tavoitteiden kanssa maksimoida biomarkkereiden kestävyys, pätevyys, ja luotettavuutta tietojenkeruuvaiheessa, ja minimoi mahdolliset vaikutukset preanalytical vaihtelua. Tutkimus oli löytö-vaihe, tapaus-verrokki muotoilu. Kriittinen tutkimussuunnitelma ominaisuuksia ovat seuraavat. Kliiniset kysymys ja tutkimuksen suunnittelu oli etukäteen määritelty ennen tunnistamiseen ja hankkimalla näytteitä. Näytteet hankittiin neljän riippumattoman tutkimuksen sivustoja valvomiseksi mahdollisten preanalytical vaihtelua. Tiukka vakiotoimintamenettelyt seurattiin varmistaa näytteiden ja tietojen nimettömyys ja sokeuttavista kaikkina aikoina (katso jäljempänä). Tarkastetaan vedostulostus koostuu 25% kaikista näytteistä tutkimuksessa valittiin satunnaisesti ja tunnistamista Tästä sokaisi. Tilastollinen analyysi suunnitelman ennalta määritelty ja sisällytetty minimaalisesti hyväksyttävän ansaintakriteerit herkkyyttä ja spesifisyyttä.

Näytteet kohortti

Näyte Kohortissa 1326 seeruminäytteitä saatu neljä itsenäistä biorepositories: Uusi York University (NYU) [24]; Roswell Park Cancer Institute (RPCI) [25]; The University of Pittsburgh (Pitt) [5]; ja kaupallista biorepository (BioServe (BS)) (taulukko 1). Kaikki näytteet kerättiin tutkimukseen osallistuneista saatuaan suostumus alle institutionaalisesti hyväksytty kliininen tutkimus protokollia kuvatulla [5], [24], [25]. Sekä kotelo ja kontrolliseerumin kerättiin neljästä tutkimuksen keskuksista. Kliininen ominaisuudet tutkimuskohortissa koulutus- ja todentaminen sarjaa on esitetty taulukossa 2. lavastus ja histologia NSCLC tapaukset on esitetty taulukossa 3. Näyte ryhmä koostui potilaista diagnosoidaan sairauden tai kliinisen vaiheen I-III NSCLC ja korkean -risk ohjaus väestöstä, joilla on ollut pitkäaikainen tupakointi, mukaan lukien aktiivinen ja ex-tupakoitsijoille ≥10 pack-vuotta tupakoinnin. Kontrollipopulaatioissa valittiin satunnaisesti kussakin tutkimuksessa edustamaan potilasryhmässä riski keuhkosyöpä, jotka olisivat ehdokkaita CT seulonta, jossa suhde tapaus: valvonta 1:3.5. Verinäytteitä tapausta kerättiin potilailta kahdeksan viikon kuluessa ensimmäisestä biopsialla keuhkosyövän diagnosointiin ja ennen poistamista kasvaimeen kirurgisen toimenpiteen. Kaikki tapaukset Tässä tutkimuksessa käytetyt vahvistettiin ensisijaisena keuhkosyöpää patologia tarkastelu. NSCLC lavastus toimeksiantajana patologinen lavastus 240 aiheita ja kliinisiä lavastus 51 aiheista. Hyvänlaatuinen kyhmy tarkastukset ovat vähintään yhden vuoden seurantatiedot ja ei-pahanlaatuiset diagnoosi. Tupakoitsija kontrollit olivat oireettomia TET kanssa ≥10 Pack-vuotta tupakoinnin. Tupakoitsija valvonta NYU ja Pitt oli kyhmy ilmaiseksi CT; kyhmy tila on tuntematon tupakoitsija valvonnan RP ja BS. Demografiset tiedot kerättiin itse raportti kyselyt. Täydentävät tiedot tapauksista oli hankittu kliininen kaavio tarkastelu. Keuhkojen toiminta testaus arvioitiin spirometriatutkimusten varten osajoukon tutkimukseen osallistuneista.

Serum Collection, käsittely, varastointi, ja Lähetyksen

Kaikki seeruminäytteitä kerättiin seuraavat yhtenäinen protokollia suosittelemia National Cancer Institute: n Early Detection Research Network [22]. Kolme keskuksista (NYU, Pitt ja RPMC) kerättiin seerumia punainen alkuun Vacutainer putkilla (Becton Dickinson, Raritan, NJ) ja yksi keskus (BS) kerätään seerumi tiikerinluiden top SST Vacutainer putkilla (Becton Dickinson). Kaikki näytteet annettiin hyytyä, ja seerumi otettiin talteen sentrifugoimalla kuluessa 2-8 tunnin keräys ja säilytettiin -80 ° C: ssa. HIPAA yhteensopiva, de-tunnistetut näytteet toimitetaan jäädytetty kuivan jään SomaLogic tutkimuksesta keskusten ja säilytettiin -80 ° C: ssa. Näytteet sulatettiin kerran aliquoting ennen proteomiikka analyysiä.

Näytteet Sokaiseva

Jotta mahdollinen harha, tämä tutkimus seurasi tiukka vakiotoimintamenettely näytteen de-tunnistus ja sokaiseva, niin että kaikki fyysisiä näytteitä ja tietueita tunnistettiin yksinomaan ainutlaatuinen, tunnistamatonta viivakoodin numero ja avain oli säilytetään turvallisessa tietokantaan vain nimettyihin vastuussa ylläpitäjät. Kaikki näytealikvootteja kulkevat tässä tutkimuksessa säilytettiin identtinen putkien tunnistaa vain sidotuilla viivakoodin. Näyte sokaiseva koodi oli rikki vain mukaan ennalta määritetyn analyysisuunnitelma varten luokitin koulutusta harjoitussarjassa ja luokittelija todentaminen kanssa tarkastuksen asetettu. Tarkistamista varten näyte asetettu, ainutlaatuinen sokaiseva avaimen syntyi ja toimitettu ainoastaan ​​kolmannelle lukija (KC), ole sidoksissa tutkimuksen keskuksista tai SomaLogic, pisteet ja raportoida lopulliset Tarkastuksen tulokset.

proteomiikan analyysi

Seerumin näytteet analysoitiin meidän proteomic löytö alustan kuvatulla Gold et ai [5]. Lyhyesti, tämä tekniikka käyttää uusia DNA Aptameerien jotka sisältävät kemiallisesti modifioitu nukleotidien erittäin erityisen proteiinin sitoutumisen reagenssit ainutlaatuisella multipleksoidun määritys, joka muuttaa määrästä kunkin kohdennetun proteiinin vastaavan määrän Aptameerin, joka on määrällinen mukautetun hybridisaatiosiru. Proteiini määrät kirjataan suhteellinen fluoresoiva (RFU), joka voidaan muuntaa pitoisuudet standardin käyriä. Alusta on pitkälle automatisoitu [26] ja skaalautuva mahtuu monenlaisia ​​näytteenkäsittelykapasiteetti. Tässä tutkimuksessa 813 proteiinia tavoitteet mitattiin 15 ui seerumia kuhunkin aiheeseen, ja kaikki 1326 seerumit analysoitiin jatkuvassa prosessissa yli kahdeksan päivää. Kaiken kaikkiaan tulokset ovat analogisia hieman yli miljoona korkealaatuisia ELISA mittauksia. Näytteet käsitellään useita 96-kuoppaisille mikrotiitterilevyille, ja kaikki 1326 näytteet jaettiin satunnaisesti ja niiden identiteetit olivat täysin sokeita koko proteomiikka analyysiprosessia.

biomarkkereiden Selection

biomarkkerit valittiin strategialla suunniteltu tunnistamaan analyyttien kanssa parhaan mahdollisen suorituskyvyn luokituksessa NSCLC tapauksissa tarkastuksissa kaikilla tutkimuksen sivustoja ja jotka vähiten vaikuttanut preanalytical muuttujia. Ensimmäisessä vaiheessa tämän analyysin, me eliminoitu analyyttejä, joka osoitti odottamatonta vaihtelua verrattuna sisäisen valvonnan takia, esimerkiksi näytteen epävakautta. Tässä prosessissa, päätimme joukko analyyttejä että suoriutunut hyvin yhteensä kuusi naiivia Bayes (NB) luokittelija koulutus analyysit. Ensin jaoimme opetusjoukolla kahteen erilliseen väestön valvoa mahdollisten biologisten vaihtelua niiden välillä: (1) kaikissa tapauksissa ja säätimet hyvänlaatuisia kyhmyjä tunnistaa CT; ja (2) kaikissa tapauksissa ja kaikissa muissa tupakoitsija hallintalaitteet (kyhmyn tila tuntematon). Kunkin populaation vertasimme tapauksissa tarkastuksia kolmessa NB koulutuksen analyysien suunniteltu ohjaamaan mahdollisten preanalytical vaihtelun välillä tutkimus sivustoja. Kolme NB analyysit alkoi ainutlaatuisia mahdollisia biomarkkereiden perustuu seuraaviin kriteereihin: (1) tapaukset vastaan ​​kontrollit KS≥0.3 kaikille vertailuja kunkin neljän tutkimuksen sivustoja; (2) tapaukset vastaan ​​kontrollit KS≥0.3 vertailla kaikkien sivustojen yhdistettynä; (3) sekä kriteerit yhden ja kahden täyttyivät. Jokaista analyysia varten käytimme ahne eteenpäin hakualgoritmi valita alaryhmiä mahdollisia biomarkkereita, rakentaa NB luokittelijoiden (katso alla), ja teki niiden suorituskyky luokitteluun keuhkosyöpää ja ohjauksista lähtien koulutusta asetettu. Tässä prosessissa, tämä meta-heuristinen lähestymistapa tehokkaasti hakee luokittelija tilaa tunnistaa mahdolliset biomarkkerit jotka toimivat parhaiten luokitusta. Käytimme yksinkertainen toimenpide diagnostisten suorituskykyä luokittelijoiden, numeerinen summa herkkyys + spesifisyys, ja mitataan taajuus, jolla mahdollisia biomarkkereita valitsi ahne algoritmi sisällytettäväksi luokitin paneelit herkkyys + spesifisyys ≥1.7. Tämä vaihe tuotti joukon mahdollisia biomarkkereita jokaisen kuuden rinnakkaisanalyysejä. Valitsimme viimeinen biomarkkereiden kuin liiton näiden kuusi sarjaa.

tilastolliset menetelmät

KS tilastotieto on ei-parametrinen mitta ero kahden jakaumat. Kahden otoksen KS tilasto on:, missä ja ovat empiirisiä kertymiksi kahden populaation arvojen.

naiivi Bayes-luokitin oletetaan riippumattomuus näytteiden välillä, ja malleja jakaumat koulutuksen luokissa tehdä ennusteita [27 ]. Käytimme normaalijakaumat mallintamaan tietomme. Kuitenkin ominaisuudet meidän data sisältää usein jakaumat raskaalla hännät joten suurimman uskottavuuden estimointi jakaumaparametrit toimii huonosti. Siksi me mallinnettu meidän jakaumat log-normaalin jakaumat ja käytetään Gauss-Newton-algoritmi tietojen sovittamiseksi.

rakennettu Bayes luokittelijoiden käyttäen sarjaa mahdollisia biomarkkerit tunnistettu edellä kuvatulla tavalla. Käytimme parametrinen malli kaapata taustalla olevan proteiinin jakelua annetulle tilalle. Yksinkertaisin parametrinen malli todennäköisyystiheysfunktion (pdf) yhden proteiini on normaalijakaumaa, täysin kuvata keskiarvo u ja varianssi σ

2 (Eq. 1). (1) B

Monet proteiini jakaumat havaittiin normaalisti suhteen logaritmiin. Numeerinen cdfs voidaan sovittaa normaalijakaumaa tukin pitoisuuksina x (Eq. 2). (2) B

Mallien sopii aineistoon hyvin. Monimutkaisempia malleja todennäköisyysjakauman toimintoja voidaan käyttää, kun aihetta mutta yksinkertainen malli tarjosi hyvän kuvauksen tietojemme.

yhdistää useita markkereita, käytimme Monimuuttuja normaalijakaumaa mallintaa todennäköisyystiheysfunktion (pdf ) kullekin luokalle. Sillä n markkereita, monimuuttuja pdf saadaan seuraavasta yhtälöstä (Eq. 3). (3) B-

jossa x on n-komponentin vektori proteiinin tasot, μ on n-komponentin vektori keskimääräinen proteiinin tasoilla, Σ on NxN kovarianssimatriisi ja

Vastaa