PLoS ONE: Mirna Profiilit lymfoblastisolulinjoissa Suomen kielen Eturauhassyöpä Families

tiivistelmä

Background

periytyviä tekijöitä ilmeisesti osallisena eturauhassyövän (PRCA) syövän synnyn, mutta tällä hetkellä, geneettiset markkerit ovat ei rutiininomaisesti käytetty seulontaan tai diagnostiikan taudin. Tarkempia tietoja tarvitaan hoitopäätösten tekemistä ja erottaa aggressiivinen tapauksia indolent sairaus, jolle perinnöllisiä tekijöitä voivat olla hyödyllinen väline. Geneettiseen punasoluaplasiaa on vasta äskettäin alettu unraveled laajamittaisen genomin laajuinen yhdistys tutkimukset (GWAS). Näin pitkälle tunnistettu yhden emäksen monimuotoisuus (SNP) selittää kuitenkin vain murto-osa familiaalinen klusterointi. Lisäksi tunnettujen riskitekijöiden SNP: t eivät liity kliiniseen tulokseen sairauden, kuten syövyttäviä tai metastasoitunut sairaus, ja sen vuoksi ei voida käyttää ennustamaan ennustetta. Merkitsemiseksi SNP syvä kliiniset tiedot yhdessä miRNA ekspressioprofiileja voi parantaa ymmärrystä taustalla olevien mekanismien eri fenotyyppejä eturauhassyövän.

Tulokset

Tässä tutkimuksessa microRNA (miRNA) profiilit tutkittiin mahdollisina biomarkkereita ennustaa sairauden lopputulos. Tutkimuksen kohteena olivat Suomen suuri riski eturauhassyövän perheitä. Tunnistaa mahdolliset biomarkkerit yhdistimme uusi ei-parametrical testi, jonka merkitys toimenpide muodostaa jonkin Random Forest luokittelija. Tämä yhdistelmä antoi joukon yhdeksän miRNA joka pystyi erottamaan tapauksia valvontaa. Havaittu miRNA ilmentymisen profiilit voisi ennustaa taudin kehittymistä vuotta ennen varsinaista punasoluaplasia diagnosointiin tai havaita, että on olemassa muita syöpiä tutkituissa yksilöitä. Lisäksi käytetään ilmaisua polygeeninen ominaisuus (eQTL) analyysi, sääntely SNP varten miRNA miR-483-3p jotka olivat myös suoraan liittynyt punasoluaplasian löytynyt.

Johtopäätös

Perustuu havaintojen ehdotamme, että veri-pohjainen miRNA ilmentymisen profilointi voidaan käyttää diagnoosissa ja ehkä jopa taudin ennusteen. Tulevaisuudessa miRNA profilointia voidaan mahdollisesti käyttää kohdennetussa seulonta yhdessä eturauhasen Specific Antigene (PSA) testaus, tunnistaa miesten kohonnut punasoluaplasian riski.

Citation: Fischer D, Wahlfors T, Mattila H, Oja H, Tammela TLJ, Schleutker J (2015) Mirna Profiilit lymfoblastisolulinjoissa Suomen kielen Eturauhassyöpä Perheet. PLoS ONE 10 (5): e0127427. doi: 10,1371 /journal.pone.0127427

Academic Editor: Xin-Yuan Guan, The University of Hong Kong, Kiina

vastaanotettu: 19 joulukuu 2014; Hyväksytty: 15 huhtikuu 2015; Julkaistu: toukokuu 28, 2015

Copyright: © 2015 Fischer et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään

Data Saatavuus: kaikki asiaankuuluvat tiedot ovat saatavilla EBI (tulonumero E-MTAB-3397).

Rahoitus: Tätä työtä tukivat Medical Research Fund Tampereen yliopistollisen sairaalan (9L091, 9M094, ja 9N069), suomalainen Cancer Järjestöt, Sigrid Juselius Foundation, ja Suomen Akatemia (myöntää 116437 ja 251074) ja JS. Tätä työtä tuki myös The Suomen tohtoriohjelma Stochastics ja tilastot DF.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Eturauhasen syöpä (PRCA) on yleisin noncutaneous maligniteetti ja toiseksi yleisin syy syöpään liittyvien kuolemien miesten keskuudessa teollisuusmaissa [1]. Suomessa, 4604 uutta eturauhassyövän tapausta diagnosoitiin vuonna 2012 (Suomen Syöpärekisteri, https://www.cancer.fi/syoparekisteri/). Ikääntyminen ja PSA-testaus voidaan selvimmin syitä lisääntynyt määrä uusia tapauksia. Ilmaantuvuutta luo painetta terveydenhuoltojärjestelmän kuin huoleen ylihoito on huomattava. Siksi yksi suurimmista haasteista on parantaa ja ennustavia välineitä pystyä erottamaan tappava mistä veltto taudin kovettuvan tilan taudin.

panos perimä on tutkittu laajasti yhdessä eturauhassyöpä taipumus. Sekä sidos ja GWAS yhdessä muutamia esimerkkejä, jotka johtuvat kandidaattigeenifragmenttikloonien lähestymistavat ovat johtaneet tunnistamiseen noin 100 geenipaikkojen jotka selittävät vain noin 30% geneettinen riski taudin [2] [3] [4] [5]. Kuitenkin, ei ole selvää molekyyli- tai toiminnallista näyttöä kuinka vaihtelut näissä ehdokas sivustoja tai niiden co-perinnöllinen lähialueiden variantit voivat aiheuttaa PRCA. Itse asiassa suurin osa yhden nukleotidin variantit (SNP: t) saapuvat GWAS eivät todennäköisesti vaikuta koodaavan sekvenssin minkä tahansa geenin vaan asuvat geenien välisen alueen. Nämä havainnot viittaavat siihen, että niillä on säätelevä tehtävä, kuten transkription, silmukoinnin tai mRNA: n stabiilisuuteen, sen sijaan, että suora vaikutus toimintaan geenituotteen [6].

Viime vuosina, on tärkeää, että ei-proteiinia koodaavan genomi toiminnallisen sääntelyn normaalin kehityksen ja sairauksien kehittymisestä on käynyt ilmeiseksi. MiRNA ovat lyhyitä ei-koodaavat RNA: t, jotka säätelevät niiden kohdegeenin ilmentymisen tyypillisesti sitoutuminen 3′-alue (UTR) ja kohde-mRNA: n [7]. Yksittäiset vaihtelu miRNA ilmentymisen tasot voivat vaikuttaa mRNA: n kohdegeenin, aiheuttaen fenotyyppisiä eroja.

Useat tutkimukset ovat osoittaneet, että miRNA ekspressiotasot ovat ennustavan tuloksista kiinteiden kasvaimien ja leukemioiden, mutta osuus muuttunut miRNA ekspressiotasoja geneettisiin syöpäalttiutta ei tiedetä. Transkriptionaalista aktiivisuutta proteiinia koodaavan geenien periytyy kvantitatiivinen ominaisuus, ja sääntelyn polymorfismit liittyvät vaihtelua mRNA pidetään eQTL. Huolimatta osoitti merkityksen, tietoa geneettisen säätely miRNA ilmaisu on vielä lapsenkengissä. Tuoreessa julkaisussa, yli sata eQTLs perusterveydenhuollossa fibroblasteissa kuvattiin, mikä osoittaa ainakin osittaisen rooli geneettistä vaihtelua muuttuneessa miRNA ilmaisun [8]. Yhdistetty analyysit yhteisten SNP ja vaihtelut miRNA ekspressioprofiileja voisi olla yksi tapa valaista biologisia toimintoja SNP tunnistaa GWAS yhteisiä sairauksia.

Tämän tutkimuksen tavoitteena oli arvioida miRNA ilmaisun profiilit lymfoblastoidisissa solulinjoja (LCL) johdettu jäsenistä suuri riski PRCA perheitä. Muuttunut miRNA ilmentyminen potilaan LCL verrattuna terveistä perheenjäsenten tarjosi mahdollisuuden tunnistaa ituradan varianttien promoottori tai muu säätelyalueita proteiinia koodaavan geenien huomattava määrä miRNA ilmentyminen korreloi isäntä ja kohdegeenin ilmentyminen [9]. Suuri määrä merkittäviä miRNA-viisasta testitulokset tietoja tarvitaan myös kehittää uuden tyyppisiä differentiaalisesti ilmentymisen analyysi putki. Kehittää tällainen putki, differentiaalisesti ilmaisu testaus on yhdistetty tärkeysmitat koneen oppimisen algoritmi, Random Forest [10].

Materiaalit ja menetelmät

Ethics lausunto

tutkimus on hyväksynyt kunkin IRB hallituksissa sosiaali- ja terveysministeriön (SMT), kansallinen valvontaviranomainen sosiaali- ja terveysministeriön (Valvira) ja eettisen komitean Tampereen yliopistollisessa sairaalassa. Jokaisella yksilöllä osallistuvien tutkimus on antanut kirjallisen tietoon perustuva suostumus.

Tutkimuskanta

Kaikki näytteet ovat suomalainen syntyperä ja kerätä perheiden on raportoitu aiemmin [11]. Sillä miRNA microarray tutkimuksessa 115 tapausta 70 PRCA perheiden käytettiin. Valittu perheet oli ainakin kaksi ensimmäisen asteen sukulaiset diagnosoitu eturauhasen syöpä missä iässä tahansa. Terve (= ei todettu eturauhassyöpä) yksilöiden (n = 78) 47 perheet käytettiin valvontaa. Mediaani-ikä diagnoosin tapauksia oli 65 (44-86,2) vuotta ja valvonta iän mediaani oli 57,5 ​​(35,2-83,3) vuoden aikaan näytteet saatiin.

osajoukko yksilöitä ( n = 54) alkaen mikromatriisi kokeen genotyypattiin kanssa Illumina n HumanOmniExpress matriisia toisessa kokeessa ja tulokset julkaistaan ​​muualla [12]. Osalle 54 näytteitä voidaan käyttää täällä varten eQTL analyysiä (39 PRCA tapauksissa ja 15 ohjaa). Muita 83 yksilöitä voitaisiin käyttää validointitarkoituksissa. Kaikkiaan oli 137 genotyyppi henkilöitä 33 perheet (20 päällekkäin perheet mikrosirulla osa tutkimusta).

kliininen tulos eturauhassyöpä voidaan karkeasti jakaa aggressiiviseen ja ei-aggressiivinen syöpä, joka perustuu PSA , Gleason pisteet ja muut kliiniset arvioinnit [13]. Perustuen näiden ohjeiden, eturauhassyöpä potilaiden kahdessa kokeessa jaettiin 36 (36) aggressiivinen ja 79 (66) ei-aggressiivinen eturauhasen syöpiä. Enimmäismäärä aggressiivinen tapausta perhe oli 3, ja pienin oli 1. Yksityiskohtainen katsaus yksilöiden tutkimuksessa esitetään kuvassa 1.

Kunkin terveyden ryhmä, yksilöiden lukumäärä peräisin eri kokeesta. Kokonaismäärä kokeesta sitten merkitty vastaavat värilliset laatikko plus punaisen laatikon (päällekkäisyys). alempi: visualisointi familiaalinen tausta. Kolme vaihtoehtoa ”PRCA ainoastaan”, ”Terve vain” tai ”PRCA /Terve” näkyvät ja ryhmitelty vastaavasti. Lisäksi osallistuminen eri perheiden kahdessa kokeessa näytetään. Järjestys on mukaan sisäinen perhe koodia.

RNA uuttamalla lymfoblastisolulinjoissa

LCL johdettiin Epstein-Barr-virus muutosta perifeerisen mononukleaaristen leukosyyttien potilailta ja heidän terve sukulaiset . Lymfoblastisolulinjoissa kasvatettiin RPMI-1640-alustassa (Lonza, Walkersville, MD, USA), johon oli lisätty 10% naudan sikiön seerumia (Sigma-Aldrich, St. Louis, MO, USA) ja antibiootteja 37A ° C: ssa, 5% CO2 ja 95%: n kosteudessa. Solupelletit snap-jäädytetty, ja kokonais-RNA uutettiin Trizol mukaan valmistajan ohjeiden (Invitrogen, Carlsbad, CA, USA). RNA saannot kvantitoitiin käyttäen ND-1000 spektrofotometrillä (Nanodrop Technologies, Wilmington, DE, USA) ja Agilent 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA).

MicroRNA mikrosiruanalyysillä

microRNA ekspressiotasot LCL todettiin käyttäen Agilent Human miRNA V2 Oligo Microarray Kit (Agilent Technologies). Ensimmäinen, 100 ng kokonais-RNA: ta käytettiin lähtöaineena, ja miRNA leimattiin käyttäen Agilent miRNA Labelling Kit. Merkityt RNA hybridisoitiin Agilent miRNA microarray jotka on kahdeksan samanlaista matriisia kohti dia, jossa jokainen joukko, joka sisältää koettimia kohdistuvista 817 miRNA (719 ihmisen, 76 ei-ihmisen viruksen miRNA ja 22 ohjaus miRNA). Kaikkiaan 26 dioja käytettiin, ja tiedot poimittiin käyttäen Agilent Feature Extraction ohjelmisto (FES), versio 10.7.1.1 kanssa kantaverkkoon D_F_20091030. Jotta data-analyysi, heikkolaatuisia näytteet poistettiin ensin, jolloin 193 yksilöä. Jokainen yksittäinen Agilent mikrosirujen V2 mittaa 13737 ominaisuuksia, ja FES sitten käytetään näitä ominaisuuksia laskea ilmaisua arvot 2466 (2125 ihmisen) antureista; niiden pohjalta antureista 817 miRNA ilmaisu arvot laskettiin. Tiedot pääsee ArrayExpress liittymisen E-MTAB-3397.

miRNA lauseke arvot ovat tyypillisesti lasketaan algoritmilla

gTotalGeneSignal

toteutettuna FES, mutta tässä tutkimuksessa kuitenkin koetin tavoin, tausta vähennettynä mediaaniarvoja käytettiin sijaan. Analyysi eri antureista saman miRNA yhtenä miRNA ilmaus arvo ei näytä olevan riittävän luotettavia, ja analyysi on koetin taso oli helpommin toteutettavissa. Kun olet laskenut lauseke arvot koetin tasolla, kaikki ei-ihmisen antureista ja ne eivät havaitse FES poistettiin. Vain ne koettimet, jotka havaittiin vähintään 50% näytteistä vähintään yhden terveydentilaa ryhmässä käytettiin lisäanalyysiä. Lisäksi, ei-humaani-ohjain poistettiin ennen analyysiä. Kaikkiaan 547 antureista, jotka edustavat 211 miRNA, täytti nämä kriteerit. Teknisen olevien tietojen variaation vähennettiin käyttämällä kvantiili normalisointi [14].

genotyypin Data Analysis

yhden nukleotidin polymorfismi (SNP) genotyyppitietoja luotiin käyttäen Illumina n HumanOmniExpress array yhteistyössä instituutti Suomen molekyylilääketieteen (FIMM). Valittu joukko mahdollisti genotyypin noin 700k SNP. Tuottaa genotyyppitietoja, raakadata analysoitiin Genome Studio mukaan valmistajan ohjeiden (Illumina, San Diego, USA).

Kaikkiaan genotyyppi tiedot 137 yksilöitä oli saatavissa, jossa miRNA ilme tasot mitataan myös 54 näiden yksilöiden. Näin ollen eQTL analyysi perustui näihin 54 henkilöä. Loput 83 yksilöitä käytettiin tulosten validoimiseksi.

tunnistaminen ilmentyvät eri antureista käyttämällä suunta testaus

PRCA potilasta jaettiin aggressiivinen (A) ja ei-aggressiivinen /lievä (M) PRCA ryhmiä ja terveisiin verrokkeihin verrattuna (H). Uusi yleistyminen Mann-Whitney tyyppitestit sovellettiin tunnistaa ilmennetty eri koettimet kolmen vertailuihin. Samaa yleistys käytettiin eQTL analyysi (lisätietoja [15] ja [16]).

yleismääritelmä, anna otoskoot kolmen ryhmän olla

N

H

,

N

M

ja

N

mikä johtaa yhteensä otoksen koko

N

H

+

N

M

+

N

=

N

. Yleistynyt Mann-Whitneyn testi perustuu todennäköisyyspohjaisiin indekseihin lasketaan kolminkertainen summat vastaavan indikaattorin toimintoja. Olkoon x

p

;

H

= (

x

1,

p

;

H

,

x

2,

p

;

H

, …,

x

N

H

,

p

;

H

)

T

, x

p

;

M

= (

x

1,

p

;

M

,

x

2,

p

;

M

, …,

x

N

M

,

p

;

M

)

T

ja x

p

;

= (

x

1,

p

;

,

x

2,

p

;

, …,

x

N

,

p

;

)

T

olla ilmaus arvot koetin

p

kussakin terveyden ryhmässä taustalla

ED

n

F

p

;

H

,

F

p

;

M

ja

F

p

. Todennäköisyyspohjaisessa index

P

^

H

,

M

,

;

p

anturin

p

tässä menetelmässä voidaan sitten laskea byand

I

(⋅) on ilmaisin toiminto, joka on 1 jos ehto (⋅) on tosi ja 0 jos ei. Huomaa, että järjestystä indeksi

P

^

H

,

M

,

;

p

viittaa yhteisöjen käytetyn osoitinmuuttujan.

Lisäksi todennäköisyyksiin index

P

^

H

,

M

,

;

p

voidaan sitten käyttää testaamaan suuntaava hypothesiswhere ≺ viittaa stokastisen tilaamista

ED

’s. Luonnollisesti eri tilaukset ehdon (⋅) Indikaattorin toimintoa voidaan käyttää testaamaan eri vaihtoehtoja. Lisäksi kun ilmaisu arvot osoitetaan genotyyppiryhmien sijasta terveydentila, tämä testi menettely sopii eQTL testausta se testaa varten suuntaava vaihtoehtoja, jotka ovat selvästi läsnä yhteydessä, joka eQTL analyysin.

kaksi todennäköisyyspohjainen indeksit

P

^

H

,

M

,

;

p

ja

P

^

,

M

,

H

;

p

käytettiin testaukseen antureista

p

= 1, …, 547, ja p-arvot permutaatio testiversio laskettiin perustuen 5000 permutaatiot. Testitulokset p-arvo alle 0,01 pidettiin merkittävänä. Testausmenetelmä on toteutettu R-paketti

gMWT

[16], ja paketti

GeneticTools

hyödyntää tätä testausmenetelmä eQTL testaus. Molemmat paketit ovat vapaasti saatavilla Comprehensive R Archive Network (CRAN).

Benjamini-Hochberg useita testausmenetelmää hallita vääriä löytö määrä on visualisoidaan hylkäämistä tonttien ja linjat. Suhde odotettavissa hylkäämisestä alle nollahypoteesi on piirretty havaittuun suhde hylätyiksi. Jos tämä kaari yläpuolella (0, 1) line, meillä on enemmän hylkäämisestä odotettua alla nollahypoteesin. Hylkäämisestä kiinteää testiä kokoa voidaan visualisoida kanssa pystysuora viiva, ja hylkäämisestä eri moninkertainen testaaminen säätöjä voidaan visualisoida linjat tietyllä kaltevuus. Määrä hylätään nollahypoteesi määritetään sen jälkeen risteyskohdassa käyrän ja linja. Katso lisätietoja [15].

Classification, merkitys Mittaa ja Clustering

koneoppimisen luokitin Random Forest [10], kuten se on toteutettu R-paketti

randomForest

[17], levitettiin ilmaisu tietoja, kuten että aineisto jaettiin koulutusta (75%) ja testi (25%) tiedot. Koulutuksen tietoja käytettiin luomaan kokonaisuus 2500 päätöksen puita, ja nämä puut käytettiin sitten luokitella testituloksia. Jako koulutuksen ja validointitiedot toistettiin sitten 2000 kertaa, ja sen jälkeen luokittelun tulokset kaikista testituloksia ajot arvioitiin. Gini merkitys toimenpiteen myös uutettu jokaisesta Random Forest, ja keskimääräinen tärkeyttä kukin koetin yhdistettiin vastaavien p-arvon suuntaava testi. Koettimet että oli p-arvo on alle 0,01, ja jotka kuuluivat 10% tärkein antureista kaikkien Random Forest ajot katsottiin suuresti kiinnostavaan (HI antureista) ja käytettiin sitten ryhmittely vaiheessa ja eQTL analyysiin.

Random Forests koulutettiin kolmesta mahdollisesta tuloksesta luokkaa terve (H), lievä PRCA (M) ja aggressiivinen, PRCA (A). Olkoon

L

i

,

r

;

H

,

L

i

,

r

;

M

ja

L

i

,

r

;

olla luokkaa todennäköisyydet antamat Random Forest luokittelija run

r

yksittäisten

i

kanssa

L

i

,

r

;

H

+

L

i

,

r

;

M

+

L

i

,

r

;

= 1. Näitä likelihoods yhdistettiin sitten yhdeksi PRCA severeness arvo

S

i

,

r

=

1

2

L

i

,

r

;

M

+

L

i

,

r

;

A

. Severness arvo

S

i

,

r

valittiin siten, että

S

i

,

r

= 0 siinä tapauksessa, että

L

i

,

r

;

H

= 1

S

i

,

r

= 0,5

L

i

,

r

;

M

= 1 ja

S

i

,

r

= 1 jos

L

i

,

r

;

= 1.

2-tie Random Forest aikavälillä luokittelu suoritettiin vasta välillä terve ja PRCA luokat, joilla samalla kokoonpanolla kuin että 3-tie Random Forest kuvatulla tavalla.

laskea alueen käyrän alla (AUC) Receiver Operating Characteristic (ROC) käyrä Random Forest tapauksessa kaksi erilaista lähestymistapaa valittiin. Ensinnäkin kaksi likelihoods

L

i

,

r

;

M

ja

L

i

,

r

;

lisättiin arvioimaan Random Forest kykyä luokitella punasoluaplasian yleensä. Sitten toisessa vertailussa likelihoods

L

i

,

r

;

H

ja

L

i

,

r

;

M

lisättiin arvioida sen kykyä tunnistaa aggressiivinen PRCA. Lopulta piirtää ROC jatkuva raja-arvo [0, 1] levitettiin todennäköisyys luokitella yksilöt true /vääriä positiivisia.

ryhmittely on heatmap, Kendall tau korrelaatiomatriisin S kaikkien näytteiden laskettiin perustuen ilmaisun arvot HI koettimia. Kendall ”tau Kahden muuttujan on mitta positiivinen /negatiivinen riippuvuus ja on invariant missään aidosti kasvava siirtymistä marginaalinen muuttujia. Vastaava etäisyys muuttujien määritellään sitten D = (1 – S) /2. Olkoon sitten D on matriisi etäisyyksistä käytetty hierarkkinen ryhmittely.

eQTL Analyysi

genotyyppi tiedot 700k array yhdistettiin ilmaisu arvojen HI koettimia käyttäen eQTL analyysiä. Kromosomaalinen sijainnit miRNA koettimet tunnistetaan ja kaikki SNP sisällä ikkunan 1Mb ympärille koetin keskeinen sijainti liittyi tähän koetin. Koetin lauseke arvot siirrettiin siis genotyypin ryhmiä jokaisen liittyvät SNP (kuvio 2 esittää järjestelmällinen luonnos tämän vaiheen).

Riippumaton terveydentilan kunkin yksittäisen ilmaisulla arvot ryhmitelty genotyyppiryhmien ympäröivän SNP ja sitten testataan ero ilmaisun näiden ryhmien. (Kuva on otettu [16])

Eräässä eQTL lähestymistapaa, kolme tapausta ovat mahdollisia, riippuen siitä, onko ilmentymisen arvot on määrätty yksi, kaksi tai kaikki kolme mahdollista genotyypin ryhmiä. Monomorphic variantteja ei tarkemmin huomioon analyysissä, sekä kahden ryhmän tapauksessa kaksipuolinen Mann-Whitneyn testiä sovellettiin. Kolmen ryhmän tapauksessa yleisen Mann-Whitneyn testi suuntaava vaihtoehtoja käytettiin kahta eri vaihtoehtoa, onko suurempi ekspressio arvot liittyvät villityypin tai homotsygoottinen mutaatio. Tämäntyyppinen suuntaava testiä käytettiin kolmen ryhmän tapauksessa tilaus ilmaus arvojen suhteen genotyyppiryhmien on selvästi odotettavissa.

Comparative Analysis

tässä käytetty kaksivaiheinen lähestymistapaa verrattiin kahden muun yleisesti käytettyä menetelmää. Ensimmäinen menetelmä oli klassisen analyysi varianssi (ANOVA), testaus vaihtoehtoinen hypoteesi, että on olemassa ero ainakin kaksi kolmesta ryhmästä. Olkoon

μ

p

,

H

,

μ

p

,

M

ja

μ

p

,

keskiarvo ilmaus arvoja koetin

p

varten kolmeen ryhmään, niin on koetin-viisasta hypoteesia yksisuuntainen ANOVA

Tuloksena p-arvot säädettiin sitten useita testejä käyttäen Bonferroni korjausta.

toinen menetelmä, jota käytettiin vertailussa oli kaksi lavastettu logistinen regressio kanssa suopunki (LRL). Ensimmäinen, LRL levitettiin koko aineisto, jossa kaksi luokkaa terve /sairas. Viritystä parametri

λ

valittiin siten, että määrä valitun muuttujat olivat samalla tasolla suuruusluokkaa kuin tässä ehdotettu menetelmä tunnistaa. Toinen LRL ajo sitten levitettiin syöpätapauksista vain ja suunnattu erottaminen lieviä ja aggressiivinen PRCA. Lopulta tuloksena koettimet yhdistettiin yhdeksi tuloksena matriisi LRL analyysiin.

Jos haluat vertailla tuloksia ANOVA ja LRL kanssa täällä ehdotettu lähestymistapa, hierarkkinen klusterointi levitettiin tunnistettu koettimia käyttäen myös Kendallin tau pohjainen etäisyyden matriisiin. Sitten säädettiin Rand Index laskettiin välillä luokittelu kolmen eri clusterings ja todellisen syövän tilan yksilöiden tason määrittämiseksi sopimuksen.

Tulokset

Käyttäen suuntaava testausmenetelmää, 146 (87 korkeammat ilmaisua aggressiivinen PRCA ja 59, joilla on korkeampi ekspressio tarkastukset) ulos kaikkiaan 547 koettimet tunnistettiin, joilla on erilaiset ekspressioprofiileja. Sijainti kromosomissa merkittävät antureista ja tyypin testaus vaihtoehtoisia visualisoidaan kuvassa 3.

Merkittävät tulokset, jotka myös kuuluvat 10% tärkein (Gini Index) miRNA että Random Forest aikavälillä on merkitty HI antureista.

tunnistaa HI antureista tästä odottamattoman suuri määrä eri tavoin ilmaistuna antureista, Random Forest luokittelija sovellettiin myös ilmaisua tiedot. Merkittäviä koettimet, jotka olivat 10% tärkeimmistä koettimina Random Forest mitattuna Gini Index, kutsuttiin HI antureista ja on korostettu kuvassa 3. 13 tunnistettu koettimet edustavat kahdeksaa eri miRNA ja yksi spliceosomal RNA. Tarkempaa tietoa 13 tunnistettu koettimet lueteltu taulukossa 1.

Koko luokitustulos perustuu severeness arvoista

S

i

,

r

Random Forest visualisoidaan kuvassa 4. Terveet (vihreä) selvästi taipumus olla pienempi riski alueella, mutta aggressiivinen PRCA potilasta (punainen) ei yleensä suurempia arvoja kuin ei-aggressiivinen PRCA potilasta (keltainen). Lisäksi keskimääräinen luokitus nopeudella kaikkien luokittelu kulkee määritettiin erikseen vertailuja terveen ja PRCA ja aggressiivisten PRCA ja yhdistetty terve ja ei-aggressiivinen PRCA. Random Forest pystyi luokittelemaan PRCA joiden keskimääräinen AUC ROC noin 0,89 ja aggressiivinen punasoluaplasian verrattuna yhdistettyyn näytteitä ei-aggressiivinen punasoluaplasiassa ja valvonta 0,68 (kuvio 5). Luokittelu tulokset yksilötasolla visualisoidaan siinä olevat tiedot (S1 ja S2 kuvioissa).

Terveet verrataan yhdistettyä ei-aggressiivinen /aggressiivinen PRCA tulokset (musta käyrä), ja aggressiivinen PRCA luokituksia verrataan yhdistettyjen muiden ryhmien (punainen).

hierarkkinen klusterointi osoittaa, kuinka tärkeää HI-anturi. Klusterointi aineisto perustuu kaikkiin antureista aiheutti ainoastaan ​​hieman parempi luokitus kuin ryhmittely perustuu 13. HI antureista. Dendrogrammi klusterointi henkilöille perustuu 13 HI koettimet sekä vastaavat heatmap on esitetty kuviossa 6. Tässä kyky erottaa selvästi toisistaan ​​aggressiivinen ja ei-aggressiivinen punasoluaplasian rajoitettiin, mutta kiinnostavaa vain viisi 78 terveiden yksilöiden ryhmittyivät tiiviisti yhdessä PRCA yksilöitä. Sen sijaan 46 115 PRCA tapaukset olivat sisällä klusteri, joka sisälsi suurimman osan terveiden yksilöiden.

Red värit viittaavat heikkoa ilmentymistä arvoihin, kun taas vihreät värit ovat suuria ilmaus arvoja erityistä koetin. Mirna suunnattu tunnukset vastaavat annettuja koetin tunnukset on lueteltu taulukossa 1. Värit dendro- edustavat havaitun terveydentila (vihreä: terve, keltainen: non-Aggr. PRCA, punainen: aggr.PrCa)

lisäksi cis-eQTL (0.5MB ylös /alavirtaan ikkuna) HI koettimet tehtiin. Kaikkiaan 3863 SNP-miRNA yhdistysten testattiin, ja 79 oli p-arvo ≤ 0,01, (S3 kuvio siinä olevat tiedot). Kaikki SNP jotka havaittiin kuitenkin mahdollisen vaikutuksen HI-anturi testattiin sitten suoraa PRCA yhdistys soveltamalla Fisher-testi 2 × 3 välinen genotyypin ja terveydentila ryhmiä. Neljälle SNP merkittävä yhdistys löytynyt 53 genotyypit eQTL näytteiden (testi koko 0,05).

Näytteissä, joissa ainoastaan ​​genotyypin dataa käytettävissä, kuusi liittyvä SNP todettiin, mutta merkittävä SNP alkaen ensimmäinen, alustava testi ei voi vahvistaa kanssa ylimääräisiä genotyyppitietoja. Sekä tiedot asetetaan kuitenkin oli yksi, kunkin neljästä (15) merkittävästi niihin liittyvien SNP cis-sijainti miRNA HSA-miR-483-3p (katso taulukko 2 tarkemmat tiedot).

Ylempi osa on peräisin eQTL aineisto, ja alaosa on tulokset validointitiedot.

Lopuksi tässä ehdotettu menetelmä verrattiin myös ANOVA lähestymistapa ja LRL. Käyttämällä useita testaus säädetty merkitsevyystasolla

α

= 0,001 johti 14 merkittävää antureista, kun taas LRL viritys parametri asetettiin niin, että LRL tunnistettu 15 antureista olevan suurta kiinnostusta. Määrä leikkaavien antureista näiden kahden lähestymistavan oli seitsemän, kun taas leikkauspiste HIprobes kanssa ANOVA koettimilla oli vain viisi ja LRL jopa vain kolme. Verrattaessa laadun ryhmittely perustuu näihin antureista käyttäen oikaistu Rand Index, johti Rand indeksi 0,168 mittapäiden tunnistetaan tässä ehdotettu lähestymistapa, 0.130 että ANOVA ja 0,131 varten LRL lähestymistapaa.

keskustelu

tavoitteet tutkimuksen oli soveltaa uusia tilastollisia menetelmiä paremmin erottaa aggressiivinen alkaen veltto eturauhassyöpä ja ovat kestäviä vastaan ​​vieraita havaintoja ja kartoittaa ennustetekijöiden ja diagnostisten arvot verestä peräisin miRNA.

tässä tutkimuksessa käytimme yleinen Mann-Whitney lähestymistapa [15] yhdistettynä Random Forest algoritmi tunnistaa ilmentyvät eri miRNA. Yhdistämällä kahden menetelmän, pystyimme vähentämään merkittävästi paneelin mielenkiintoisia miRNA. Etuna tässä lähestymistavassa on, että se yhdistää tehokkaasti kahta eri menetelmää havaita mielekästä muuttujia. Jokainen lähestymistapa itse tunnistettu useita merkittäviä miRNA, jopa sen jälkeen ohjaamalla vääriä löytö määrä. Kuitenkin yhdistämällä nämä kaksi menetelmien lyhyempi lista miRNA mahdollisten edun vähentää tehokkaasti määrä vääriä positiivisia testituloksia. S4 kuvassa on tukeva tieto näyttää yksityiskohtia testin hylkäysten ja seuraukset Benjamini-Hochberg korjaus.

Ilman useita testaus korjauksen molemmat testit osoittivat hylkäämisaste noin 16% ja 10% testi koko 0,01. Hyväksyminen väärä löytö on 0,05% hylkäämisestä hinnat olivat edelleen suuruusluokkaa 5-10%. Sen sijaan, että ohjataan vain vääriä löytö määrä, useita testausmenetelmä oli jätetty pois, ja kokonaisuus menetelmä, joka yhdistää tulokset kahta erilaista lähestymistapaa käytettiin sen sijaan. Vaikka tämä tehtiin mahdollisesta kustannuksella monien väärien negatiivisten testitulosten, ’täällä tunnistettu joukko sai edelleen luottamusta yhdistämällä testitulokset.

Lisäksi kehittämiseen analyyttisiä välineitä, saaminen hyvät ottelut tapausten ja kontrollien välillä on tärkeää etenkin miRNA tutkimusta, joille havainnot joukossa tutkimukset ovat usein ristiriitaisia. Käyttö Suomi familiaalinen PRCA tapaukset ja niiden terveellistä sukulaisten käytössä vähentää taustan heterogeenisyys miRNA ekspressioprofiileja vähennettävä. Itse asiassa yksilöiden perheiden havaittiin jakaa miRNA allekirjoituksen spesifinen perheelle, ja perheenjäsenet olivat useammin ryhmittyneet vierekkäin. Niinpä informatiivinen miRNA biomarkkerit voidaan erottaa potilaita heidän terve kollegansa yksi perhe ovat erittäin mielenkiintoisia.

Altered miRNA ilme on tunnistettu eri syöpäsairauksia. Riippuen ilmentymisen profiili kasvain, ne voivat toimia joko onkogeenien tai tuumorisuppressorit.

Vastaa