PLoS ONE: miRConnect: tunnistaminen Effector geenejä miRNA ja miRNA perheet Cancer Cells

tiivistelmä

micro (mi) RNA: t ovat pieniä ei-koodaavat RNA: t, jotka negatiivisesti säätelevät ilmentymistä useimmissa mRNA: iden. Ne ovat voimakkaita säätelijöitä eri erilaistumisen vaiheissa, ja geenien ilmentymistä, jotka joko negatiivisesti tai positiivisesti korreloi ilmaisi miRNA odotetaan pitävän tietoa biologisesta tilasta solun ja siten, että toiminta ilmaisi miRNA. Olemme verranneet suuri määrä käytettävissä geenijärjestelyillä tiedot vakaassa tilassa järjestelmän NCI60 solulinjojen kahteen eri tietokokonaisuuksien joka sisältää tietoja ilmaus 583 yksittäisten miRNA. Lisäksi olemme luoneet mukautetun aineistoja, jotka sisältävät ilmaisun tietoa 54 miRNA perheiden jakavat saman siemenen ottelussa. Olemme kehittäneet uuden strategian korreloivat miRNA yksittäisten geenien perustuu tiivistää Pearson Korrelaatiokerroin (SPCC), joka jäljittelee

in silico

titrauksessa kokeilu. Keskittymällä geenejä, jotka korreloivat ilmaus miRNA olematta välttämättä kohdistu suoraa miRNA olemme ryhmittyneet miRNA eri toiminnallisia ryhmiä. Tämä on johtanut tunnistamiseen kolme uutta miRNA jotka liittyvät epiteelin-to-mesenkymaalitransitioon (EMT) lisäksi tunnetut EMT säätelijöinä

miR-200

miRNA perhe. Lisäksi analyysi geenin allekirjoituksia liittyy EMT, c-MYC aktiivisuutta, ja ribosomaalisen proteiinin geenin ilmentyminen antoi meille mahdollisuuden määrittää eri toimintoja kunkin toiminnallisen klustereita miRNA. Kaikki korrelaatio tiedot ovat saatavilla web-käyttöliittymä, jonka avulla tutkijat voivat tunnistaa geenejä, joiden ilmentyminen korreloi ilmaus yhden miRNA tai koko miRNA perheitä. miRConnect.org auttavat tunnistamaan reitit säätelevät miRNA ilman erityistä tietämystä miRNA tavoitteita.

Citation: Hua Y, Duan S, Murmann AE, Larsen N, Kjems J, Lund AH, et al. (2011) miRConnect: tunnistaminen Effector geenejä miRNA ja miRNA perheet syöpäsoluissa. PLoS ONE 6 (10): e26521. doi: 10,1371 /journal.pone.0026521

Editor: Lin Zhang, University of Pennsylvania School of Medicine, Yhdysvallat

vastaanotettu: 16 syyskuu 2011; Hyväksytty: 28 syyskuu 2011; Julkaistu: 26 lokakuu 2011

Copyright: © 2011 Hua et al. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Nämä kirjoittajat ei ole tukea tai rahoitusta raportoida.

kilpailevat edut: kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

Micro (mi) RNA: t ovat pieniä, 19- 22 nukleotidiä pitkiä, ei-koodaavat RNA: t, jotka säätelevät geenien ilmentymistä pääasiassa kohdistamalla 3’UTR mRNA mikä vähentää käännös proteiinien tai hajoamisen mRNA: iden. miRNA ovat keskeisiä säätelijöitä solujen erilaistumista ja kehitysprosesseja. Niitä on myös tunnustettu olevan erittäin merkityksellinen syövän muodostumisen ja etenemisen [1]. Äskettäin on osoitettu, että lähes kaikki ihmisen geenit ovat ohjauksessa miRNA [2]. Kuitenkin, koska miRNA säätelemään satoja kohdegeenien [3], ja monet geenit on kohdistettu useita miRNA [4], määrittämällä biologisia toimintoja miRNA tai miRNA perheet on ollut vaikea tehtävä.

miRNA sisältävät niiden 5’lyhyt pätkä 6-8 nukleotidin täydentävät siemen ottelun kohde-mRNA. Tämä täydentävyys on saatavilla laskennallisen analyysin ja useita algoritmeja on kehitetty ennustamaan miRNA tavoitteita [5]. Sen sijaan tavoite ennusteiden kanssa nämä algoritmit eivät ole riittävän tarkka päätellä biologinen toiminta miRNA perustuu pelkästään luettelot ennustetun tavoitteita. Target validointi tehdään yleensä joko yli-ilmentävät miRNA tai estämällä niiden toimintaa ja sen jälkeen mittaamalla muutoksia mRNA: n tai proteiinin tasot transfektoiduissa soluissa [2], [6]. Kuitenkin sekä yliekspressio ja eston miRNA on varoituksista [7], ja se ei ole selvää, onko havaitut muutokset mRNA ja proteiini taso ovat seurausta suoran sääntelyn miRNA tai ovat seurausta muutoksista alavirtaan miRNA kohdistetun geenejä.

Olemme äskettäin käyttäneet NCI60 solut [8], paneeli 60 syöpäsolulinjojen ylläpidettiin NCI, tunnistaa ja vahvistaa yhteyksiä miRNA ja tavoitteensa. Häiriöttömät array datapisteille ekspressiotasot satoja miRNA ja yli satatuhatta Geenikoettimia useilla array alustoilla tekevät NCI60 solut ainutlaatuinen järjestelmä tunnistaa syövän asiaan yhteyksiä miRNA ja geenien säätelee miRNA. Käyttämällä NCI60 systeemi aiemmin validoitu

HMGA2

ja

IMP1

kohteina

let-7

perheen miRNA [9], [10]. Lisäksi olemme tunnistaneet jäsenet

miR-200

perheen ja validoitu kaksi E-box sitova transkriptiotekijöitä,

ZEB1

ja

ZEB2

kohteina [11]. Viimeksi me validoitu tyrosiinifosfataasi–

FAP1

kuin

miR-200

kohdistaa [12]. Nämä esimerkit osoittavat voima NCI60 tietojen asettaa yhteyden miRNA niille asetettuja tavoitteita. Kuitenkin tunnistaminen yhden miRNA tavoitteet ilman Matkapuhelinyhteydessä tai tietoa kaikki tavoitteet varten miRNA vaikeuttaa yhteyden miRNA biologian tai patologian. Meidän tutkimukset

let-7

ja

miR-200

että NCI60 soluissa myös sallittua ennustaminen ja vahvistuksen biologisen toiminnan näiden miRNA.

Anna-7

todettiin olevan markkeri eriytetyn syöpäsoluja [9], [13], ja

miR-200

todettiin voimakas merkki ja säädin epiteelin-to -mesenchymal siirtyminen (EMT) [11], [14].

Suurin osa havainnoista tehtiin vertaamalla miRNA ja mRNA: n ilmentymisen tasoa, joka tuolloin oli yllättävää, ottaen huomioon, että miRNA nisäkässoluissa uskottiin enimmäkseen ratkaisunsa translationaalinen hiljentäminen vaikuttamatta mRNA ekspressiotasot. Se oli kuitenkin myös osoitettu, että mRNA: n runsaudesta useimpien kohteena geenien vaikuttaa jossain määrin miRNA [15], [16]. Vaikka on vielä kiistaa on hallitseva tapa, jolla miRNA säädellä geeniekspressiota [17], äskettäisessä tutkimuksessa todettiin, että huomattava määrä geenejä kohteena miRNA, horjuttaa mRNA on tärkein mekanismi proteiinin tukahduttamisen miRNA [18] havainto, joka tekee NCI60 mRNA /miRNA data asetetaan arvokas väline opiskeluun miRNA toiminta syöpäsoluissa.

transfektoimalla soluja joko miRNA tai miRNA inhibiittorit yleensä johtaa muutoksiin runsaasti useita mRNA: iden. Mielenkiintoista on, että mRNA: t, jotka ovat säätelee negatiivisesti miRNA löytyy, sekä suuri määrä mRNA: iden, jotka positiivisesti korreloi miRNA ilme. Nämä muutokset mRNA-tasojen on yleensä katsotaan johtuvan geenit coregulated kanssa miRNA tai toissijaisia ​​tapahtumia. Itse asiassa, on todennäköistä, että suurin osa geeneistä, joiden ilmentymistä reagoidaan ilmentymisen miRNA eivät ole suoria tavoitteita miRNA

sinänsä

, mutta ne ovat biologisia efektoreita merkitystä toiminnan kannalta miRNA. Varsinkin kun havaitaan kanssa vakaassa tilassa järjestelmän NCI60 solujen, nämä biologiset efektori geenejä voi olla tärkeää tietoa endogeeninen funktio miRNA. Tämä oli ilmeisin varten

miR-200

. Pieni muutos

miR-200

lauseke (noin 2-kertainen) johti maltillinen muutos mRNA tasoilla tavoitteensa

ZEB1

ja

ZEB2

(noin 5-7 kertainen), joka johti laajamittaiseen muutokseen

E-kadheriinin Twitter /

vimentiinista

suhde (yli 8 kertaluokkia) [11]. Valtava positiivinen korrelaatio ilmaus

miR-200

ja

E-kadheriinin Twitter /

vimentiinista

suhde pystyimme luovuttaa toiminnon ”epiteelisolujen säädin” on miR-200 perhettä jo ennen olimme tunnistettu

ZEB1

ja

ZEB2

kohteina. Kannustamana analyysi, olemme nyt käyttäneet NCI60 järjestelmä tunnistaa toissijainen korrelaattoreiden miRNA (joka voi olla tuhansia kuten tapauksessa EMT [19]) on genomin kattavan analyysin, koska ne voivat olla tärkeää tietoa biologisista tilan solussa.

Olemme kehittäneet uuden menetelmän klusterin miRNA tai miRNA perheitä niiden biologisen korrelaattoreita eikä niiden ennustettu tavoitteita tai niiden kromosomi-rinnakkais- tai niiden spesifistä ekspressiota. miRNA koottiin erillisiin toiminnalliset ryhmät mukaan ilmaus biologisen efek- geenejä. Olemme validoitu aktiivisuuden näistä klustereita, joka sisältää kaikki jäsenet

miR-200

perhe, säätelyssä epiteelin luonteen soluja. Tämä johti tunnistamiseen kolme uutta miRNA,

miR-7

,

miR-203

ja

miR-375

, toimiakseen epiteelin ylläpitoon. Lisäksi olemme tunnistaneet klusterit syövän asiaan miRNA jotka ovat joko kasvua edistävät tai kasvua tukahduttava luonnossa perustuu korrelaation niiden ilmaisun kanssa ilmaus joko ribosomaalisen proteiinien tai

c-MYC

säännelty geenejä. Olemme luoneet web-pohjainen käyttöliittymä, miRConnect.org, joka tarjoaa vankan ja helppokäyttöinen työkalu tutkijoille tunnistaa uusia yhteyksiä miRNA tai miRNA perheille ja geenejä, jotka ovat markkereita erilaisten biologisten valtioissa.

tulokset

Generation korrelaatioiden miRNA ja geenin ilmentyminen

jotta tutkia biologisten vaikutusten miRNA me ensin väliset korrelaatiot ilmaus miRNA ja geenejä. Olemme käyttäneet useita tietokokonaisuuksien saatavilla NCI60 soluja (59 solulinjoja): 1) ilmaus profiilia 208 ihmisen miRNA kvantifioitiin reaaliaikaisella PCR: llä (jäljempänä ”Q” data set) [20]; 2) neljä aineistoja ihmisen geeniekspressioprofiilien (Stanford, GENELOGIC_U95, GENELOGIC_U133 ja Novartis) saatavilla NCI Developmental Therapeutics Program (DTP) palvelimeen. Q tietokokonaisuus, 136 miRNA määriteltiin ilmaistaan ​​havaittavia määriä (arvioituna reaaliaikaisen PCR) vähintään 30 59 solulinjojen (taulukko S1). NCI60 solut edustavat 9 erilaista syöpiä. Cutoff 30 solulinjojen valittiin sisältää vähintään puolet solulinjojen, ja varmistaa, että ainakin neljä eri kudoksista peräisin olivat edustettuina. Etuna NCI60 järjestelmä on kyky yhdistää yksittäisten endogeenisen miRNA ilmaisua tavalla edustaa korreloimalla geeniekspression ilmaus koko miRNA perhe (eli kaikki 9 let-7 toiminta edustettuina Q-datan asetettu). 136 miRNA sisälsi jäsenet 24 siemen perheiden (miRNA että samaa siemen järjestyksessä useamman kuin yhden perheenjäsenen, taulukko S2). Lisäksi johtuen niiden ennustettu päällekkäisiä funktio, olemme tuotti muita räätälöityjä perheen kaikkien miR-200 perheenjäseniä; miR-200 jakautuu kahteen eri siemeniä perheisiin miR-141 /200a ja miR-200BC /429, erottaa vain yhden nukleotidin ero keskellä siementen sekvenssin [11], [14].

yleisimmät ja hyvin määritelty strategia tutkia miRNA-geeni yhdistysten on Pearsonin korrelaatiokerrointa (PCC) [21], [22]. Vaikka PCC on tehokas keino havaita korrelaatiota, sillä on rajoituksia. Esimerkiksi, PCC antaa saman painoarvon jokaisen mitattavan näytteen (esim. Solulinja, tietyn kudoksen tai potilaan näytteessä). Se ei erotella näytteiden korkean ilmentymisen ja niitä, joilla heikkoa ilmentymistä. Tämä voi vääristää korrelaatio analyysi, koska: 1) ilmentymistason miRNA hallussaan tärkeitä lainsäädäntöä koskevat tiedot; ja 2) kohina on todennäköisesti olemassa näytteissä, jotka sisältävät geenit heikkoa ilmentymistä. Siksi ajatellut tapa voittaa joitakin näistä rajoituksista. Yksi ratkaisu olisi määrittää eri painot korkean ja matalan ekspressiotasot. Kuitenkin, koska PCC laskenta ei ole lineaarinen prosessi, ei ole käytännöllistä lisätä painoja suoraan kuhunkin näytteeseen. Sen sijaan painotus tasolla otoksen valinnan havaittiin olevan käytännöllisempää, koska PCC eri paneelit solulinjan tietoja voitaisiin lisätä ylös ja vastaava mallintaminen olisivat jälleen lineaarinen. Tämän perusteella vastike, olemme kehittäneet uuden menetelmän ”kiteytti PCC” (SPCC). Standardi (suora) PCC (dPCC), The SPCC ja satunnaistetun SPCC (rsPCC) levitettiin tuottaa korrelaatioita ilmentymistä miRNA ja geenien, testata toistettavuus korrelaatiot ja tutkia erityisesti biologian miten miRNA työtä.

suora (d) PCC

tässä menetelmässä teimme standardin COMPARE analyysi [23], joka tuottaa PCC, tunnistaa mRNA: iden, jotka korreloivat ilmentymisen kunkin 136 miRNA. Tässä ja kaikissa seuraavissa COMPARE analyysit asetamme 30 kuin vähäinen määrä havaittavissa solulinjoja. Normalisoida ilmaisu- vaihtelua koettimia vastaavasti sisältyy neljä geenijärjestelyillä alustojen käynnistämisen lisäksi PCC laskettiin keskiarvo kullekin geeniä. Tällä menetelmällä saatiin PCC-arvon kullekin mRNA, joka korreloi merkitsevästi ilmaus miRNA.

Summattu (t) PCC

Tässä menetelmässä (kuviossa S1) muutimme laskennan miRNA-mRNA korrelaatio laskemalla sarja PCC arvojen matkien ”titraus” of miRNA ranking solulinjojen mukaan niiden ilmentyminen miRNA. Kutakin miRNA-mRNA pari, me lajitellaan miRNA ilmentymistä 59 solulinjoissa suurimmasta pienimpään, ja valittu top 30 solulinjat kuin alkuperäinen tila, koska nämä 30 solulinjat edustivat yläosan kaikkien solulinjojen ja mukana soluja vähintään 4 eri kudoksista peräisin. Suoritimme COMPARE analyysi myös näiden 30 solulinjoista (kuvio 30). Seuraavaksi solulinja sijoitus nro 31 oli mukana, ja COMPARE analyysi toistettiin näille 31 solulinjoista (kuvio 31). Toistuva COMPARE analyysit suoritettiin kunnes kaikki 59 solulinjat sisällyttää vähitellen tavalla, ja yhteensä 30 PCC arvojen kertyi (kuvio 30 ohjetta 59). Emme käytä liukuikkunaa kiinteän koon (1-30, 2-31, …, 30 ja 59), koska olemme aina halunneet sisällyttää solulinjat korkein ilmaus miRNA odottaa olevan suurin vaikutus kohde /efektori-geenit näissä solulinjoissa. Tämä lisäaine menetelmä osoitettu painoista gradientilla (tai titraus) tavalla, joka perustuu miRNA ekspressiotasoja. 30 solulinjat, joilla on korkein ilmaus olivat aina Jokaisessa COMPARE laskentaan ja osoitetaan korkein painot, koska odotimme suurimmat vaikutukset kohde /efektori geenit näistä solulinjoista. PCC summia keskiarvo kullekin geenin yksi neljästä geenijärjestelyillä alustoille.

Satunnaistettu summataan (rs) PCC

Jotta testi vakaus ja toistettavuus SPCC menetelmän, suunnittelimme satunnaistettu alkaen of SPCC sisäisenä kontrollina. Ainoa ero tämän menetelmän ja SPCC menetelmä oli, että solulinjat lajiteltu satunnaistetussa tavalla. Kutakin miRNA-mRNA pari, satunnaistettu lajittelu toistettiin 10 kertaa ja 10 rsPCCs laskettiin keskiarvo.

Euroopan SPCC menetelmä tarkasti havaitsee molemmat alavirtavaikuttajainhibiittorit geenit ja ennustettu tavoitteet korreloi miRNA

On tunnettu useista tutkimuksista, vaikka muuttamalla miRNA ekspressiotasot syöpäsoluissa aiheuttaa sekä ylös ja alas sääntelyn geenien, miRNA pääasiassa työn kautta negatiiviseen säätelyyn alavirtavaikuttajainhibiittorit geenien [15], [16]. Jotta testi Tämän havainnon kanssa menetelmissä log2 suhde arvot kaikista negatiivisista vs. kaikki positiiviset korrelaatiot laskettiin 136 miRNA vastaavasti kolmesta menetelmästä (dPCC, SPCC ja rsPCC). Vertailu jakauma 136 suhdearvot osoittaneet, että negatiivinen korrelaatio huomattavasti vähäisempiä positiivinen olevista SPCC analyysiin, mutta ei kahta muuta analyysit (kuvio 1A). Log2 suhde kanssa SPCC menetelmän merkittävästi siirtynyt oikealle verrattuna dPCC menetelmällä. Suurempi määrä miRNA että SPCC menetelmässä oli negatiivinen korreloimiseksi geenejä, jonka pohja pois satunnaista kohinaa dPCC menetelmässä (mediaani oli suunnilleen nolla). Kumulatiivinen käyrä rsPCC oli samanlainen kuin dPCC, mutta oli merkittävästi erilainen kuin SPCC. Tämä osoittaa, että SPCC menetelmä oli tehokkaampi havaitsemisessa negatiivista korrelaatiota kuin joko dPCC tai rsPCC menetelmällä.

(A) kumulatiivinen käyrä log2 suhde negatiivisesti vs. positiivisesti korreloivat geeni numerot 136 miRNA laskettuna dPCC, SPCC ja rsPCC menetelmiä, vastaavasti. X-akseli tarkoittaa log2 suhde arvot 136 miRNA niiden luokituksen mukaan pienimmästä suurimpaan, ja Y-akseli kuvaa kumulatiivinen osa 136 miRNA. Erot kumulatiiviset käyrät mitattiin yksipuolinen Kolmogorov-Smirnov testi. (B) vertailu kolme tapaa tunnistaa todennäköisin säilytetty TargetScan ennusti tavoitteet ihmisen genomin (yhteensä 33535 ennustetun kohdistaminen tapahtumia). Target ennustukset paremmuusjärjestykseen kokonaisyhteys pisteet suurimmasta pienimpään. Portaittain ylhäältä 50 alkuun 500 miRNA-geeni pareittain korkeimmat yhteydessä tulokset, suhde arvot negatiivisen vs. positiivinen korrelaatio luvut laskettiin ja piirretään kolmella tavalla.

Seuraavaksi pyrittiin verrata tehokkuutta kolme menetelmää havaitsemaan ennusti tavoitteita. Päätimme TargetScan, joka on laajalti käytetty kohde ennustusalgoritmia, koota luettelon kaikista ihmisen miRNA-geenin paria, joihin 136 miRNA. Luetteloa lajiteltu kokonaisyhteys pisteet (määritelty TargetScan varten konservoitunut tavoitteet) suurimmasta pienimpään (taulukko S3). Sitten vähitellen ylhäältä 50 alkuun 500 miRNA-geeni paria, suhteet negatiivisen vs. positiivinen korrelaatio luvut laskettiin ja piirrettiin. Vain SPCC menetelmällä, tämä suhde kasvoi yhdessä kasvua koko konteksti pisteet (kuvio 1 B). Siksi tuloksia kaikille korrelaatioita ja korrelaatiot osalta ennustettu tavoitteet sekä ehdotettu, että SPCC menetelmä suoritetaan huomattavasti parempi teoreettisella tasolla kuin joko dPCC tai rsPCC menetelmällä.

Euroopan SPCC menetelmä tarkasti havaitsee ilmaus miRNA jotka on linkitetty yhteen palvelimeen geenejä sekä klustereita

HOX

geenien

lisäksi teoreettisella tasolla, oli tarpeen testata kyky SPCC menetelmää tunnistaa miRNA /gene yhteydet, jotka on perustettu tunnettu biologisissa järjestelmissä. Siksi hyödyntäneet Sekä isäntägeenejä ja homeobox (

HOX

) geenejä, jotka ovat hyvin tunnettu yhteyksiä ilmentymistä tiettyjen miRNA.

Monet miRNA on koodattu sisällä samapaikkaisen geenit (isäntägeenejä ) ja osuus promoottorit niiden kanssa. Expression näistä miRNA ohjaavat promoottorit niiden isäntägeenejä, ja positiivinen korrelaatioita ilmaus miRNA ja vastaanottavan geenit on raportoitu [22], [24]. Hyödyntämällä tätä tietoa, analysoimme kuinka usein yhteistyössä transkriptio miRNA ja niiden isäntägeenejä saattaa johtaa positiiviseen korrelaatioita että NCI60 aineistoja. Niistä 136 miRNA, 65 koodattuna isäntägeenejä (kuva 2). Sekä SPCC ja dPCC analysoi useita myönteisiä korrelaatioita isäntägeenejä ja niiden samapaikkaisen miRNA kaukana numeroitu niitä negatiivisia korrelaatioita (kuvio 2A ja 2B). Toisin analyysin kanssa rsPCC menetelmä johti satunnainen jakauma positiivinen ja negatiivinen korrelaatio (tuloksia ei ole esitetty). Tulokset SPCC /dPCC menetelmät olivat vertailukelpoisia, mikä viittaa siihen, että toistettavuus NCI60 aineistoja oli korkea ja SPCC menetelmää tunnistaa korrelaatioita oli yhtä hyvä kuin dPCC menetelmän ollessa kyseessä yhden isäntägeenejä.

(

) SPCC ja (

B

) dPCCs arvot on annettu 73 miRNA /isäntä geenin paria edustettuna Q datajoukon ja geenien ilmentyminen aineistoja joita on esiintynyt vähintään yhden menetelmiä. Uudelleenanalysoinnissa tietojen vertaamalla SPCC /30 kanssa dPCC arvojen kanssa sulku 0,2 paljasti, että kaksi menetelmää eivät eroa toisistaan ​​niiden kyky ennustaa isäntägeenejä (joko parillista t-testiä tai pariksi Wilcoxonin testi).

Seuraavaksi halusimme onko SPCC menetelmä toimisi tehokkaammin kuin dPCC menetelmä tunnistamaan tiettyjä yhteistyössä transkription. Otimme etuna

HOX

geenejä ainutlaatuisen järjestelmän neljän geeniryppäät, joista kukin sisältää ainakin yhden geenien välinen miRNA.

HOX

geenit säätelevät sikiön kehityksen nisäkkäillä ne ryhmitellään 4 klustereihin (

HOXA-D

) ja 9.-11 geenien [22], [24]. Useimmat HOX-geenit korreloi positiivisesti yhteistyössä lokalisoitu miRNA (punaiset laatikot kuviossa 3A). Mielenkiintoista on, että

HOXA

,

HOXC

, ja

HOXD

klusterit satama yksi miRNA-geenin kukin ja

HOXB

sisältää kaksi (kuvio 3A). Ensin lasketaan dPCCs ja sPCCs neljiin miRNA (

miR-10a

,

-10b

,

-196a

,

-196b

), joka koodataan sisällä HOX klustereiden, ja kaikki ihmisen geenit. Havaitsimme, että SPCC menetelmässä 3 on

4

klustereiden HOX-geenin vieressä co-lokalisoitu miRNA oli suurin positiivinen korrelaatio näiden miRNA ulos ~18,000 ihmisen geenien (

miR -196b Twitter /

HOXA9

,

miR-196a Twitter /

HOXC10

ja

miR-10b Twitter /

HOXD8

; rohkea punainen ruuduilla kuviossa 3A). Kuitenkin dPCC menetelmässä, näin oli vain kaksi klustereiden (

miR-196b Twitter /

HOXA10

ja

miR-196a Twitter /

HOXC10

) (tuloksia ei ole esitetty). Kunkin 136 miRNA, laskimme SPCC arvot geenien 4

HOX

geeniklustereista. SPCCs Kaikkien

HOX

geenien klusterissa lisättiin ylös ja miRNA rankattiin mukaan kumulatiivinen SPCC kunkin

HOX

klusterin (kuva S2). Merkillistä, jokaisen klusterin oli yksi miRNA joka selvimmin korreloi ilmaus

HOX

geenien että klusteri (punainen sarake kuvassa S2), ja kussakin tapauksessa se oli miRNA koodattu kyseisessä klusterissa. Edelleen vertailla suorituskykyä SPCC ja dPCC menetelmiä me piirretään kumulatiivinen SPCC ja dPCC tulokset kunkin

HOX

geeni klusterin vs. korreloiva miRNA (kuvio 3B ja 3C). Kumulatiivinen SPCC ja dPCC negatiivisesti korreloivat

HOX

geenejä on myös esitetty, mutta oli merkityksetön. Olemme myös

miR-99a /99b

ja

miR-100

tässä analyysissä, koska ne on hyvin samankaltainen kanssa

miR-10a

ja

miR-10b

[25]. Jälleen kerran, SPCC suoriutuivat paremmin kuin dPCC menetelmää havaitsemalla oikein

HOX

geenin klusteri, joista kukin korreloi miRNA vasten vähän taustaa signaalin muihin ryhmiin.

(

) rakenne neljän nisäkkään

HOX

geeni klustereiden sijainnin isännöi miRNA.

HOX

geenien boxed punaisella havaittiin positiivisesti korreloi isännöi miRNA käyttäen SPCC menetelmällä. Kunkin klusterin

HOX

geeni vahvimmin korreloi miRNA joka on kyseisessä klusteri on kehystetty lihavoitu punaisella. (

B

) sPCCs kaikkien yksittäisten

HOX

geenejä kussakin klusterissa laskettiin yhteen ja funktiona jäsenet

miR-10 Twitter /

miR-196

perhe ja

miR-99a

,

-99b

ja

-100

. (

C

) Sama kuin

B

mutta luotu käyttäen dPCC menetelmää.

Yhteenvetona nämä tulokset osoittavat, että vakaan tilan järjestelmän NCI60 mRNA ja miRNA data on käyttökelpoinen havaitsemisessa biologisesti mielekkäitä yhteyksiä miRNA ja niiden isäntägeenejä. SPCC menetelmää, joka oli suunniteltu jäljittelemään miRNA titraus kokeilu, oli ylivoimainen dPCC menetelmän kahdessa kokeessa (negatiivinen korrelaatio ilmaistaan ​​mRNA: t ja

HOX

geeni klusterin korrelaatio) karakterisoinnissa käyttää lähestymistapamme. SPCC menetelmää, siis käytettiin seuraavassa analyyseissä.

miRConnect.org, haettavissa web-käyttöliittymä tutkimaan yhteyksiä miRNA ja niiden biologiset efektori geenit

Kuten käyttöön edellä, lisäksi varsinainen kohdegeenien, geenejä, joita ei odoteta olevan miRNA tavoitteista sekä suuri määrä sekä positiivisesti että negatiivisesti korreloivia geenejä voi olla tärkeää tietoa suhteen asemaa miRNA cellular ekspressiotasot, jotka voivat tarjota käsityksen biologista aktiivisuutta miRNA. Kaikki negatiivisesti ja positiivisesti korreloivia geenit 136 miRNA ja 25 miRNA perheet määritettiin sekä dPCC ja SPCC menetelmä Q tietojoukon, sekä tiedot siitä, kuinka monta niistä ennustetaan tavoitteensa TargetScan 5,0, löytyy alle miRConnect-Q haettavissa web-käyttöliittymä: miRConnect.org (tai miRConnect.net) B

klusterointi miRNA perustuu päällekkäisiä niiden korreloivat geenien

tiedot osoittivat, että käyttämällä NCI60 aineistoja ja SPCC menetelmä voisi olla hyödyllistä havaita biologisesti relevantteja yhteyksiä miRNA ja niiden alavirtavaikuttajainhibiittorit geenejä, jotka saattavat antaa uusia oivalluksia biologista aktiivisuutta miRNA. Olemme väitti, että geenit joko negatiivisesti tai positiivisesti korreloi tiettyyn miRNA tulee olemaan yhtä tärkeää, koska jokainen joukko voi sisältää markkereita biologisen aseman säännelty vastakkaisiin suuntiin. Esimerkiksi

E-kadheriinin

ja

vimentiinista

, joka positiivisesti ja negatiivisesti korreloivat ilmaus

miR-200

perhe, vastaavasti (

CDH1

ja

VIM

taulukossa 1), sekä piste EMT liittyvä toiminto on

miR-200

. Siksi ehdotimme, että joko negatiiviset tai positiiviset korrelaatiot saattavat itsenäisesti määritellä erityinen biologinen asema miRNA tai ryhmä miRNA.

Jotta testata tätä oletusta, valitsimme alkuun 2000 positiivinen ja top 2000 negatiivinen korrelaatio ja vastaavien geenien kullekin 136 miRNA, ja suoritetaan hierarkkinen klusterointi ryhmitellä 136 miRNA. Valitsimme 2000 sulku, koska tämä määrä kattoi noin 10% kaikista geeneistä, joiden pitäisi johtaa poistamiseen kaikkein taustamelua. Klusterointi, joka perustuu pareittaisten vertailujen edustaa leikkauspisteen geenien merkittävästi korreloivat niiden ilmentymisen ilmentyminen kahdella eri miRNA (kuvio 4 ja kuvio S3). Kun positiivisesti korreloivat geenejä arvioitiin useita miRNA tiukasti ryhmitelty yhteen (kuva 4). Samoin monia samoja miRNA ryhmittyivät yhteen, kun negatiivisesti korreloivat-geenejä käytettiin (kuvio S3). Vaikka lukuisia mekanismit voivat olla vastuussa tästä klusterointi, me viitata näihin kuin ”toiminnallinen klustereita”.

miRNA jaettiin 13 toiminnallisia klustereita (I-XIII). Tiedot annetaan jokaiselle miRNA kudokseen ilmentymistä genomista kolokalisaation, ja siemenet perhe. Stippled rivi: kynnys 12,5% olevien ryhmien valittiin määritteli 13 klustereita.

Mielenkiintoista, kaikki 5 jäsenet

miR-200

perheensä tiukasti klusteroiduista sopusoinnussa niiden samankaltainen biologinen aktiivisuus (klusteri I kuvassa 4 ja klusterin VI kuvassa S3). Sen lisäksi, että

miR-200

, useita muita rakenteellisesti sukua miRNA muodostettu toiminnallinen klustereita mukaan jaetun määrän efektori- geenejä. Useat siemenet perheitä, kuten

miR-181abc

,

miR-19ab

,

miR-221/222

,

miR-103/107

ja

miR-135ab

, ryhmittyivät yhteen tiiviisti. Sen sijaan jäsenet useiden muiden siementen perheitä havaittiin hajallaan eri toiminnallisia klustereita (esimerkiksi

let-7

tai

miR-30

perhe). Tämä ilmiö ehdotti, että ryhmittely miRNA perustui osittain, mutta ei rajoitu miRNA siemen sekvenssit.

ryhmittämistä miRNA tässä analyysissä oli osittain johtuu siitä, että jotkut perheenjäsenet ovat osa samaa transkription yksikkö. miRNA että osuus kromosomi kolokalisaation ja myös löytyy samoja toiminnallisia klustereita sisältyi transkription yksiköitä

miR-106b /93/25

,

miR-17~92

,

miR -194-+2 /192

,

miR-183~182

,

miR-99b /let-7e /125a

,

miR-206 /133B

.

joissakin tapauksissa miRNA ryhmittely perustui kumpikaan siemen ottelu eikä genomisen lokalisointi. Esimerkiksi jäseniä sekä

miR-141 /200A

ja

miR-200BC /429

siemen perheiden ryhmittyivät yhteen, vaikka ne muodostavat kaksi geeniryppäät eri kromosomeja (cluster I ” Gene klusteri ”sarakkeessa kuvassa 4).

NCI60 solulinjat edustavat 9 erilaista ihmisen syövissä. Sen määrittämiseksi, onko havaittu kasautumiseen miRNA johtui osittain kudosten erityinen ilmaisu joko miRNA tai mRNA: iden, tunnistimme miRNA jotka ilmentyy missään 9 ihmisen syöpätyyppejä (taulukko S4; Taulukko S5). Jotkut korrelaatiot kudoksen alkuperän löytynyt. Esimerkiksi sekä klustereita I (mukaan lukien

miR-200

perheen ja

miR-194

) ja XI (mukaan lukien

miR-30

perhe) sisälsi suurimman osan miRNA jotka on rikastettu koolonkarsinoomasoluissa (kuvio 4). Koolonkarsinoomasoluissa voi olla enemmän epiteelin kaltainen ominaisuus kuin useimmat muut syövän solulinjat.

Yhteenvetona nämä tiedot osoittivat, että vaikka yhteinen siemenet sekvenssit, kromosomi kolokalisaation, ja kudosspesifisiä ilmaisun todennäköisesti vaikutti yhteistyötä ilmaus miRNA tiettyjen geenien ja siten niiden ryhmittely, monet miRNA ryhmittyivät muista syistä. Merkittävä tekijä, joka määrittää ryhmittely voisi olla biologinen funktio miRNA, koska ryhmittely perustuu risteyksessä geenin sarjaa, joka positiivisesti korreloi merkittävästi kahden pariksi miRNA. Esimerkiksi

miR-200

,

-203

,

-375

ja

-7

, jotka on koottu yhteen kuviossa 4 ja kuviossa S3 , ei ole sama siemen järjestyksessä, genomista rinnakkaispaikantumisen tai erityismääräys samassa kudoksessa. Syy ne ryhmitellä näyttää olevan, että ne jakavat samanlaiset biologinen funktio EMT asetuksessa.

tunnistaminen miRNA perheiden osallisena solujen kasvun säätelyssä

c-MYC

ei ole vain yleinen säätelijä miRNA toiminta ja ilmaisu, mutta myös itse säädellä miRNA [26], [27]. Sen määrittämiseksi, onko ryhmittely miRNA mukaan identiteetin korreloimalla geenit tunnistaa yhteyden miRNA ja

c-MYC

, käytimme luettelot geenejä, jotka ovat joko voimistunut (460 geenit) tai vaimentua (211 geenit), jonka

c-MYC

(saatu https://www.myc-cancer-gene.org/), ja määritetään, kuinka monta niitä oli joko positiivisesti tai negatiivisesti korreloi ilmentymisen kunkin 136 miRNA. Tulos visualisoidaan kuviossa 5. merkitys rikastaminen korreloimalla geenien määritettiin suorittamalla Wilcoxonin Rank-Sum Test. Merkitsevyystasolla on merkitty laatikot eri värejä. On selvää, tietyt klustereita miRNA olivat positiivisesti, ja toiset olivat korreloivat negatiivisesti joko

c-MYC

aiheuttama tai

c-MYC

tukahdutettu geenejä.

Vastaa