PLoS ONE: evoluutiohistoriasta Cancer Immunity antigeeni MAGE Gene Family

tiivistelmä

evoluution tila monen geenin perhe voi muuttua ajan myötä riippuen toiminnallinen eriyttäminen ja paikallinen genomista ympäristö perheenjäseniä. Tässä tutkimuksessa osoitamme tällaista muutosta melanooma-antigeeni (

MAGE

) geeniperheen on nisäkkäiden X-kromosomi.

MAGE

geeni perhe koostuu kymmenestä subfamilies, jotka voidaan luokitella kahteen tyyppiin. Tyyppi I geenit ovat suhteellisen uusia alkuperää, ja ne koodaavat epitoopit HLA (HLA) syöpäsoluissa. Tyyppi II geenit ovat suhteellisen vanha ja joidenkin tuotteiden tiedetään olevan osallisena apoptoosin tai solujen lisääntymisen. Evoluutiohistoriasta on

MAGE

geeniperheen voidaan jakaa neljään vaiheeseen. Vaiheessa I, yhden kopion tilaa, jossa esi-geenin ja evolutiivisesti säilytetty tila oli kesti syntymistä eutherian nisäkkäitä. Vaiheessa II, kahdeksan subfamily esivanhemmat, lukuun ottamatta varten

MAGE-C

ja

MAGE-D

subfamilies, muodostettiin kautta retrotranspositiossa itsenäisesti. Tämä vastaisi kanssa osaksi puhkeamisen

LINE

elementtejä klo eutherian säteilyä. Kuitenkin

MAGE-C

synnytettiin geenin päällekkäistä

MAGE-A

. Faasi III on ominaista laaja geenikahdennustapahtuman kussakin alaheimon ja erityisesti muodostumista palindromien

MAGE-A

alaperheessä joka tapahtui esi Catarrhini. Vaihe IV on tunnusomaista rappeutuminen palindromi useimmissa Catarrhini, lukuun ottamatta ihmisillä. Vaikka palindromi on katkaistu tiheään deleetioita apinoita ja vanhan maailman apinat, se säilyy ihmisellä. Täällä väittävät, että tämä ihmisen erityinen säilyttäminen perustuu negatiivisen valinnan toimivat

MAGE-A

geenit koodaavat epitooppeja syöpäsolujen, joka säilyttää niiden kyky sitoutua hyvin erilaisten HLA-molekyylejä. Nämä havainnot tulkitaan harkiten biologisten tekijöiden muotoiluun äskettäin ihmisen

MAGE-A

geenejä.

Citation: Katsura Y, Satta Y (2011) evoluutiohistoriasta Cancer Immunity antigeeni

MAGE

Gene Family. PLoS ONE 6 (6): e20365. doi: 10,1371 /journal.pone.0020365

Editor: Nikolas Nikolaidis, California State University Fullerton, Yhdysvallat

vastaanotettu: 14 helmikuu 2011; Hyväksytty: 18 huhtikuu 2011; Julkaistu: 10 kesäkuu 2011

Copyright: © 2011 Katsura, Satta. Tämä on avoin pääsy artikkeli jaettu ehdoilla Creative Commons Nimeä lisenssi, joka sallii rajoittamattoman käytön, jakelun ja lisääntymiselle millä tahansa välineellä edellyttäen, että alkuperäinen kirjoittaja ja lähde hyvitetään.

Rahoitus: Tämä työ tukivat Grant-in tuki tieteellisen tutkimuksen Priority Areas (17018032). Rahoittajat ollut mitään roolia tutkimuksen suunnittelu, tiedonkeruu ja analyysi, päätös julkaista tai valmistamista käsikirjoituksen.

Kilpailevat edut: Kirjoittajat ovat ilmoittaneet, etteivät ole kilpailevia intressejä ole.

Johdanto

evoluution tila geenin perhe, eli prosessi syntymästä ja kuolemasta geenien ja laajuudet sekvenssin eroavaisuuksia, riippuu toiminnallisen eroavuus monistaa geenejä sekä paikalliseen rakenteeseen genomin, jossa perhe asuu [1], [2]. Täällä, paikallinen rakenne genomin viittaa tandem tai ylösalaisin toistot (IR). Kehitys geeniperhettä IRS voi olla erityisen monimutkainen seurauksena homogenoinnin tiheällä geenikonversiota ja rakenteellinen epävakaus kuten johtuu usein lisäyksiä ja /tai poistoja.

Warburton et al. (2004) löysi voittopuolisesti suuri, IR, joilla on korkea samankaltaisuus toistojen X- ja Y-kromosomia (-30% IRS ihmisen perimässä ovat X- ja Y-kromosomia) [3]. Monet IR X ja Y sisältävät geenit ilmaistaan ​​pääasiassa kiveksissä [3]. Warburton ja hänen kollegansa ehdotti, että nämä IR tärkeä rooli ihmisen genomin evoluutio. Kuitenkin tarkka rooli IR evoluutiossa on jäänyt epäselväksi. Siksi tässä tutkimuksessa, pyrimme tutkimaan tempo ja tila geeniperheen evoluution IR, joilla on erityinen painopiste on melanooma-antigeeni (

MAGE

) geeniperheen, jonka jäsenet sijaitsevat suuri ( -100 kb) palindromi ihmisen X-kromosomissa.

MAGE

tunnistettiin alun perin ”melanooma-antigeenin” ja myöhemmin

MAGE

ja sen homologeista, havaittiin muodostamiseksi multi-geeniperheen eutherian genomien [4] – [7].

MAGE

homologiset sekvenssit on todettu joitakin selkärankaisten (seeprakala ja kana) [8], [9] ja selkärangattomat (banaanikärpäsen) [10]. Ihmisen perimässä, tämä perhe koostuu 10 subfamilies ja kukin subfamily koostuu yhdestä 15 geeneihin [7]. Lisäksi luokittelu alaperheessä

MAGE

geenejä voidaan myös jakaa tyypin I tai tyypin II, joka perustuu niiden ilmaisun kuvioita ja toiminta. Tyypin I geenit koostuvat kolmesta alaperhettä (

MAGE-A

, että –

C

) ja tyypin II geenejä seitsemän alaperhettä (

MAGE-D

ja –

F

, –

H

, –

L2

,

NDN

,

NDNL2

). Tyypin I geenit ilmentyvät voimakkaasti lisääntyvien solujen kuten kasvaimia, istukka ja ituradan solujen [4]. Tyyppi II geenejä, sitä vastoin ovat läsnä kaikissa somaattisissa soluissa, ja jotkut tyypin II geenejä tiedetään olevan osallisena apoptoosin tai lisääntyminen [11].

Kaikki tyyppi I

MAGE

geenit sijaitsevat X-kromosomissa ja koodata kasvaimen antigeenejä, joilla on tärkeä rooli syövän koskemattomuus. Peptidit ihmisen MAGE-homologiadomeeni (MHD), joka on 160-170 aminohappoa pitkä, ovat epitoopit HLA (HLA) luokan I molekyylien [4]. Kun antigeeni (peptidin MHD) kasvainsolun sitoutuu reseptoriin on tappaja-T-solujen, T-solujen iskujen kasvainsolun [4], [12].

HLA

on poikkeuksellisen polymorfinen ihmisen perimän ja eri

HLA

alleelit voivat sitoutua eri epitooppeihin [13], [14].

MAGE

geenit voivat koodata monia epitooppeja niin, että se sitoutuu, tai reagoida sen kanssa, joka HLA-molekyylin. Siten on kiinnostavaa alkuperän jäljittämiseksi yhdistyksen välillä

HLA

ja

MAGE

sekä määrittää, miten geneettinen monimuotoisuus epitooppia koodaava alue on kehittynyt ja pysynyt.

Monet

MAGE

geenit arvellaan olevan nisäkkään-erityinen [7]. Lisäksi useimmat eutherian

MAGE

geenit on yksi eksoni koodata proteiinia ja siksi he ovat todennäköisesti peräisin retrotranspositiossa on

MAGE-D

[7], koska vain

MAGE-D

alaperheen jäsenten on 14 eksonia, jossa ORF on välissä koodattuja toinen 12 eksonit [15]. Silti suhde tyypin I ja tyypin II geenejä ei ole täysin tutkittu ja tila monipuolistaminen näiden geenien edelleen epäselvä.

Tässä tutkimuksessa tutkimme evoluutiohistoriasta

MAGE

geeniperheen. Ensin etsittiin eniten muinoin poikkesivat

MAGE

geenien selkärankaisten ja selkärangattomien genomien. Toiseksi tutkimme miten ja milloin esi kunkin kolmen tyypin I ja seitsemän tyypin II subfamilies kertyi erityisesti viitaten niiden tila vahvistusta. Kolmanneksi keskitymme

MAGE

subfamily (yksi tyypin I subfamilies) ja osoittavat, kuinka genomin järjestely on tapahtunut kädellisillä. Lopuksi osoitamme, että jotkut ihmisen

MAGE

geenit ovat läpikäyneet negatiivisen valinnan vastaan ​​homogenointi geenin muuntaminen säilyttääkseen niiden geneettisen vaihtelut joukossa aminohapposekvenssejä. Ehdotamme, että tämä valinta liittyy ylläpitoon erilaisten HLA-epitooppien syöpäsoluissa.

Materiaalit ja menetelmät

Jaksot käytetään

Human (

Homo sapiens

) nukleotidisekvenssi datan ja vastaavan geenin tietoja saatiin NCBI-tietokannan (rakentaa 36,3, https://www.ncbi.nlm.nih.gov/). Syntenic tai homologinen geenisekvenssejä muista kädellisistä ja nisäkkäiden, mukaan lukien opossumeja (

Monodelphis domestica

) ja platypuses (

Ornithorhynchus anatinus

), haettiin NCBI ja Ensembl tietokantoja (http: //uswest .ensembl.org /index.html). Löytää konservoituneen synteny välillä ihmisen X-kromosomi ja kromosomia muissa eläimissä, BLAST-analyysien avulla ihmisen

MAGE

geenejä kyselyt tehtiin. Tunnistaa homologiset sekvenssit, käytämme 70% kuin cut-off-arvo BLAST hauissa.

tunnistaminen perimän rakenteita

tunnistaminen IR ja tandem-toistojen suoritettiin käyttäen matriisitulostimella lähestymistapa [ ,,,0],16]. GenomeMatcher [17] käytettiin sitten saada yksityiskohtaista tietoa nukleotidisekvenssin samankaltaisuuden päällekkäisiä yksikköä. Kaavio piirtämä ohjelman kuvaa laajuutta samankaltaisuuden sekvenssien avulla värikoodit, punaiset edustavat samankaltaisuutta yli 95%, oranssi, jotka edustavat noin 90% -95%, vihreä, jotka edustavat noin 85% -90%, ja sininen edustaa alempi kuin 85 %.

fylogeneettinen ja molekyylitason kehittyvä analyysit

tutkia fylogeneettiseen välisiä suhteita

MAGE

perheenjäsenet, 158 koodaavat sekvenssit (CDS) ihmisen, simpanssin (

Pan troglodytes

), makaki (

Macaca mulatta

), hiiri (

Mus musculus

), lehmä (

Bos taurus

), koira (

Canis lupus

), opossumi, Platypus, kana (

Gallus gallus

) ja seeprakalalla (

Danio rerio

) genomin haettiin NCBI tietokannasta (taulukko S1).

MAGE

homologeja myös haettavissa Ensembl tietokantaan Länsi Afrikkalainen kynsi sammakko (

Xenopus tropicalis

), nahkiais- (

Petromyzon marinus

), lancelets (

Branchiostoma floridae

), vaippaeläinten (

Ciona intestinalis

) ja merisiili (

Strongylocentrotus purpuratus

). Kullekin näistä lajeista, etsittiin

MAGE

homologit koko genomit. Vuonna etsii homologeja,

MAGE-D

alaperheen jäseniä käytettiin kyselyn, koska

MAGE-D

ajatellaan olevan esi

MAGE

subfamily [7] . Kun käytämme muita ihmisen

MAGE

sekvenssit kuin kyselyn, huomasimme, että sekvenssit havaittu sisältyivät jo saatu tulos

MAGE-D

.

Ihmisen genomin oli 37 selityksin

MAGE

geenejä X-kromosomissa 15

MAGE-a

s, 11

MAGE-B

s, kolme

MAGE-C

s, viisi

MAGE-D

s, kaksi

MAGE-E

s ja yksi

MAGE-H

. Lisäksi kaksi

MAGE-F

s sijaitsevat kromosomissa 3, ja

necdin kaltainen 2

(

NDNL2

tai

MAGE-G

)

MAGE kaltainen 2

(

MAGE-L2

) ja

necdin

(

NDN

) ovat kromosomissa 15. lisäksi selityksineen geenejä, eli homologinen sekvenssi (

psMAGEA-like: psMAGEAL

, NC_000023: 2765558 ‥ 2770471), joka vastaa ihmisen

MAGE

pseudogeeniä,

psMAGEA

(NC_000023: täydentävä 151952946 ‥ 151957859), tunnistettiin. Gene lyhenteitä käytetään tässä tutkimuksessa noudattavat standardeja käytetään ihmisten geenien.

Saadut sekvenssit rinnakkain käyttämällä ClustalW ohjelmistojen [18] käsin korjauksia. Sekvenssit ihmisen

MAGE-H

, –

A5

, ja hiiri –

A9

olivat lyhyitä. Nämä hylättiin, koska sisällyttäminen näiden sekvenssien teki mielekästä sekvenssikohdistuksen lyhyt. Lukumäärä nukleotidierot kohti päällä (

p

-Etäisyys) laskettiin sitten käyttäen MEGA4 [19], ja phylogeny rakennettiin käyttäen naapuri-liittymällä (NJ) [20] menetelmä saatavilla tämän ohjelmiston. Phylogenies myös rakennettu Satunnaistettu A (x) ccelerated Farrow (RAxML) [21] ja Bayes (Bayes) menetelmät. Ohjelma varten RAxML menetelmä tarjoaa https://phylobench.vital-it.ch/raxml-bb/ja että Bayes menetelmän MrBayes 3 [22]. Rinnastuksia käytetään tässä ovat saatavilla pyynnöstä. DnaSP V5 [23] on käytetty ikkunassa analyysi nukleotidin eroja. RepeatMasker [24], käytettiin seulomaan sekvenssejä välissä toistojen NCBI-tietokannasta. Ohjelma, GENECONV [25] havaitsemiseen käytettiin geenin muuntaminen.

Transkriptiotekijän sitoutumiskohdat

Transkriptiotekijän sitoutumiskohdat (TFBs) tutkittiin käyttäen Transfac R4.3 tietokannan [26], saatavilla TFBIND verkkosivuilla (http: //tfbind.ims.u-tokyo.acjp/) [27]. Löytää ehdokas TFB, sekvenssit ylävirtaan kohdegeenien yhtenäistettiin, ja hyvin säilyneitä sekvenssit valittiin. Sekvenssit tarkastettiin läsnäolo TFBs selityksin tietokantaan.

Tulokset

alkuperä selkärankaisten ja nisäkkäiden

MAGE

geeniperheen

Tunnistaa

MAGE

homologien nahkiais-, lancelets, vaippaeläimet, ja merisiilit, BLAST haku suoritettiin niiden genomin ja EST-sekvensseihin käyttäen

MAGE-D

geenejä kyselyitä. Vaikka ei ollut havaittavissa homologisia geenejä nahkiais- ja merisiilien, hypoteettinen geenejä sekä vaippaeläinten (XM_002119518) ja lancelets (XM_002613563) osoitti 37% sekvenssin samankaltaisuus ihmisen

MAGE-D1

. BLAST hakutulokset osoitti, että syntyminen

MAGE

geeni olisi voinut syntyä ennen eroavuus Protochordata peräisin Chrodata.

leualliset selkärankaisia, Seeprakala genomi hallussaan yhden

MAGE

geeni,

Necdin kaltainen 2

(

DareNDNL2

) [8].

NDNL2

geenejä löytyy myös ihmisillä, hiirillä ja lehmiä, mutta eutherian

NDNL2s

käsitellään geenejä ja on yksi eksoni, kun taas

DareNDNL2

hallussaan ~11 eksonit. Fylogeneettinen puu perustuva aminohapposekvenssien mukaan eutherian

NDNL2

s ovat paraphyletic on

DareNDNL2

(kuviot. 1 ja S1):

DareNDNL2

on ”ensisijainen” ortologisista of eutherian

MAGE

geenejä [28]. Tämä fylogeneettinen suhde (topologia puu) tukevat myös RAxML ja Bayes puita (tuloksia ei ole esitetty).

CDS 158

MAGE

-geenejä käytettiin (katso taulukko S1). CDS verrattuna on 204 emäsparia pitkä. Sen jälkeen kohdistus, kaikki aukot ei otettu puukonstruktion. Alaheimo klusterit esitetään. Numero kussakin solmussa on bootstrap arvo tukeva solmu. Kala

NDNL2

(

Dare NDNL2

) ja nisäkäs

NDNL2

näkyvät sinisellä. Laji nimi lyhenteet ovat seuraavat: Bota (

Bos taraus

), Capo (

Cavia porcellus

), Dare (

Danio rerio

), Gaga (

Gallus gallus

), Hosa (

Homo sapiens

), Mamu (

Macaca mulatta

), Modo (

Monodelphis domestica

), Mumu (

Mus musculus

), Orna (

Ornithorhynchus anatinus

), ja Patr (

Pan troglodytes

). Kuva S1 on suurennettu versio tämä luku ja on luettavissa teksti.

Jokainen sammakko ja kanan genomien hallussaan vain yksi

MAGE

geeni. Molemmissa tapauksissa, jotka koskevat syntenic suhde

DareNDNL2

, asema geenin kromosomissa ei voitu vahvistaa puutteellisen tehtävän geenien kromosomeissa näillä lajeilla. Koska kuitenkin vaiheet jokaisen eksonin ja intronin rajan CDS kaloja, sammakoita ja kanat olivat hyvin konservoituneita (taulukko 1), yksittäinen

MAGE

geenien sammakon ja kanan ovat todennäköisesti yksi- -oni ortologeja

DareNDNL2

.

Vaikka vain yksi

MAGE

löytyi kaloja, sammakoita ja kanoja, ihmisillä ja hiirillä on useita alaryhmää

MAGE

geenit [7]. Siten on mielenkiintoista tutkia

MAGE

homologien monotremes (platypus) ja marsupials (opossumi). Täyden genomin BLAST-haun ihmisen

MAGE-D1

kuin kyselyn havainnut yhden

MAGE

-kuten (

Magel

) sekvenssin vesinokkaeläin ja kaksi

Magel

s että opossumi. Nämä alustavasti nimetty

OrnaMAGEL

ja

ModoMAGEL1 Twitter /

L2

, vastaavasti. BLAST hakee muilla

MAGE

geenejä, kuten

DareNDNL2

kuin kyselyn tuloksena havaitseminen samat geenit.

opossumeja

ModoMAGEL1

ja

ModoMAGEL2

sijaitsevat kromosomeissa X ja 8, vastaavasti.

ModoMAGEL2

koodataan yhdellä eksoni, kun taas

ModoMAGEL1

koodataan 11 eksonia. Siten

ModoMAGEL2

on todennäköisesti käsitellään geeni on johdettu

ModoMAGEL1

. Todellakin,

ModoMAGEL1

ja

ModoMAGEL2

muodostavat monophyly puussa (Fig. 1, Fig. S1) ja puiden rakennettu kolmella eri menetelmällä (NJ, RAxML ja Bayes).

platypuses

OrnaMAGEL

geeni sijaitsee contig Ultra 403 ja koostuu 10 eksonista. Vaikka määrä eksonien eroaa

ModoMAGEL1

, vaiheet ja koot jaetun eksonien ovat hyvin konservoituneita (taulukko 1). Lisäksi Ultra 403 sisältää myös ubikitiinipromoottori ligaasi-geenin

HUWE1

(hect, UBA ja WWE domeenin, joka sisältää 1), joka sijaitsee ~600 kb ylävirtaan

OrnaMAGEL

.

in situ

-hybridisaatio tutkimus vahvisti, että vesinokkaeläin,

HUWE1

sijaitsee kromosomissa 6 [29]; Näin ollen, on todennäköistä, että tämä jatkumon on osa kromosomi 6. Vesinokkaeläin kromosomi 6 on homologinen autosomaalinen esi eutherian ja pussieläimet X-kromosomia [29]. Itse asiassa, ympäröivä alue

OrnaMAGEL

contig osoitti syntenic suhdetta ihmisen Xp11 alueella. Ihmisen perimässä, asentoon, joka vastaa

OrnaMAGEL

on käytössä

MAGE-D2

ja –

D3

(Fig. 2). Ihmisen

MAGE-D2

ja –

D3

hallussaan 13 eksonit, ja vaiheet ja koot jaetun eksonien säilytetään kanssa

OrnaMAGEL

, sekä

ModoMAGEL1

ja muut

MAGE

geenien kana, sammakko, ja seeprakala genomit (taulukko 1).

Red palkit osoittavat

MAGE-D

tai

Magel

geenien ihmisen tai platypus, vastaavasti. Mustat palkit sekä geeni nimet osoittavat syntenic geenejä ihmisen ja platypuses. Siniset palkit ja geeni nimet osoittavat geenejä, jotka eivät näytä synteny. Muut

MAGE-D

alaperheen jäsentä,

MAGE-D1

ja

MAGE-D4

sijaitsevat 51,6 M ja 51,9 M ihmisen X-kromosomi, vastaavasti.

Phylogeny nisäkkäiden

MAGE

geeniperheen

puu ihmisen

MAGE

geenit osoittavat, että kolme tyyppi I

MAGE

subfamilies (

MAGE-A

, –

B

ja –

C

) muodostavat monophyletic klusterin, joka eroaa seitsemästä tyypin II subfamilies (

MAGE- D

, –

E

, –

F

, –

H

, –

L2

,

NDN

ja

NDNL2

) (Fig. 3). Todisteet tukevat viisi fylogeneettisesti informatiivinen vaihdot (D16Y, K23T, I62V, A113E, ja R156Q käytettäessä linjaus MHD, Fig. S3). Lisäksi

MAGE-D

geenit muodostavat monophyletic klusteri. Vaikka määrä nukleotideja käytetään tässä analyysissä on pieni, on selvää, että tyypin I subfamilies erosivat myöhemmin kuin tyypin II alaperheisiin (Fig. 3 ja Fig. S2).

puu perustuu lukumäärän aminohappoeroavuuksien kohti päällä (

p

-distances). Geenit mutta

DareNDNL2

puussa ovat kaikki

MAGE

geenejä löydetty ihmisen genomin.

DareNDNL2 myynnissä maassa zebrafish käytetään määrittämään puun juureen. Sivustojen määrä verrattuna on 92 aminohappoa ilman aukkoja. Bootstrap-arvo on merkitty solmussa. Sekvenssit on lueteltu taulukossa S1.

MAGE-E

on kahdennettu MHD ja päällekkäisyys on tapahtunut aikaisemmin kuin syntyminen tyypin Ι geenejä.

MAGEE1_1

(

MAGEE2_1

) ja

MAGEE1_2

(

MAGEE2_2

) edustavat MHD N ja C-pään puolella

MAGE-E1

(

MAGE-E2

), tässä järjestyksessä. Eutherian

MAGE-D3

geeni koodaa trophinin (TRO), joka ilmentyy istukassa ja vaikuttaa alkion istutusta.

Lukuun ottamatta

MAGE-D

geenit, nisäkkään

MAGE

geenit on yksi eksoni varten CDS. Näin ollen nämä ovat todennäköisesti käsitellään jotka on johdettu selostukset

MAGE-D

tai muu

MAGE-D

käsitelty geenit [7], [30]. Emme kuitenkaan voi sulkea pois sitä mahdollisuutta, että esi kunkin subfamily johtui päällekkäistä jalostetun geenin.

tarkastella, kuinka esi kunkin geeniperheen nousi nukleotidisekvensseistä yhden edustajaa kustakin subfamily oli verrataan keskenään käyttäen matriisitulostimet analyysi [16]. Jos koko koodaavan alueen lukien vierusalueeseen on kahdennettu, The dotter analyysi osoittaa samankaltaisuutta yli CDS. Toisaalta, esi kunkin subfamily on tuotettu retrotranspositioon, analyysi osoittaa samankaltaisuutta ainoastaan ​​CDS.

Suurimmaksi

MAGE

geenejä, dot-matriisi analyysi osoitti että sisällä ja välillä tyypin I ja II merkittäviä samankaltaisuuksia havaittiin vain CDS alueilla, mikä viittaa retrotranspostion. Vertailu

MAGE-A

ja

MAGE-C

, toisaalta, oli poikkeus. Vertailu paljastaa samankaltaisuuden yli CDS, mikä viittaa DNA-pohjainen geenikahdennustapahtuman. Saattaa kuitenkin olla mahdollista, että muut subfamilies myös syntyvät geenikahdennustapahtuman. Sekvenssin samankaltaisuus reunustavat alueet on kaksoiskappale oli mahdollisesti menetetty evoluution aikana, koska heikomman toiminnallinen rajoite. Itse asiassa, laajuus synonyymi sekvenssin eroja joukossa tyypin II gens ja näiden välillä tyypin I ja tyypin II geenejä vaihtelee 0,81-1,0, siten, että mitään merkittävää samankaltaisuutta alueella yli CDS havaittiin. Vaikka kladistiikka markkereita, kuten

Lines

ehkä ollut informatiivinen erottamiseksi retrotranspositiossa geenien päällekkäisyyksiä, ei tällaista informatiivinen löytynyt. Siksi puuttuessa tukevia todisteita, päättelimme, että

MAGE-C

oli monistaa

MAGE-A

ja että muut subfamilies kertyi retrotranspositiossa. Yhteensä kahdeksan insertioita retrotransposed

MAGE

on tapahtunut genomin esi Eutheria ja jalostettujen geenin tuli esi alaryhmä. Sen jälkeen retrotranspositioon, itsenäinen geenikahdennustapahtuman näyttää tapahtuneen kussakin subfamily.

Gene päällekkäisyyttä ja palindromi muodostumista

On huomionarvoista, että ryhmittely malli

MAGE-A

poikkeaa

MAGE-B

(Fig. 1, Fig. S1). Jokainen 11 ihmisen

MAGE-B

geenit muodostavat monophyletic klusterin ortologeihin muissa eutherians, kun taas 15

MAGE-A

geenit muodostavat laji- tai luokitusjärjestelmän mukaan eri ryhmiin (Fig. 1 kuvio. S1 ja S2). Lisäksi kolme

MAGE-C

geenit näyttävät olevan kädellisen erityinen. Sisällä kaksi tyypin II

MAGE

subfamilies, viisi

MAGE-D

ja kaksi

MAGE

E

geenit osoittavat myös niputtamisesta kuvio (yksi- kahdenkeskinen ortologiset suhde) samankaltainen kuin

MAGE-B

(kuviot. 1 ja 3).

yhteensä 16

MAGE-A

geenit sijaitsevat Xq28, alueella 148 Mb 153 Mb, ja on ryhmitelty kolmeen lohkojen A, B ja C (Fig. 4A). Lohkot A ja B sisältävät viisi (

MAGE

A11

, –

A9

, –

A9B

, –

A8

ja

psMAGEA7

) ja kymmenen (

MAGE

A4

, –

A5

, –

A10

, –

A6

, –

A2B

, –

A2

, –

A12

, –

A3

,

psMAGEA

ja

psMAGEAL

) geenit, vastaavasti, kun taas lohko C sisältää yhden geenin (

MAGE-A1

) (Fig. 4B ja C). Kukin kolmesta lohkojen hallussaan palindromi (Fig. 4C). Kuitenkin vain lohkossa B useimmat geenit (kuusi kymmenestä) sijaitsevat molemman palindromi (Fig. 4C). Kolme lähes identtisestä

MAGE

A2 Twitter /

A2B

, –

A3 Twitter /

A6

,

psMAGEA /psMAGEAL

sijaitsevat symmetrinen kannat aseiden (Fig. 4B ja 4C), kun taas

MAGE-A12

sijaitsee silmukka-alue. Olemme nimenneet parin päällekkäisiä geenien tai sekvenssien x ja y symmetrinen kannoista palindromi muodossa x /y. Fylogeneettiseen välisiä suhteita 16

MAGE-A

geenejä, mukaan lukien

psMAGEAL

(Fig. 4B, katso Materiaalit ja menetelmät) ja

MAGE-D

käyttää outgroup paljasti, että viisi geeniä lohkossa B ovat on monophyly, kun taas pari

psMAGEA Twitter /

psMAGEAL

geenit kaukaista sukua muille

MAGE-A

geenejä.

(

) vino viiva vedetään vasemmassa yläkulmassa oikeassa alakulmassa ilmaisee identiteetti alueella. Alue on jaettu kolmeen osa-alueilla, A, B, ja C, jotka sisältävät viisi, 10 ja yksi

MAGE-A

geenien, vastaavasti. (

B

) Puu rakennettiin käyttäen useita nukleotidin eroja (

p

-distances) keskuudessa CDS (1916 bp) 16

MAGE-A

geenejä. Numero kussakin solmussa edustaa bootstrap todennäköisyyttä tukeva että solmu. Bootstrap-arvot yli 50% on esitetty. Operatiivinen taksonominen yksikköä (OTU) magenta, vihreä ja sininen edustaa geenien seutukunnissa A, B ja C, vastaavasti. (

C

) Kolme ennustettu palindromien esitetty seutukunnissa A, B ja C. seutukunnassa B, useimmat geenit sijaitsevat otaksuttu palindromi aseita.

Ihmisen lohko B koostuu seitsemästä päällekkäisiä yksiköitä. Jokainen yksikkö on 10-20 kb pitkä ja sisältää

MAGE-A

ja kondrosarkoomaan liittyvä geeni (

CSAGE

) [31] (Fig. 5

). BLAST-analyysi nisäkkäiden genomien osoittaa myös puuttuminen

CSAGE

homologit ei-kädellisten nisäkkäiden. Palindromin lohkossa B ei havaittu ei-kädellisten genomeja, kuten hiiren, koiran ja hevosen genomit.

(

) diagonaaliosan linjat vasemmalta ylhäältä oikealle pohjaan ilmaisee identiteetin ihmisen (vasen paneeli) tai makaki (oikea paneeli) järjestyksessä. Aukkoja poikkiviiva on makaki osoittavat sekvensointi aukkoja. Värillinen alalaidassa kunkin paneelin osoittaa seitsemän päällekkäistä yksikköä. Sama värinen laatikot lajin sisällä osoittavat, että he ovat läheistä sukua toisilleen kuin toiset, kun taas lajien välillä osoittavat otaksuttu ortologeihin. (

B

) Palindromes ennustettu osa-B ihmisen (vasemmalla) tai makaki (oikealla) järjestyksessä. Numerot vieressä viivat osoittavat kukin kahdennettu yksikkö. (

C

) Lentotoiminnan NJ puu perustuu

p

-distances välillä kahdennettu yksikköä (2880 bp) on esitetty. Väri-koodi OTU on sama kuin (

) ja (

B

).

joukossa kädelliset, lohko B voidaan tunnistaa makakeilla (Fig. 5

). Tämä lohko sisältää myös seitsemän kahdennettu yksikköä, mutta muoto odotetun palindromi eroaa ihmisen ja makaki. Toisin kuin pitkä varsi ja lyhyt silmukka havaitaan ihmisen, että makaki, lyhyt varsi ja iso silmukka rakenne ennustetaan (Fig. 5

B

). Edelleen orthology yksiköiden välillä makakien ja ihmisten utelias annetaan asemiaan. Yksinkertaisuuden, me nimettiin seitsemän päällekkäisiä yksiköitä lohkossa B

h1

osoitteeseen

H7

ihmisillä ja

m1

osoitteeseen

m

7 makakeilla ( Fig. 5

) ja sitten tutkittiin niiden fylogeneettiseen suhteita (kuva 5

C

). Yksikköä

h1 Twitter /

h7

kätkeminen

psMAGEAL

ja

psMAGEA

geenit ortologiset osoitteeseen

m1 Twitter /

M7

. Yksikköä

h3 Twitter /

h5

kanssa

MAGE-A2 /A2B

geenit ortologiset osoitteeseen

m5

kanssa

MAGE-A2

: kuitenkin makakit,

m5

sijaitsee silmukan ja ei ole kumppani (erittäin samankaltainen sekvenssi)

m5

lohkossa. Yksikkö

h4

kanssa

MAGE-A12

on ortologiset että

m3

, mutta makakeilla tämä laite ei sisällä

MAGE

geenin (Fig . 5

). Lisäksi välisiä suhteita

h2 Twitter /

h6

,

m

2,

m4

ja

m

6 ovat hieman sekava, huolimatta siitä, että

MAEG-A3 /A6

on

h2 Twitter /

h6

ja kolme mahdollista homologit (

MAGE-A3

, –

3L

, ja –

A3L

) ovat

m

2,

m4

ja

m

6.

p

-Etäisyys välillä

h2

ja

h6

oli 0,7% (± 0,2), kun taas

p

-distances keskuudessa

m

2,

m4

ja

m

6 ovat paljon suurempia (12,1%) kuin edellinen. Pareittain etäisyydet yksiköiden välillä ihmisten ja makakit vaihtelivat 8,3% (± 0,5) 17,7% (± 0,7), joka on liian suuri varten ortologiset suhteen. Fylogenia myös ei tukenut ortologiset suhde joukossa kukin kolmesta yksiköiden makakeilla (

m

2,

m4

tai

m

6) ja

h2 Twitter /

h6

(Fig. 5

C

).

tutkia edelleen ortologiset suhteita näiden monistaa yksiköiden kladistiikka markkereita, kuten

SINE

s ja

LINE

s etsittiin käyttäen RepeatMasker ohjelmistojen [24] (Fig. 6). Yleensä järjestely

SINE

s,

LINE

s,

LTR

s, ja lyhyt toistoja lohkossa B esittää osittaista samankaltaisuutta ihmisen ja makaki genomin. Asema ja tyyppi toistuvat sekvenssit löytyi koko

m2 alue

ovat lähes samat kuin löytyy distaalisessa puoliskolla

h2

. Samanlainen jakautuminen toistuvat sekvenssit on havaittu alue

m5

ja

h5

, ja samankaltaisuus on myös havaittu osa

m4

ja että

h4

. Kuitenkin lajikohtaisia ​​alueet näyttävät olevan läsnä kussakin genomissa. Ihmisillä alue on -40 kb pitkä ja ulottuu keskeltä

h2

osoitteeseen

h4

, kun taas makakit, laji-tietyllä alueella on -30 kb ja ulottuu keskeltä on

m2

osoitteeseen

m4

. Toisin tulokset fylogenia ja geneettinen etäisyys analyysejä (kuviot. 5

C

ja 6) kladistiikka markkereita osoitti, että

h2

ihmisen

MAGE-A6

ja

m2

kanssa makakit

MAGE3L

ovat todellakin ortologiset toisiinsa.

värilliset kolmiot osoittavat välissä elementtejä (

viivoja

tai

sines

)

LTR

, DNA transposoneja (

DNA-TP

) tai yksinkertaisia ​​toistoa (

SR

) löydetty ihmisen tai makaki genomin, vastaavasti. Suluissa kunkin linjan osoittavat päällekkäisiä yksiköitä. Vaaleanpunainen nuolet osoittavat palindromi rakenne. Vaaleansininen nuoli osoittaa sekvensointi aukkoja makakeilla. Letters A-L ja ’i’ on kolmiot osoittavat ortologiset insertioelementeistä ihmisen ja makaki genomien. Valo Vihreä palkki tarkoittaa ihmisestä tai makaki-tietyllä alueella ja pisteviivat merkitsevät välistä rajaa lajispesifisiä ja ortologiset alueilla.

Ihmisen erityinen palindromi ja geenikonversiota

matrix-analyysi paljasti, että palindromi lohkossa B ilmenee vain ihmisillä. Vaikka sekvensointi puutteita tällä hetkellä olemassa simpanssi ja orangutan genomiin käytettävissä sekvenssit osoittivat, että palindromi lohkossa B on vähemmän ilmeinen näissä kahdessa apinoita kuin ihmisillä (Fig. 7). Olemme parsimoniously päätellä esi tilan palindromi käyttämällä sekvenssi-informaatiota genomin säilynyt kädellisten lajien.

ikkunan koko on 500 bp, jossa ei ole päällekkäisyyttä vierekkäisten ikkunoiden välissä. Värilliset suorakulmioita alareunassa luku osoittaa päällekkäisiä yksikön lukien

MAGE

geenejä (vaaleanpunainen nuolet). Ordinaatta edustaa nukleotidin eroavuus (

d

) ja abskissa edustaa sijainti (bp) suhteessa keskustaan ​​silmukan (asento nolla, sininen nuoli). Ympäröivä alue on punainen katkoviiva osoittavat korkea poikkesivat alueella

MAGE-A3

ja

MAGE-A6

.

Geenit on palindromien saattavat kokea toistuvia geenikonversion .

Vastaa