Informacija

Kako se grade PPI mreže?

Kako se grade PPI mreže?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Diplomirao sam CS i radim na računarskoj biologiji. Iako su mi teoretski aspekti i AP/MS (i različitih tipova) i Y2h sasvim jasni, stvarni tehnički aspekt izgradnje velikih PPI mreža nije. Postoji li stroj koji može izvesti te pokuse? Koliko bi trajalo izgradnja mreže za recimo 2000 proteina? Postoji li tvrtka koja može pružiti ovu uslugu?

Bio bih zahvalan na bilo kakvoj pomoći. Puno sam pretraživao, ali nisam uspio pronaći odgovor na ovo pitanje.


Ovisi o PPI mreži. Neki, poput DIP-a, isključivo su eksperimentalni, ovisno o visokopropusnom robotskom AP/MS-u, Tandem afinitetskom pročišćavanju, Y2H, umrežavanju s formaldehidom, pametnim stvarima koje uključuju polu-fluorofore itd. Postoji mnogo različitih metoda. kažem. Y2H ima visoku stopu lažno pozitivnih rezultata, imunoprecipitacija je skupa (antitijela koštaju), drugi imaju druge nedostatke.

Postojeće ogromno istraživanje možete iskoristiti i pomoću rudarenja teksta, iako je to tako stvarno sirove. (Svodi se na: protein A i protein B ili njihovi pseudonimi često se spominju u istoj rečenici, moraju se nekako povezati). Postoje i RNASeq metode, gdje samo radite stotine RNASeq eksperimenata, a dva gena koji su u korelaciji (ili obrnuto korelaciji) vjerojatno na neki način međusobno djeluju. Ako dva proteina stupaju u interakciju u organizmu A i imaju blisko povezane homologe u organizmu B, proteini vjerojatno stupaju u interakciju i u organizmu B.

Ukratko: Na mnogo različitih načina. Bilo bi pametno provjeriti podrijetlo veze u takvoj mreži i s njom postupati drugačije, ovisno o kakvoj se vezi radi ako radite s velikim mrežama poput ove.

Ne znam da li postoje tvrtke koje se time bave komercijalno, ali Max Delbruck centar razgovarat će s vama o prikazivanju nečeg prilagođenog. Ne znam koliko bi to trajalo, ali 2000 proteina ne bi trebalo dugo, relativno rečeno. Ljudski genom ima desetke tisuća proteina, pa bi 2000 proteina bilo samo nekoliko postotaka truda. Međutim, ako su potpuno novi, vjerojatno postoji vrijeme postavljanja knjižnice i dodatni troškovi, ali ne mogu ni pretpostaviti koliko bi to trajalo. Ovisi s kim razgovaraš, očekujem.


Izgradnja i analiza proteinsko-proteinske interakcijske mreže poremećaja upotrebe heroina

Poremećaj upotrebe heroina (HUD) složena je bolest koja proizlazi iz interakcije između genetskih i drugih čimbenika (npr. Čimbenika okoliša). Mehanizam razvoja HUD -a ostaje nepoznat. Novorazvijeni alati mrežne medicine pružaju platformu za istraživanje složenih bolesti na razini sustava. Ova studija sugerira da su interakcije protein -protein (PPI), posebno one među proteinima kodiranim slučajnim genima ili genima osjetljivosti, izuzetno važne za razvoj HUD -a. Divovska komponenta naše izgrađene PPI mreže sastojala se od 111 čvorova s ​​553 ruba, uključujući 16 proteina s velikim stupnjem (k) ili visokog međuprostora (BC), koji su dalje identificirani kao okosnica mreže. Predviđeno je da je JUN s najvećim stupnjem središnji dio PPI mreže povezane s HUD -om. Štoviše, PCK1 s najvišim BC i MAPK14 sa sekundarno najvećim stupnjem i 9. najvećim BC mogu biti uključeni u razvoj HUD -a i drugih bolesti tvari.


Pozadina

Nedavni napredak u visokopropusnim eksperimentalnim tehnikama, poput dvo-hibridne kvasne spektrometrije i spektrometrije mase, generirao je veliku količinu podataka o interakciji protein-protein (PPI) [1, 2]. Ovi dostupni podaci o PPI izgradili su velike složene mreže PPI za brojne organizme, poput Saccharomyces cerevisiae. PPI su od središnje važnosti za većinu bioloških procesa, pa stoga PPI mreže mogu pružiti globalnu sliku staničnih mehanizama. Ključni zadatak biologije sustava je otkriti staničnu organizaciju i funkciju analizom PPI mreža. Proteinski kompleksi su molekularne agregacije dvaju ili više proteina sastavljenih od više PPI -ja, koji igraju kritičnu ulogu u mnogim biološkim procesima. Većina proteina funkcionira tek nakon sastavljanja u proteinske komplekse. Točno određivanje proteinskih kompleksa u velikim PPI mrežama ključno je za razumijevanje načela stanične organizacije i funkcioniranja s razine mreže [3].

Tijekom posljednjeg desetljeća uloženi su veliki napori u identifikaciji proteinskih kompleksa u PPI mrežama. Budući da su proteinski kompleksi skupine proteina koji međusobno djeluju, općenito su gusti podgraf u PPI mrežama. Predložene su neke računske metode koje se temelje na teoriji grafova ili nalaženju gustih regija za identifikaciju proteinskih kompleksa iz PPI mreža. Algoritam za otkrivanje molekularnog kompleksa (MCODE [4]) koji su predložili Bader i Hogue bila je jedna od prvih računskih metoda prijavljenih na temelju teorije grafova. Markovsko grupiranje (MCL) [5] također se može primijeniti za identifikaciju proteinskih kompleksa simuliranjem slučajnih hodanja u PPI mrežama, koje manipuliraju ponderiranom ili neponderiranom matricom susjedstva s dva operatora koji se zovu ekspanzija i inflacija. Qi i sur. [6] predložio je okvir za nadzirano učenje za predviđanje proteinskih kompleksa, koji može naučiti topološke i biološke značajke iz poznatih proteinskih kompleksa. Adamcsek i sur. [7] razvio je alat CFinder za pronalaženje funkcionalnih modula u PPI mrežama, koji koriste metodu perkolacije klika [8] za otkrivanje k-klike perkolacijskih klastera. Moschopoulos i sur. predložio je alat za grupiranje (GIBA) za otkrivanje proteinskih kompleksa [9], koji uključuje dvije faze. Prvo, GIBA koristi algoritam za grupiranje kao što su MCL i RNSC za grupiranje danih PPI mreža. Zatim GIBA filtrira rezultate grupiranja kako bi generirao konačne komplekse na temelju kombinirane metode. Liu i sur. [10] predložio je metodu grupiranja temeljenu na maksimalnim klikama (CMC) za otkrivanje proteinskih kompleksa. Na temelju strukturnih značajki pričvršćenja jezgre [11], Wu i sur. [12] razvio je COACH algoritam koji identificira jezgre proteinskih kompleksa i vezanosti proteinskih kompleksa. Zaki i sur. predložena metoda ProRank koja koristi algoritam rangiranja proteina za identifikaciju esencijalnih proteina u PPI mreži i predviđa komplekse na temelju esencijalnih proteina [13]. Chin i sur. predložio je metodu koja se temelji na vezivanju čvorišta nazvanu HUNTER za otkrivanje funkcionalnih modula i proteinskih kompleksa iz proteinskih interakcija ocijenjenih pouzdanošću [14]. Budući da proteini mogu imati više funkcija, mogu pripadati više proteinskih kompleksa. Nepusz i sur. [15] predložio je ClusterONE algoritam koji je otkrio preklapajuće proteinske komplekse u PPI mrežama. Eksperimentalni PPI podaci velike propusnosti uvijek su visoka učestalost lažno pozitivnih i lažno negativnih rezultata [3]. Budući da računske metode uvelike ovise o kvaliteti podataka o PPI-u, izvedba složenih modela predviđanja jasno je ograničena šumom podataka velike protočnosti PPI-a. Neka su istraživanja integrirala druge biomedicinske resurse za poboljšanje učinkovitosti identifikacije proteinskog kompleksa. Na primjer, Zhang i sur. [16] predložio je COAN algoritam temeljen na mrežama za povećanje ontologije izgrađenim s visokopropusnim PPI i podacima o bilješkama genske ontologije (GO), koji mogu uzeti u obzir topološku strukturu PPI mreže, kao i sličnosti u GO bilješkama.

Do sada se većina studija o identifikaciji proteinskog kompleksa fokusirala samo na statičke PPI mreže. Međutim, stanični sustavi su vrlo dinamični i reagiraju na znakove iz okoline [17, 18]. PPI mreža u stanici mijenja se tijekom vremena, okruženja i različite faze staničnog ciklusa [19, 20]. PPI se mogu klasificirati u trajne ili prolazne PPI na temelju njihova životnog vijeka. Trajni PPI su obično stabilni i nepovratni. Naprotiv, prolazni PPI -ji uglavnom dinamički mijenjaju partnere u interakciji i njihov je životni vijek kratak. Proteinski kompleksi su grupe od dva ili više povezanih polipeptidnih lanaca istovremeno. Jedan od velikih problema identifikacije proteinskog kompleksa je što statičke PPI mreže ne mogu pružiti vremenske informacije i ne odražavaju stvarno stanje u stanici [21]. Vrlo je teško točno identificirati kompleks iz statičkih PPI mreža.

Kako bi se riješio ovaj problem, prijelaz sa statičkih PPI mreža na dinamičke PPI mreže bitan je za identifikaciju kompleksa proteina i druge slične primjene. Podaci o ekspresiji gena u različitim vremenskim točkama i uvjetima mogu otkriti dinamičke informacije o proteinima. Neka su istraživanja integrirala podatke o ekspresiji gena kako bi otkrila dinamiku PPI. Na primjer, Lin i sur. [22] otkrili su dinamičke funkcionalne module u uvjetima proširene kardiomiopatije na temelju ko-ekspresijske PPI mreže. Taylor i sur. [23] analizirali su ljudske PPI mreže i otkrili dvije vrste proteina čvorišta: intermodularna i intramodularna čvorišta. Zhang i sur. [24] koristili su Pearsonov koeficijent korelacije za izračun korelacije koekspresije podataka o ekspresiji gena i izgradili proteinske mreže koekspresije u različitim vremenskim točkama. Nedavno su Hanna i sur. predložio je okvir nazvan DyCluster za otkrivanje kompleksa na temelju PPI mreža i podataka o ekspresiji gena [25]. Prvo, DyCluster koristi tehnike biklasteriranja za modeliranje dinamičkog aspekta PPI mreža uključivanjem podataka o ekspresiji gena. Zatim, DyCluster primjenjuje algoritme za kompleksno otkrivanje, poput ClusterONE [15] i CMC [10], za otkrivanje kompleksa iz dinamičkih PPI mreža.

Općenito, neizbježna pozadinska buka postoji u podacima o ekspresiji gena. Način identificiranja aktivne vremenske točke svakog proteina na temelju podataka o ekspresiji gena ključan je za izgradnju dinamičkih PPI mreža. U ovoj smo studiji predložili novu metodu za izračunavanje aktivne vjerojatnosti proteina u različitim vremenskim točkama. Nadalje, konstruirali smo dinamičke vjerojatne PPI mreže (DPPN) za integraciju podataka o ekspresiji gena i PPI podataka na temelju atribuirane teorije grafova, te predložili metodu grupiranja za identifikaciju proteinskog kompleksa iz DPPN. Postoje dvije ključne razlike između naše metode i DyClustera. Prvo, DPPN konstruiran našom metodom može učinkovito razlikovati aktivnu razinu proteina u vremenskoj točki koja je od koristi za kompleksnu identifikaciju. Drugo, naša metoda ne primjenjuje izravno druge algoritme složene detekcije, već predlaže novu metodu grupiranja za karakteristike DPPN-a. Pokazali smo korisnost metode primjenom na tri različita skupa podataka o PPI kvasca i podatke o ekspresiji gena. Konstruirana su tri DPPN-a i mnogi dobro karakterizirani proteinski kompleksi su točno identificirani. Osim toga, metoda je uspoređena s trenutnim metodama identifikacije proteinskih kompleksa. Raspravljalo se o prednostima metode, potencijalnim primjenama i poboljšanjima.


2. Materijali i metode

2.1. Pregled procesa izgradnje mrežnih markera raka mjehura

Dijagram toka koji predstavlja izgradnju mrežnih biomarkera za rani i kasni stadij karcinoma mokraćnog mjehura prikazan je na slici 1.    Kombinirali smo dva izvora podataka: (1) podatke o mikroradu raka mjehura i uzorke bez karcinoma iz baze podataka GEO, dok uzorci raka podijeljeni su u dvije skupine: rani stadij i kasni stadij raka mjehura. (2) Baza PPI bila je potrebna za izradu PPIN -ova za rak mokraćnog mjehura. Ti su podaci korišteni za odabir spremišta PPI, a odabrani PPI -i i podaci o mikro -nizovima zatim su korišteni za izgradnju PPI -mreže (PPIN). Regresijskim modeliranjem i metodom procjene parametara najveće vjerojatnosti tada je dobiven PPIN raka (CPPIN) i PPC bez karcinoma (NPPIN). Dva konstruirana PPIN -a za karcinom i noncancer uspoređena su kako bi se dobili skupovi značajnih proteina za rak mjehura na temelju vrijednosti relevantnosti karcinogeneze (CRV) za svaki protein i statističke procjene. Značajni proteini i PPI unutar ovih proteina korišteni su za konstrukciju mrežnih markera u ranoj i kasnoj fazi raka mokraćnog mjehura.

Dijagram toka izgradnje obje faze mrežnog markera raka mokraćnog mjehura i istraživanja mehanizama karcinogeneze. Integriramo podatke o mikro nizovima, GO bazu podataka i PPI podatke za izgradnju PPI mreže. Ti se podaci koriste za odabir bazena, a zatim se odabrani proteini i podaci o mikroredovima koriste za doprinos proteinsko-proteinske interakcijske mreže (PPIN) procjenom najveće vjerojatnosti i metodom otkrivanja modela, što rezultira PPIN-om raka mjehura (CPPIN) i noncancer PPIN (NPPIN) u ranoj i kasnoj fazi. Dva konstruirana PPIN -a mogu se koristiti za određivanje značajnih proteina tumorigeneze razlikom između dvije PPI matrice dvaju konstruiranih PPIN -a. Uz pomoć diferencijalne matrice PPI (mreže) između CPPIN i NPPIN, za svaki se protein izračunava vrijednost relevantnosti karcinogeneze (CRV), a značajni proteini u karcinogenezi određuju se na temelju P vrijednost CRV -a ovih proteina u diferencijalnoj matrici PPI između CPPIN i NPPIN. Ovi značajni proteini dobivaju se u ranom i kasnom stadiju raka mokraćnog mjehura.

2.2. Odabir i predprocesiranje podataka

Skup podataka o ekspresiji gena u mikroračunu raka mokraćnog mjehura dobiven je iz omnibusa ekspresije gena NCBI (GEO) [19]. U ovom smo istraživanju odabrali <"type": "entrez-geo", "attrs": <"text": "GSE13507", "term_id": "13507" >> GSE13507 [20] i odgovarajuću platformu <"type ":" entrez-geo "," attrs ": <" text ":" GPL6012 "," term_id ":" 6012 ">> GPL6012 kao naš objekt istraživanja. Isti skup podataka sadržavao je uzorke raka mjehura u ranoj i kasnoj fazi i uzorke bez karcinoma. Koristili smo samo podatke dobivene iz neobrađenih primarnih biopsija kako bismo izbjegli odstupanja u ekspresiji gena koja su svojstvena staničnoj kulturi i fiksaciji. Stoga je korišteni skup podataka sadržavao primarne uzorke tumora u oba stadija od pacijenata i susjedne uzorke netumorskog tkiva istih pacijenata s rakom, koji bi se mogli smatrati kontrolnim uzorcima. Da bi se opisao opseg karcinoma pacijenta, karcinomi su klasificirani u četiri stupnja prema stupnju invazije i migracije pomoću TNM staging sustava, kako su definirali Američki zajednički odbor za rak (AJCC) i Međunarodna unija za borbu protiv raka (UICC) ). Zatim smo uzorke raka podijelili u dvije skupine. Općenito, stadiji I i II opisivali su rane stadije raka koje imaju veće stope izlječenja uz medicinsko liječenje, dok su faze III i IV opisivale kasne faze. Međutim, u okolnom području nije bilo odgovarajućih uzoraka bez karcinoma za svaku fazu, a imali smo samo jednu skupinu okolnih uzoraka bez karcinoma (Tablica 1). U ovoj smo studiji izgradili CPPIN i NPPIN za ranu i kasnu fazu raka mjehura. Dobili smo 37 i 106 uzoraka za rani i kasni stadij raka, odnosno 58 uzoraka bez karcinoma. Kako bi se izbjeglo prekomjerno uklapanje u izgradnju mreže, maksimalni stupanj proteina u PPI mreži trebao bi biti manji od broja uzorka raka/nekancerogena [14]. U ovom skupu podataka imali smo veći broj uzoraka raka i nekanceroznih virusa kako bismo prevladali ograničenje veličine uzorka na veličinu mreže. Prije daljnje analize, vrijednost ekspresije gena, h i J, normaliziran je na z-transformirani rezultati, g i J, za svaki gen, i, a zatim je dobivena normalizirana vrijednost izraza imala srednju vrijednost μ i = 0 i standardna devijacija σ i = 1 preko uzorka j [11, 14].

Stol 1

Opisni podaci o skupovima podataka izvučeni iz baze podataka GEO korišteni u ovoj studiji.

Slučajevi su grupirani prema karcinomu, a okolna normalna tkiva dolaze od pacijenata u ranom stadiju i kasnom raku mjehura.

PPI podaci za Homo sapiens izvađeni su iz baze podataka Biological General Repository for Interaction (BioGRID, preuzeto u listopadu 2012.). BioGRID je arhiva genetskih i proteinskih interakcija s otvorenim pristupom koja je prikupljena iz primarne biomedicinske literature svih glavnih modela organizama. Od rujna 2012. u BioGRID -u se nalazi više od 500 000 ručno označenih interakcija iz više od 30 modelnih organizama [21]. Gore navedene dvije baze podataka minirane su za karcinom mokraćnog mjehura i nekancerozne PPI mreže koristeći njihove odgovarajuće podatke o mikročipu. Ove mreže raka mokraćnog mjehura u ranoj i kasnoj fazi i PPC mreže bez karcinoma su zatim uspoređene radi dobivanja mrežnih markera.

2.3. Odabir skupine proteina i identifikacija proteinsko-proteinskih interakcijskih mreža (PPIN) za kancerogene i nekancerogene stanice

Za integraciju ekspresije gena s PPI podacima za konstrukciju odgovarajućih CPPIN -a i NPPIN -a, postavili smo proteinski bazen koji sadrži različito eksprimirane proteine. Razumno se pretpostavljalo da vrijednosti ekspresije gena koreliraju s razinama ekspresije proteina. Koristili smo jednosmjernu analizu varijance (ANOVA) za analizu ekspresije svakog proteina i odabir proteina s različitim razinama ekspresije. Ova metoda omogućila je utvrđivanje značajnih razlika između skupova podataka o karcinomu i nekancerogenim. Nulta hipoteza (Ho) temeljila se na pretpostavci da su srednje razine ekspresije proteina u skupu raka i nekancerogenih iste. Bonferronijeva prilagodba [22], vrsta višestrukog ispitivanja, korištena je za otkrivanje i ispravljanje proteina s odstupanjima. Proteini s a P vrijednosti manje od 0,01 uključene su u skupinu proteina. Međutim, ako proteini u proteinskom bazenu nisu imali PPI podatke, oni su eliminirani. Osim toga, proteini koji već nisu bili u bazenu proteina bili su uključeni ako bi njihove PPI informacije mogle utvrditi da imaju blisku vezu s proteinima koji su već u bazenu. Kao rezultat toga, proteinski bazen sadržavao je proteine ​​koji su imali određene razlike u razinama ekspresije i proteine ​​koji su imali uske odnose s gore spomenutim proteinima. U ovom slučaju, proteinski bazen u raku mjehura sastojao se od 2245 proteina u ranoj fazi i 1.101 proteina u kasnoj fazi.

Na temelju značajnih podataka i PPI informacija, kandidatne PPI mreže za rani i kasni stadij raka mokraćnog mjehura izgrađene su za rak mjehura i nekancerozne povezivanjem proteina koji su međusobno djelovali.Drugim riječima, proteini koji su imali PPI informacije kroz skupinu bili su povezani zajedno, što je rezultiralo kandidatima PPI mrežama.

Budući da je kandidatski PPIN uključivao sve moguće PPI -e u različitim okruženjima, različitim organizmima i eksperimentalnim uvjetima, kandidat PPIN je trebao biti dodatno potvrđen podacima mikro -niza radi identifikacije odgovarajućih PPI -a prema biološkim procesima koji su relevantni za rak. Kako bismo uklonili lažno pozitivne PPI -e iz svakog kandidata PPIN -a za različita biološka stanja, upotrijebili smo model PPI -a i metodu otkrivanja modela po modelu za obrezivanje svakog kandidata -PPIN -a koristeći odgovarajuće podatke iz mikro -niza za pristup stvarnom PPIN -u. Ovdje su PPI ciljanog proteina i u kandidatu PPIN se može prikazati sljedećim modelom asocijacije proteina:

gdje x i[n] predstavlja razinu ekspresije ciljnog proteina i za uzorak n x j[n] predstavlja razinu izraza jprotein u interakciji s ciljnim proteinom i za uzorak n α i J označava sposobnost interakcije povezanosti između ciljnog proteina i I je jth interaktivni protein M i predstavlja broj proteina u interakciji s ciljnim proteinom i i ω i[n] predstavlja stohastičku buku zbog drugih čimbenika ili nesigurnosti modela. Biološko značenje (1) je da razine ekspresije ciljnog proteina i povezani su s razinama ekspresije proteina koji s njim stupaju u interakciju. Slijedom toga, model asocijacije (interakcije) proteina za svaki protein u proteinskom bazenu može se izgraditi kao (1).

Nakon što smo konstruirali (1) za PPI model svakog proteina u kandidatskom PPIN -u, upotrijebili smo metodu procjene najveće vjerojatnosti [23] za identifikaciju parametara asocijacije u (1) prema podacima mikromreža na sljedeći način (vidi Dodatne materijale S.1 dostupne na internetu na http://dx.doi.org/10.1155/2014/159078):

gdje je α ^ i j identificiran pomoću podataka iz mikromreža u skladu s metodom procjene najveće vjerojatnosti (vidi Dodatne materijale).

Nakon što su za svaki protein identificirani parametri asocijacije za sve proteine ​​u kandidatnoj PPI mreži, značajne proteinske asocijacije određene su metodom detekcije reda interakcijskog modela na temelju procijenjenih sposobnosti asocijacije. Akaikeov kriterij informacija (AIC) [23] i Studentov t-test [24] su korišteni za odabir redoslijeda modela i određivanje značajnosti proteinskih asocijacija u α ^ i j (vidi Dodatne materijale S.2).

2.4. Određivanje značajnih bjelančevina i njihove mrežne strukture u karcinogenezi četiri vrste raka

Nakon P vrijednosti su određene pomoću AIC -ove detekcije i Studentove narudžbe t-test, lažni lažno pozitivni PPI -ji α ^ i j u (2) su obrezani, a samo preostali značajni PPI -ji su dorađeni na sljedeći način:

gdje M i′ ≤ M i označava broj značajnih PPI -ja PPIN -a, s ciljnim proteinom i. Drugim riječima, niz M iM i′ (ili lažno pozitivni rezultati) obrezuju se u PPI -ovima ciljnog proteina i. Jedan protein po jedan protein (tj. i = 1,2, …, M za sve proteine ​​u rafiniranom PPIN -u u (3)) rezultira sljedećim rafiniranim PPIN -om:

gdje je matrica interakcije A označava PPI.

Ako između proteina nema PPI i i j ili je obrezan otkrivanjem naloga AIC -a zbog beznačajnosti u rafiniranom PPIN -u tada α ^ i j = 0. Općenito, α ^ ij = α ^ ji, ali ako to nije slučaj, veća će se odabrati kao α ^ ij = α ^ ji kako bi se izbjegla situacija u kojoj je α ^ ij ≠ α ^ ji. Gore navedena metoda konstrukcije PPIN -a upotrijebljena je za konstruiranje rafiniranih PPIN -a za svaku fazu raka mokraćnog mjehura (ranog i kasnog) i stanica bez karcinoma. Matrice interakcije A rafiniranih PPIN -ova u (4) za stanice raka i stanice bez karcinoma u ranoj i kasnoj fazi raka mokraćnog mjehura konstruirane su, kako slijedi:

gdje k = rani i kasni stadij raka mjehura A C k i A N k označavaju matrice interakcija rafiniranog PPIN -a kkarcinom i nekancerogeni M je broj proteina u rafiniranom PPIN -u. Stoga je model asocijacije proteina za CPPIN i NPPIN u kRak mokraćnog mjehura i bez karcinoma u stadiju mogu se predstaviti sljedećim jednadžbama prema (4) i (5):

gdje k = rani i kasni stadij raka mjehura

označavaju vektore razina izraza i w C K (n) i w N K (n) označavaju vektore buke PPIN -ova u kstanice raka i nekancerozne stanice.

Drugačija matrica A C kA N k diferencijalne PPI mreže između CPPIN -a i NPPIN -a u krak je definiran na sljedeći način:

gdje k = rani i kasni stadij raka mjehura d i J k označava razliku sposobnosti povezivanja proteina između CPPIN -a i NPPIN -a u kstadij raka mjehura i matriks D k označava razliku u mrežnoj strukturi između CPPIN -a i NPPIN -a u kstadij raka mjehura. Kako bi se iz matrice razlika istražila karcinogeneza D k između CPPIN -a i NPPIN -a kstadija raka mokraćnog mjehura u (8), rezultat koji smo nazvali vrijednost relevantnosti karcinogeneze (CRV) predstavljen je kako bi se kvantificirala korelacija svakog proteina u D k sa značajem karcinogeneze kako slijedi [14]:

CRVi k u (9) kvantificira različit opseg proteinskih asocijacija iproteina (apsolutni zbroj ith red of D k u (8)) i CRV -u k može razlikovati CPPIN od NPPIN u kstadij raka mjehura. Drugim riječima, CRVi k u (9) može predstavljati razliku u strukturi mreže iproteina između mreže raka i nekancerogenih mreža u kstadij raka mjehura.

Kako bi se istražilo koji su proteini vjerojatnije uključeni u kstadiju raka mokraćnog mjehura, morali smo izračunati odgovarajući empirijski P vrijednost za određivanje statističke značajnosti CRV -ai k . Za utvrđivanje promatranog P vrijednost svakog CRV -ai k , više smo puta mijenjali mrežnu strukturu kandidata PPIN -a kstadij raka mokraćnog mjehura kao nasumična mreža kstadij raka mjehura. Svaki protein u slučajnoj mreži kRak mokraćnog mjehura u stadiju će imati svoj CRV za generiranje distribucije CRV -ai k za k = rani i kasni stadij raka mjehura. Iako je došlo do slučajnog poremećaja u strukturi mreže, veze svakog proteina su održane. Drugim riječima, proteini s kojima je određeni protein bio u interakciji permutirani su bez mijenjanja ukupnog broja proteinskih interakcija. Ovaj postupak ponovljen je 100.000 puta i odgovarajući P vrijednost je izračunata kao udio slučajne mrežne strukture u kojoj je CRVi k je barem toliko velik koliko je CRV stvarne mrežne strukture. Prema distribucijama CRV -ai k slučajnih mreža, CRVi k u (9) s a P vrijednost manja ili jednaka 0,01 smatrana je značajnim CRV -om, a odgovarajući protein utvrđen je značajnim proteinom u karcinogenezi krak mokraćnog mjehura u stadiju: protein s a P vrijednost veća od 0,01 uklonjena je s popisa značajnih proteina u karcinogenezi (drugim riječima, ako je P vrijednost CRV -ai k bio veći od 0,01, tada je iprotein je uklonjen iz CRV -ai k u (9), a ostatak u CRV -u k s P vrijednosti CRV -a manje od 0,01 smatrane su značajnim proteinima krak mjehura u stadiju).

Bazirano na P vrijednost CRV -a za sve proteine ​​(i = 1,2, …, M) i dvije faze raka mokraćnog mjehura (k = rani i kasni stadij raka mjehura), generirali smo dva popisa značajnih proteina za svaku od dvije faze prema CRV -u i statističkoj procjeni svakog značajnog proteina u CRV -u k u (9). Pronašli smo 152 značajna proteina u ranom stadiju raka mokraćnog mjehura i 50 značajnih proteina u kasnom stadiju raka mjehura. Ti su proteini pokazali značajne promjene između CPPIN -a i NPPIN -a u karcinogenom procesu u skladu s njihovom odgovarajućom fazom raka, a sumnjali smo da bi te promjene mogle odigrati važnu ulogu u procesu karcinogeneze raka mokraćnog mjehura. Ovi nalazi zahtijevaju daljnju istragu.

Sjecišta ovih značajnih proteina u ranim i kasnim stadijima raka mokraćnog mjehura i njihovi PPI poznati su kao markeri jezgre mreže koji se pojavljuju u svim stadijima raka mokraćnog mjehura. Nasuprot tome, jedinstveni značajni proteini i njihovi PPI u svakoj fazi raka mokraćnog mjehura poznati su kao specifični mrežni markeri za svaku fazu raka. Otkrili smo da postoji 18 značajnih proteina koji bi se mogli klasificirati kao marker jezgrene mreže u cijelom procesu karcinogeneze raka mokraćnog mjehura. Također smo pronašli 134 značajna proteina u specifičnom mrežnom biljegu raka mokraćnog mjehura u ranoj fazi i 32 značajna proteina u specifičnom mrežnom biljegu u kasnom stadiju raka mokraćnog mjehura.

2.5. Analiza puta

Mnogo vrijednih staničnih informacija može se pronaći u poznatim putovima, koji su korisni za opisivanje većine “normalnih ” bioloških pojava. Svi su ti poznati putevi rezultat ponovljenih testiranja i provjera, a cijela mreža puteva dala je definicije za većinu veza. Stoga su proteini za koje smo identificirali da su značajni u gore navedenim mrežnim oznakama preslikani na poznate mreže puteva (npr. Put KEGG ili PANTHER) kako bi se istražili značajni putevi s mrežnim markerom i istražili odnosi između tih puteva i karcinogeneze rak mjehura. Ovaj pristup podupire mišljenje da biologija sustava može pomoći u identifikaciji značajnih mrežnih biomarkera na normalnim i kancerogenim putevima prema njihovoj ulozi u patogenezi raka.

Zajedno sa opsežnim bazama podataka o putovima, poput Kyotske enciklopedije gena i genoma (KEGG), koristili smo niz alata za analizu bioinformatičkih puteva za identifikaciju biološki relevantnih mreža puteva [25]. KEGG uključuje ručno kurirane biološke putove koji pokrivaju tri glavne kategorije: informacije o sustavima (na primjer, ljudske bolesti i lijekovi), informacije o genomici (npr. Katalozi gena i sličnosti sekvenci) i kemijske informacije (npr. Metaboliti i biokemijske reakcije). Trenutno KEGG sadrži 134,511 različitih putova generiranih iz 391 izvornih referentnih putova [26]. Stoga je za istraživanje puteva uključenih u karcinogenezu korištena baza podataka bioinformatike DAVID [27, 28], koja generira automatske izlaze rezultata iz analize puta KEGG [27], za analizu puta značajnih proteina identificiranih u mrežnim markerima kako bi se utvrdilo njihove uloge u patogenezi ranog i kasnog stadija raka mokraćnog mjehura. Naša metodologija ne sadrži analizu puta i analizu obogaćivanja genskog skupa. Kako bismo dovršili naše rezultate istraživanja, upotrijebili smo softver NOA za analizu puta i analizu obogaćivanja genskog skupa bioloških procesa, staničnih komponenti i molekularnih funkcija [19, 29].

2.6. Doprinos proteinske interakcije mreže utjecat će na rezultate biomarkera i evoluciju mrežnih biomarkera

Naš model PPI -ja za rak izgrađen je od različitog izražavanja podataka o karcinomu i nekancerogenom mikročipu i prikupljanja podataka PPI -a iz baze podataka BioGRID. Dakle, CPPIN -ovi u ranom i kasnom stadiju raka mokraćnog mjehura (PPI mreže protiv raka) i NPPIN -i (nekancerozne PPI mreže) rezultat su našeg biološkog modela sustava korištenjem izvornih podataka o mikroredovima i PPI baza podataka. Tri su ključna čimbenika koji će utjecati na konačne rezultate.

Učinak različitih podataka o mikromrežama: znamo da podaci u mikromrežama imaju nedostatak neponovljivih. To znači da čak i u istom slučaju podaci iz mikroraspreda ne obećavaju isti rezultat kao prethodni. Također, za isti karcinom, pacijenti različite etničke pripadnosti, različite dobi ili različitog spola dat će različite podatke o mikroredovima. Ovo je prvi faktor koji utječe na konačne rezultate.

Učinak različitih izvornih baza podataka o PPI-u: znamo da su baze podataka PPI-a, poput BioGRID-a i MIPS-a, izgrađene od pretpostavljenih i potvrđene mokrim laboratorijskim pokusima. Zbog napretka mnogih visokopropusnih eksperimentalnih vještina, izvorne baze podataka PPI-ja razvijaju se s vremenom. Nove ažurirane izvorne baze podataka PPI drugi su faktor koji utječe na konačne rezultate.

Učinak biološkog modela sustava: podaci mikro -niza, baze podataka PPI -a i model interakcije PPI -a u (1) koriste se za izgradnju PPI mreža normalnih i stanica raka metodom procjene parametara najveće vjerojatnosti (vidi dopunski materijal S.1). Metoda otkrivanja redoslijeda AIC sustava (dopunski materijali S.2) koristi se za obrezivanje lažno pozitivnih PPI-a za dobivanje stvarnih PPI mreža normalnih i stanica raka, odnosno, koristimo tzv. Metodu obrnutog inženjeringa za izgradnju PPI mreža normalnih i stanice raka. Zatim se dobiva diferencijalna PPI mreža između PPI mreže raka i normalne PPI mreže u (8) za ispitivanje varijacija PPI svakog proteina u diferencijalnoj PPI mreži zbog karcinogeneze. Konačno, vrijednost karcinogeneze (CRV) koja se temelji na varijacijama PPI također se predlaže za procjenu značaja karcinogeneze za svaki protein diferencijalne PPI mreže. Proteini sa značajnim CRV -om (P vrijednosti < 0,01) smatraju se značajnim proteinima raka. Značajni proteini u tablici 3 su ti značajni proteini u ranom i kasnom stadiju raka mokraćnog mjehura, a ti proteini i njihovi PPI -ji grade interakcijsku mrežu na slici 2. Konačno, od ranih do kasnih stadija mrežnih markera raka mjehura, istražujemo mehanizam procesa karcinogeneze uz pomoć baza podataka (npr. Baza podataka GO, baza podataka DAVID i KEGG) i pokušavamo pronaći višestruku mrežnu ciljnu terapiju raka. Za razliku od konvencionalnih teorijskih metoda, koje uvijek daju jedinstveni matematički model za mrežu raka za detaljniju teorijsku analizu, ova studija želi uvesti sistemski biološki pristup markerima mreže raka na temelju stvarnih podataka iz mikromreža putem takozvanog obrnutog inženjeringa, teorijskog statistička metoda i metoda rudarenja podataka u kombinaciji s velikim bazama podataka. To su novost i značaj našeg lista. Iako smo opisali novost našeg modela biologije sustava, svoje smo rezultate potvrdili anketiranjem literature u istraživanju. U budućnosti će naši rezultati biti potvrđeni mokrim laboratorijskim pokusima drugih istraživača, te ćemo iznova i iznova mijenjati naš matematički model. Ovo je treći ključni faktor koji utječe na rezultate. Iako ne izravno, također će imati utjecaj na interakcijsku mrežu proteina.

Konstruirani karcinom PPIN (CPPIN) i noncancer PPIN (NPPIN) za ranu i kasnu fazu raka mokraćnog mjehura. Broj povezanih proteina CPPIN -a i NPPIN -a u odnosu na rani i kasni karcinom mjehura naveden je u nastavku (CPPIN/NPPIN): rak mjehura u ranoj fazi (3388/3151) i rak mjehura u kasnoj fazi (634/1185). Slike se stvaraju pomoću programa Cytoscape.

Tablica 3

Identificirano je prvih 20 značajnih proteina u ranom i kasnom stadiju raka mokraćnog mjehura pojedinačno.

Rani stadij raka mokraćnog mjehura (N = 107)Kasni stadij raka mokraćnog mjehura (N = 107)
CRVIme P vrijednostCRVIme P vrijednost
UBC29.91709ρe − 5UBC158.5321ρe − 5
CUL327.96694ρe − 5VCAM120.98798103ρe − 5
RIOK216.02326ρe − 5RPS1320.09693015ρe − 5
CUL514.97713ρe − 5TP5319.5883ρe − 5
RPS2312.13218ρe − 5HDAC119.2879ρe − 5
RPL1210.87102ρe − 5HSPA817.24137906ρe − 5
RPL2210.47367ρe − 5RPS27A17.23738059ρe − 5
RANBP29.8086ρe − 5TUBB17.03734405ρe − 5
PAN29.521207ρe − 5CDK216.7366ρe − 5
DHX99.47832ρe − 5VIM15.89214155ρe − 5
RPS88.722495ρe − 5KIAA010115.8188ρe − 5
RPL278.641642ρe − 5ITGA415.69058519ρe − 5
SUMO28.391421ρe − 5GSK3B15.44597966ρe − 5
HNRNPH38.011681ρe − 5EEF1A114.21690842ρe − 5
CDC5L7.950851ρe − 5RUVBL213.63207486ρe − 5
RUVBL17.887244ρe − 5PCNA13.3217ρe − 5
SF3A17.468209ρe − 5CUL113.2669ρe − 5
APP6.933807ρe − 5MYC13.0423ρe − 5
CCT36.860228ρe − 5CUL313.0117ρe − 5
SH3KBP16.765387ρe − 5HNRNPA012.15264603ρe − 5

Također znamo da se biosustavi razvijaju s vremenom. Očigledno je da pacijenti u ranoj i kasnoj fazi imaju vrlo različite simptome, što su za nas ključne značajke za klasifikaciju raka mokraćnog mjehura u ranom i kasnom stadiju. Budući da pacijenti s dva stupnja raka mokraćnog mjehura imaju jako različite simptome, nesumnjivo je da će se podaci o mikromrežama ovih pacijenata u dva stadija pokazati sasvim različitima. Kao što je gore opisano, ekspresija proteina iz podataka iz mikroraspreda jedan je od ključnih čimbenika našeg modela biologije sustava koji daje konačne CPPIN i NPPIN. CPPIN i NPPIN daju konačne mrežne biomarkere iz našeg modela biologije sustava. Dakle, najvažnija stvar za evoluciju mrežnih biomarkera posljedica je evolucije podataka o mikroredovima u obje faze raka mjehura, što je svojstveno izlaganju gena povezanih s rakom zbog mutacija DNA u procesu karcinogeneze.


Zaključci i rasprava

U ovom smo radu predložili oslanjanje na domenu biološkog procesa genske ontologije i GO bilješke ljudskih gena za izgradnju semantičke mreže sličnosti gena, a zatim koristiti mrežu s fenotipnom mrežom sličnosti bolesti za zaključivanje gena koji su povezani upitna bolest od interesa.

Glavni cilj ovog istraživanja je prevladati jedan od nedostataka postojećih mreža interakcija protein-protein, tj. Nisku pokrivenost. Izgrađena mreža semantičke sličnosti gena obuhvaća 14.085 gena, oko 50% više od široko korištene HPRD mreže. Što je još važnije, kako je pokazano u našoj sveobuhvatnoj analizi, poboljšanje pokrivenosti popraćeno je povećanjem točnosti zaključivanja gena bolesti. Stoga mreža semantičke sličnosti gena može poslužiti kao bolja procjena funkcionalnog odnosa među genima, a zatim se koristiti u velikom broju aplikacija u biologiji sustava.

Filtriranje niskih ocjena semantičke sličnosti važno je za uspjeh predloženog pristupa. Trenutno postižemo ovaj cilj zadržavajući prvi κ najbliži susjedi svakog gena. Alternativno, možemo uvesti prag i odbaciti sve rubove čija je težina (ocjena sličnosti) manja od praga. Prema našim eksperimentima, ova alternativna strategija vjerojatno će dovesti do isključene mreže i tako negativno utjecati na izvedbu metode određivanja prioriteta koja se oslanja na mrežu. Stoga pribjegavamo strategiji najbližeg susjeda kako bismo filtrirali niske ocjene semantičke sličnosti.

Svakako, naše se istraživanje može dodatno poboljšati sa sljedećih aspekata. Prvo, iako smo se u ovom radu usredotočili na domenu bioloških procesa, konceptualno je jednostavno koristiti molekularnu funkciju i domene stanične komponente za izgradnju mreža semantičkih sličnosti gena. Prema našim eksperimentima, mreže semantičke sličnosti koje se oslanjaju na ove dvije domene ontologije gena imaju sličnu pokrivenost kao i na području biološkog procesa i mogu postići usporedive performanse kao mreža HPRD u zaključivanju gena bolesti (podaci nisu prikazani). Stoga je moguće poboljšanje našeg pristupa izgradnja mreže semantičke sličnosti gena s integracijom sva tri područja u ontologiju gena.

Drugo, mreža semantičke sličnosti i mreža interakcija protein-protein procjenjuju funkcionalni odnos između gena s različitih gledišta. Stoga zaključivanje gena bolesti može imati koristi od integrirane uporabe ove dvije vrste mreža. Nadalje, u prethodnim studijama dokazana je učinkovitost oslanjanja na princip „krivnje prema povezanosti“ (bez korištenja profila sličnosti fenotipa) i više genomskih podataka za zaključivanje gena bolesti. Razumno je slijediti cilj korištenja profila sličnosti fenotipa s više genomskih podataka za postizanje točnijih zaključaka o genima bolesti.


Rezultati

Skupovi podataka o PPI organizama

Očekuje se da će se interakcije proteina u jednom organizmu sačuvati u drugim srodnim organizmima. Nedavno je provedena međuvrsna usporedba podataka PPI -a iz 11 organizama radi identifikacije očuvanih mreža. Ovi skupovi podataka iz organizama mogli bi se koristiti za provjeru kvalitete predviđanja PPI -a u S. mimosarum. Sveukupno, 123.650 interakcija u H. sapiens, 325.102 inča S. cerevisiae, 23.241 in C. elegans, 78.525 in D. melanogaster, 17.428 in E coli, 15.195 inča A. thaliana, 38.719 in M. musculus, 449 inča D. rerio, 5096 in R. norvegicus, 2248 inča P. falciparum, i 13.676 in C. jejuni za koje su bili dostupni podaci prikupljeni su iz pet baza podataka PPI (vidi Materijali i metode). Kao što pokazuju ovi skupovi podataka o organizmu, razlike u broju PPI-a mogle bi se objasniti različitom količinom eksperimentalnih podataka za organizme, zajedno s glavnim eksperimentalnim metodama, uključujući dvo-hibridnu kvascu, kromatografiju sa afinitetom, su-taloženje, energiju fluorescentne rezonancije Korišteni su transfer i proteinski čip. Ove su analize potvrdile da je najveći broj kvalitetnih PPI -a pronađen u S. cerevisiae a najmanji broj pronađen je u D. rerio, što odgovara najvećem i najmanjem skupu eksperimentalnih podataka o PPI -u posljednjih godina (slika 2b). Osim toga, broj visokokvalitetnih interakcija u sisavaca, osobito u H. sapiens, moglo bi biti posljedica dupliciranja gena u tim organizmima, što je vjerojatno dovelo do multifunkcionalizacije i subfunkcionalizacije zbog selekcijskog pritiska. S obzirom na veliki broj izoformi, PPI brojevi sisavaca bili bi veći od onih u drugim organizmima.

Brojevi od S. mimosarum ortolozi gena i interakcije u modelnim organizmima. a Histogram koji prikazuje broj interakcija po modelu organizma. b Histogram ortologa po modelu organizma

Predviđanje od S. mimosarum ortolozi

Za identifikaciju ortologa, usporedbe sekvenci na razini proteoma između 11 organizama i S. mimosarum izvedeni su pomoću programa InParanoid 4.1 (vidi Materijali i metode), koji se temelji na BLAST pretraživanju, nakon čega slijedi grupiranje ortolognih skupina. Ukupno 27.135 proteina označeno je iz cijelog genoma S. mimosarum. Broj ortolognih parova proteina između S. mimosarum a svaki od organizama prikazan je na slici 2a. Ukratko, 4112 H. sapiens, 3888 M. musculus, 3506 R. norvegicus, 2959 D. melanogaster, 1550 C. elegans, 1224 A. thaliana, 532 P. falciparum, 529 S. cerevisiae, 456 D. rerio, 91 E coli, i 155 C. jejuni genske skupine imale su ortologe visokog povjerenja (1,0) u S. mimosarum, te su smatrani za najočuvanije gene među tim organizmima i S. mimosarum. H. sapiens i D. rerio pokazao najveći i najmanji broj proteina u ortolognim skupinama s S. mimosarum, odnosno. Broj PPI nije povezan s bliskošću genetskog odnosa, na što ukazuje najveći broj ortologa u usporedbi između S. mimosarum i H. sapiens, vjerojatno zbog velike količine dostupnih informacija o genomu H. sapiens.

Za potvrdu očuvanih ortologa između modelnih organizama i S. mimosarum, preklapajući se ortolozi u S. mimosarum odabrani su za analizu u različitim skupinama na temelju vrsta s bližim i udaljenijim odnosima. Ukupno 3495 ortologa u S. mimosarum bili zajednički skupima podataka H. sapiens i M. musculus, i osam ortologa u S. mimosarum bili zajednički skupima podataka D. rerio i C. jejuni. Nekadašnje relativno bogato preklapanje nije iznenadilo s obzirom na veliki broj ortologa u H. sapiens i M. musculus. Potonji relativni nedostatak preklapanja također nije iznenadio s obzirom na mali broj ortologa u D. rerio i C. jejuni. Značajan broj S. mimosarum geni su izložili ortologe u dvije vrste (tablica 1). Predloženo je da vrste s bližim odnosima pokazuju veći stupanj preklapanja, dok je manje preklapanje opaženo kod onih koje su imale udaljenije odnose.

Ortološki parovi između modelnih organizama i S. mimosarum također su korišteni za sustavno ispitivanje preklapanja više od dvije vrste. Najviše 3178 ortologa u S. mimosarum sačuvani su među H. sapiens, M. musculus, i R. norvegicus. Najmanje osam ortologa u S. mimosarum sačuvani su među H. sapiens, M. musculus, R. norveicus, D. rerio, D. melanogaster, C. elegans, i E coli (Tablica 2). Rezultati statističkih analiza također sugeriraju da će ti visoko očuvani ortolozi vjerojatno imati važne proteinske funkcije S. mimosarum. Stoga su se ti očuvani ortološki parovi uglavnom koristili za sustavno ispitivanje preklapanja među predviđenim proteinskim interakcijama u S. mimosarum.

Kako bi se utvrdilo postoje li preklapanja u drugim Stegodyphus vrste povezane s preklapanjima među evolucijski udaljenim modelnim organizmima i S. mimosarum, prvo smo tražili očuvane ortologe u Stegodyphus vrste, uključujući S. lineatus, S. tentoriicola, i S. mimosarum. Ukupno 1184 GenBank ID -a u S. mimosarum s preklapanjem ortologa u sva tri društvena Stegodyphus vrste su dobivene s web stranice NCBI -a [32]. Utvrđeno je da se tri proteina, KFM80602.1, KFM79040.1 i KFM69424.1 preklapaju između ortologa Stegodyphus vrsta i evolucijski udaljenih organizama C. elegans, D. melanogaster, H. sapiens, M. musculus, R. norvegicus, D. rerio, C. jejuni, S. cerevisiae, E coli, i A. thaliana. Protein 1 koji veže nukleotid histidinske trijade (KFM80602.1), protein koji veže GTP (KFM79040.1) i protein toplinskog šoka (KFM69424.1) označeni su kao katalitičko djelovanje, funkcija vezanja ATP, odnosno funkcija vezanja GTP .

Analiza interakcija protein -protein S. mimosarum

Na temelju skupova podataka o PPI organizama u bazi podataka MySQL, predviđeno je ukupno 58.489 interakcija protein -protein iz 3810 različitih proteina S. mimosarum pomoću skupova podataka PPI 11 organizama (dodatna datoteka 1). Većina predviđenih PPI -ja iz S. mimosarum pružene su usporedbom PPI -a iz H. sapiens, D. melanogaster, i S. cerevisiae. Točnije, 38% svih podataka došlo je izravno iz pokusa u H. sapiens, 23% od D. melanogaster, a 25% od S. cerevisiae. Međutim, bilo je samo nekoliko predviđenih PPI -ja iz D. rerio i P. falciparum. Uzeti zajedno, ovi brojevi iz različitih modelnih organizama ukazivali su na moguće preklapanje. Osim toga, podaci ortoloških parova bili su u skladu s odgovarajućom količinom PPI podataka za svaku vrstu, 38% interakcija odgovara ljudskim, dok je samo 9% odgovaralo onima kod miševa. S obzirom na različite PPI resurse u ljudima i miševima iz javnih baza podataka, nedosljednost između broja ortologa i PPI -a može biti razumna.

Nakon predviđanja PPI -ja u S. mimosarum, PPI mreža vizualizirana je pomoću programa Cytoscape v3.2.1. "Predviđeni izgled" korišten je za predviđenu PPI mrežu, a alat "mrežni analizator" za analizu PPI mreže (slika 3). PPI mreža izračunata je tako da prikazuje topološke parametre, predstavljene kao pojedinačne vrijednosti i raspodjele (Tablica 3). Analiza interakcijske mreže pokazala je raspodjelu duljine kratkog puta i trend smanjenja distribucije susjedske povezanosti (slike 4a i b). To je pokazalo da mreža posjeduje svojstva malog svijeta kako je prethodno objavljeno u mreži interakcija ljudskih proteina za neurodegenerativne bolesti [34], što ukazuje na pouzdanost ovog predviđanja. Za analizu tipova čvorišta u mreži računato je nekoliko vrsta čvorišta S. mimosarum, uključujući slobodne krajeve (samo jedna interakcija), cijevi (dvije interakcije), manja čvorišta (3-5 interakcija), mala čvorišta (6-11 interakcija), središta srednje veličine (12-50 interakcija) i druga čvorišta različitih veličine. Topologijom cijele mreže ocijenjeno je ukupno 3810 proteinskih čvorišta na temelju brojeva interakcija s S. mimosarum. Točnije, najčešći tip čvorišta u S. mimosarum sastojao se od srednjih čvorišta veličine 12 do 50 interakcija. Osim u S. mimosarum, čvorišta srednje veličine također su otkrivena u S. cerevisiae, C. jejuni, i P. patens [19]. Kad su glavna i srednja čvorišta bila primarna čvorišta u organizmima, manja čvorišta, cijevi i slobodni krajevi lako bi mogli biti nedovoljno zastupljeni. Najveći broj slobodnih krajeva otkriven je u mrežama dviju modelnih vrsta D. melanogaster i M. musculus, dok su cijevi najbrojnije otkrivene u C. elegans (Slika 5).

The S. mimosarum mreža je promatrana u Cytoscape v3.2.1, a predviđena distribucija interakcija S. mimosarum analizirani su u model organizmima. a Velika lopta od 58.489 nepotrebnih interakcija u normalnom prikazu Cytoscapea v3.2.1. b Predviđena raspodjela interakcija S. mimosarum po modelu organizma H. sapiens omogućio najveći broj interakcija za S. mimosarum PPI predviđanje, nakon čega slijedi S. cerevisiae i M. musculus

Analiza od S. mimosarum interakcijska mreža s 3810 čvorova u Cytoscape v3.2.1. a Rubna frekvencija u različitim duljinama puta. Duljina staze znači duljina ruba. To ukazuje da rubnom frekvencijom dominira kratka duljina puta (1–3). b Odnos povezanosti susjedstva i broja. Trend opadanja susjedske povezanosti pokazuje visoki koeficijent grupiranja u susjednim čvorovima s relativno nižom povezanošću

Raspodjela vrsta čvorišta među S. cerevisiae, C. elegans, D. melanogaster, M. musculus, C. jejuni, i S. mimosarum. a S. cerevisiae (eksperimentalno određeno iz BioGrid, InAct, MINT, DIP i SGD). b M. musculus (eksperimentalno određeno iz BioGrid, InAct, MINT, DIP). c C. jejuni (eksperimentalno određeno iz BioGrid, InAct, MINT i DIP). d C. elegans (eksperimentalno određeno iz BioGrid, InAct, MINT i DIP). e S. mimosarum (predviđeno, ovo djelo). f D. melanogaster (eksperimentalno utvrđeno iz BioGrid, InAct, MINT i DIP)

Analiza visoko povezanih čvorova

Normalno, esencijalni geni su visoko međusobno povezana središta na razini proteina. Potraga za visoko povezanim čvorištima pokazala je da su mnogi međudjelujući proteini u tim čvorištima funkcionalno povezani s spajanjem mRNA, savijanjem proteina, popravkom DNA, diobom stanica, regulacijom transkripcije ili kataboličkim procesima proteina ovisnim o ubikvitinu (slika 6). Top 20 visoko povezanih proteinskih čvorišta identificirano je iz S. mimosarum. Maksimalni broj čvorova u prvih 20 proteina bio je 2768, a minimalni 359 (dodatna datoteka 2). Protein poliubikvitin-C (KFM70679.1) identificiran je kao čvor koji je najčešće prisutan unutar velikih čvorišta PPI mreže u S. mimosarum. Moguće objašnjenje za njegov visoki stupanj povezanosti jest da je ubikvitin uključen u različite biološke procese, uključujući neuronski razvoj, spermatogenezu, proizvodnju jaja i oplodnju. Unatoč tome što je najveće središte u S. mimosarum, iznenađujuće je da protein poliubikvitin-C nije bio čvor s najvećim stupnjem povezanosti u drugim modelnim organizmima. To je moglo biti zato što tip modela čvora možda nije isti u drugim modelnim organizmima, a količine informacija o PPI proteina također su bile ograničene u nekim organizmima [35]. Proteini 14–3-3 proteinski epsilon (KFM63563.1), 14–3-3 proteinski zeta (KFM75839.1) i faktor spajanja 8 prije obrade mRNA (KFM66933.1) identificirani su među visoko povezanim proteinima u M. musculus, D. melanogaster, i H. sapiens, respektivno [36]. Slično proteinima toplinskog šoka (HSP 90 i HSP 60), koji su bili među visoko povezanim proteinima u P. patens, protein toplinskog šoka (HSP83) (KFM78806.1) također je identificiran među 20 najboljih proteina čvorova u S. mimosarum [37]. Pokazalo se da ovaj protein ima mnogo ortologa u organizmima D. melanogaster, M. musculus, A. thaliana, S. cerevisiae, C. elegans, H. sapiens, E coli, i C. jejuni. To može biti zato što je HSP83 uključen u visoko očuvane puteve i funkcionira kod ovih vrsta. Vrijedi napomenuti da su faktor 8 spajanja pre-mRNA-obrade-spajanja (KFM66933.1) i protein 1 koji sadrži domenu SNW-a (KFM68418.1), dva gena povezana s procesom spajanja mRNA, bili među najuzvišenije povezanim čvorovima u S. mimosarum.

20 najboljih čvorišta u predviđenom PPI -u S. mimosarum su rasvijetljeni iz mreže. Dvadeset čvorišta predstavljaju najviše povezane proteine ​​u predviđenom PPI -u S. mimosarum

Faktor spajanja 8 prije obrade mRNA funkcionira u vezanju s5NK U5 ili U6, a funkcija proteina 1 koja sadrži SNW domenu manje je razumljiva. Protein Cullin-3-A, koji je uključen u katabilizam proteina ovisnih o ubikvitinu, također je zanimljiv čvor (slika 6).

Genska ontološka analiza

Da bi se razumio biološki značaj konzerviranih proteina u predviđenoj PPI mreži, geni unutar PPI mreže označeni su pomoću Gene Ontology (GO) i UniProt mrežnih alata. Na temelju GO klasifikacije, 1830 gena je dodijeljeno "biološkom procesu", a 1344 gena "molekularnoj funkciji". Analiza obogaćenih procesa pokazala je da su proteini uključeni u unutarstanični transport proteina (GO: 0006886), savijanje proteina (GO: 0006457) i metaboličke procese ugljikohidrata (GO: 0005975) previše zastupljeni, vjerojatno zbog očuvane prirode ovih procesa. Osim toga, savijanje proteina je obogaćeno zbog zahtjeva fizičke strukture proteina za uključivanje u interaktom. Uz stanične i metaboličke procese, većina previše zastupljenih bjelančevina bila je uključena u metabolizam ugljikohidrata, vjerojatno zbog složenosti i očuvanja ovog procesa, zajedno s njegovim visokim proučavanjem. Osim toga, "molekularna funkcija" vezana za aktivnost vezanja ATP-a (GO: 0005524), aktivnost vezanja DNA (GO: 0003677), aktivnost oksidoreduktaze (GO: 0016491) i aktivnost transferaze (GO: 0016740) također su bile previše zastupljene u PPI mreža S. mimosarum (Slika 7). To se također može objasniti visokim stupnjem očuvanja ovih funkcija. Drugi proteini identificirani u PPI -ima također su bili uključeni u značajne funkcije i procese, poput popravka DNA, replikacije DNA i razvoja višestaničnih organizama. Podgrupa proteina S. mimosarum i njihove GO bilješke dobivene su u našoj analizi, nalaze se u Dodatnim datotekama 3 i 4.

Raspodjela molekularnih funkcija i bioloških procesa u S. mimosarum. a Raspodjela molekularnih funkcija u S. mimosarum. b Raspodjela bioloških procesa u S. mimosarum

Evolucijska analiza očuvanja PPI podmreža uključenih u spajanje RNA D. melanogaster, H. sapiens, A. thaliana, S. cerevisiae, i S. mimosarum

Preduzeli smo pristup temeljen na određivanju interakcija u spajanju RNA koje su sačuvane između D. melanogaster i H. sapiens i između A. thaliana i S. cerevisiae, koji su korisni modeli za proučavanje spajanja RNA. Konkretno, proteini povezani s spajanjem 42, 19 i 22 RNA pokazali su preklapanje u PPI mrežama između D. melanogaster i H. sapiens, između D. melanogaster i S. cerevisiae, i između D. melanogaster i A. thaliana, odnosno (dodatna datoteka 5).Iako procesi spajanja RNA i povezani geni obavljaju bitne funkcije u svim organizmima, organizmi s udaljenim evolucijskim odnosima pokazali su samo djelomično očuvanje PPI procesa spajanja RNA u H. sapiens, D. melanogaster, S. cerevisiae, i A. thaliana. Osim toga, četiri proteina koji se preklapaju, i to CBP20 (Q9V3L6), LSm7 (Q9VJI7), CBP80 (Q7K4N3) i RE43665p (Q9W2P5), očuvana su diljem D. melanogaster, H. sapiens, A. thaliana, i S. cerevisiae [38,39,40]. Dva proteina, Hrp36 (P48810) i SC35 (Q7KTD2), također su regulatorni proteini povezani sa spajanjem RNA u D. melanogaster [41,42,43]. Hrp36 uglavnom sprječava proteine ​​bogate serinom/argininom da potiču ektopično uključivanje više varijanti egzona, što je uključeno u alternativno spajanje Dscam gen [41, 43, 44]. Iako Hrp36 ima važne funkcije povezane sa spajanjem RNA D. melanogaster, nije opisano u H. sapiens, A. thaliana, ili S. cerevisiae. Nasuprot tome, SC35 je evolucijski očuvan među D. melanogaster, H. sapiens, i A. thaliana. Iako je nedavno istraživanje pokazalo ulogu SC35 u alternativnom spajanju mRNA D. melanogaster [42], znanje o biološkim funkcijama ovog proteina je ograničeno.

Nakon analize evolucijskog očuvanja procesa spajanja RNA u H. sapiens, D. melanogaster, S. cerevisiae, i A. thaliana, predviđene PPI povezane s spajanjem RNA S. mimosarum također su analizirani u ova četiri uzorna organizma. Preklapanje u organizmima pokazatelj je interakcija u kojima će se vjerojatno dogoditi S. mimosarum to je uključivalo tri preklapajuća PPI -a u H. sapiens, tri preklapajuća PPI -a u D. melanogaster, jedan preklapajući PPI u A. thaliana, tri preklapajuća PPI -a u S. cerevisiae, a sačuvana je samo jedna interakcija KFM77132.1 i KFM61340.1 D. melanogaster, H. sapiens, i S. cerevisiae (Slika 8 Tablica 4) [45, 46]. Ponovno smo analizirali podatke iz podmreža povezanih s spajanjem RNK S. mimosarum i otkrili da je faktor spajanja pre-mRNA-obrade 8 (KFM66933.1), koji je važno visoko povezano središte, također uključen u spajanje RNA u S. mimosarum. Ovo visoko povezano središte uključeno u spajanje RNA također se može objasniti vjerojatnim očuvanjem ovog puta u različitih vrsta i njegovim interakcijama s drugim signalnim putevima.

Mrežne interakcije proteina povezane sa spajanjem mRNA S. cerevisiae, D. melanogaster, C. jejuni, A. thaliana, i S. mimosarum. PPI povezani s spajanjem RNA evolucijski su konzervirani u D. melanogaster – H. sapiens, D. melanogaster – A. thaliana, i D. melanogaster – S. cerevisiae usporedbe. a Mreža za interakciju proteina povezana s spajanjem RNA D. melanogaster. Crvena predstavlja interakcijsku mrežu povezanu s spajanjem mRNA D. melanogaster. b Mreža za interakciju proteina povezana sa spajanjem mRNA H. sapiens. Ružičasta predstavlja nekonzervativnu proteinsku interakcijsku mrežu spajanja RNA D. melanogaster. Cijan predstavlja konzervativnu interakcijsku mrežu proteina povezanu s spajanjem RNA D. melanogaster. c Mreža proteinskih interakcija povezanih s spajanjem mRNA A. thaliana. Plava predstavlja nekonzervativnu interakcijsku mrežu proteina povezanu s spajanjem RNA D. melanogaster. Žuta boja predstavlja konzervativnu interakcijsku mrežu proteina povezanu s spajanjem RNA D. melanogaster, dok su konzervativne interakcije (rubovi) istaknute sa crvene crte. d Mreža proteinskih interakcija povezanih s spajanjem mRNA S. cerevisiae. Tamnozelene predstavlja konzervativnu mrežu interakcije proteina povezanu s spajanjem RNA D. melanogaster. Svijetlozelena predstavlja nekonzervativnu mrežu interakcije proteina povezanu s spajanjem RNA D. melanogaster, dok su konzervativne interakcije (rubovi) istaknute sa crvene crte. e Predviđena mreža proteinskih interakcija povezanih s spajanjem mRNA S. mimosarum. Zeleno PPI u S. mimosarum dobiveni su predviđanjem na temelju S. cerevisiae, D. melanogaster, H. sapiens, i A. thaliana. Konzervativne interakcije (rubovi) istaknute su sa crvene crte. Ljubičasta PPI u S. mimosarum dobiveni su predviđanjem na temelju drugih modelnih organizama


PPI mrežna analiza mRNA profila ekspresije Ezrinovog nokdauna u karcinomu pločastih stanica jednjaka

Ezrin, koji kodira protein EZR koji umrežava aktinske niti, pretjerano izražava i uključuje invaziju, metastaze i lošu prognozu kod različitih vrsta raka, uključujući karcinom pločastih stanica jednjaka (ESCC). U našoj prethodnoj studiji, Ezrin je oboren i analiziran pomoću profila ekspresije mRNA koji nije u potpunosti iskopan. U ovoj smo studiji primijenili mrežno znanje i metode interakcija proteina i proteina (PPI) kako bismo istražili naše razumijevanje ovih različito eksprimiranih gena (DEG). PPI podmreže pokazale su da stotine DEG -a stupaju u interakciju s tisućama drugih proteina. Analiza subcelularne lokalizacije otkrila je da se DEG i njihovi izravno ili neizravno međudjelujući proteini distribuiraju u više slojeva, što je primijenjeno za analizu najkraćih puteva između EZR -a i drugih DEG -ova. Oznaka ontologije gena generirala je funkcionalnu mapu oznaka i pronašla stotine značajnih pojmova, osobito onih povezanih s organizacijom citoskeleta Ezrinovog proteina, poput "organizacije citoskeleta", "regulacije procesa temeljenog na aktinskim nitima" i "regulacije organizacije citoskeleta aktina". ” Algoritam slučajnog hoda s ponovnim pokretanjem primijenjen je za određivanje prioriteta DEG -ova i identificirao je nekoliko DEG -ova povezanih s rakom koji su najbliži EZR -u. Ove analize temeljene na PPI mreži uvelike su proširile naše razumijevanje profila ekspresije mRNA Ezrinovog rušenja za buduće ispitivanje uloga i mehanizama Ezrina.

1. Uvod

Ezrin (također nazvan VIL2), koji kodira protein EZR, član je proteinske obitelji Ezrin-radiksin-moesin (ERM) koja se koncentrira u strukturama stanične površine bogate aktinom, umrežavajući aktinske niti s plazma membranom [1] . Potvrđeno je da je Ezrin prekomjerno izražen i da uključuje različite aspekte biološkog ponašanja stanica raka, kao što su invazija i metastaze u raku dojke, osteosarkom i rabdomiosarkom. Štoviše, prekomjerna ekspresija Ezrina često je u korelaciji s lošom prognozom pacijenata s karcinomom vrata maternice, osteosarkomom, kolorektalnim adenokarcinomom i gastrointestinalnim karcinomom [2, 3].

Važna biološka uloga Ezrina u karcinomu pločastih stanica jednjaka (ESCC) otkrivena je u našim prethodnim studijama. Prvo, prekomjerna ekspresija Ezrina povezana je s invazivnim fenotipom zloćudno transformiranih epitelnih stanica jednjaka [4]. Također smo otkrili da protein Ezrin EZR ima tendenciju translokacije s plazma membrane u citoplazmu u ESCC stanicama [5]. Nakon toga, Ezrin je srušen shRNA u staničnoj liniji ESCC, što je dovelo do smanjenja rasta, prianjanja i invazivnosti stanica raka in vitro i tumorigeneza in vivo. Profil ekspresije mRNA Ezrinovog rušenja analiziran je pomoću Affymetrix GeneChip humanog genoma U133 plus 2,0 [6].

Različite vrste molekularnih interakcija, poput protein-DNA, DNA-RNA, protein-RNA, RNA-RNA i interakcije protein-protein (PPI) igraju ključnu ulogu u posredovanju brojnih bioloških procesa i daju multifunkcionalnost jednog proteina. Većina proteina praktički tvore multiproteinske komplekse za postizanje specifičnih funkcija u biološkom kontekstu [7, 8]. Posljednjih godina sve je veći naglasak stavljen na integriranu analizu podataka o ekspresiji gena u kontekstu PPI, koji se široko primjenjuju u predviđanju funkcije proteina, identifikaciji funkcionalnih modula i predviđanju interakcija [9, 10].

Ipak, biološko značenje profila ekspresije mRNA Ezrinovog nokdauna u ESCC -u nije do kraja istraženo u našim prethodnim izvješćima [6]. U ovoj smo studiji ponovno analizirali profil ekspresije mRNA Ezrinovog rušenja integrirajući javnu PPI mrežu kako bismo pružili dublji pregled sa razine sustava, što bi bilo opsežnije od pukog navođenja imena gena na tradicionalan način.

2. Materijali i metode

2.1. Diferencijalno izraženi geni

GSE6233, profil ekspresije mRNA nakon Ezrinovog rušenja u EC109 ESCC staničnoj liniji, dostupan je iz baze podataka GEO (http://www.ncbi.nlm.nih.gov/geo/). Detaljna manipulacija mikromrežama opisana je u našoj prethodnoj studiji [6]. Ukratko, stanice EC109 su transficirane s pSUPER-siRNA specifičnom za Ezrin, s pSUPER.neo vektorom nespecifične siRNA koji se koristi kao negativna kontrola. Stabilno transficirani stanični klonovi odabrani su kulturom koja sadrži G418 (400 μg/mL, Calbiochem, Njemačka). Ukupna RNA stabilnih transficiranih klonova izolirana je TRIzolom (Invitrogen, SAD) i kvantificirana je spektrofotometrijski. Priprema dvolančane cDNA, sinteza biotinski obilježene cRNA mete, hibridizacija, ispiranje i bojenje, naknadno skeniranje hibridiziranog niza i obrada podataka provedeni su prema Priručniku za tehniku ​​analize ekspresije čipova gena Affymetrix. Podaci izraza obrađeni su normalizacijom i log transformacijom. Diferencijalno eksprimirani geni (DEG) dobiveni su pragom dvostruke promjene.

2.2. Generiranje PPI mreže

Najnoviji eksperimentalno potvrđeni podaci o ljudskim PPI-ima dostupni su u bazi podataka o interakcijama humanih bjelančevina-bjelančevina (HPRD) (http://www.hprd.org/), koja je naširoko primijenjena u istraživanju mreže ljudskih PPI-a za različita istraživanja bolesti [11]. Trenutni skup HPI PPI podataka sadrži 9617 jedinstvenih proteina i 39140 rubova (interakcije). HPRD podaci učitavaju se u softver Cytoscape kao matična PPI mreža za kasniju novu izgradnju mreže [12].

Najprije su generirane tri podmreže PPI mapiranjem sniženih DEG -ova, unaprijed reguliranih DEG -ova i ukupnih DEG -ova te izdvajanjem iz matične PPI mreže HPRD. Kako bi se povećala pouzdanost, rekonstrukcija mreže bila je ograničena na prve interaktivne susjede proteina ovih DEG -ova. Drugo, za otkrivanje osi proteina EZR-susjeda-DEG-susjeda proteina, EZR je korišten kao čvor upita za izgradnju EZR-središnje PPI mreže. Treće, podmreža je stvorena odabirom čvorova sa svim rubovima pomoću Cytoscapea nakon što su svi DEG -ovi preslikani na HPRD PPI mrežu radi otkrivanja unutarnjih interakcija između DEG -ova. Uklonjeni su pojedinačni čvorovi i međusobne interakcije proteina u tim podmrežama.

2.3. Topološki parametri mreže

Postoji nekoliko topoloških parametara mreže koji omogućuju usporedbu i karakterizaciju složenih mreža. Topološke parametre mreže analizirao je NetworkAnalyzer u ovoj studiji [13]. Analiza raspodjele stupnjeva stupnjeva čvora, jedne od najvažnijih topoloških karakteristika mreže, analizirana je kao što smo prethodno izveli [14].

2.4. PPI mrežni podstanični sloj

Podstanična lokalizacija svakog proteina u ukupnoj DEG PPI podmreži dohvaćena je iz Uniprot baze podataka proteina (http://www.hprd.org/) prilagođenim programom R i uvezena u Cytoscape kao atribut čvora. Cerebral (http://www.pathogenomics.ca/cerebral/) primijenjen je za slojeve proteina prema njihovoj staničnoj lokalizaciji [15]. Ukupna DEG -ova PPI podmreža podijeljena je u 8 slojeva prema njihovim staničnim lokacijama u ovoj studiji na sljedeći način: Izlučeni, Izlučeni/Membrana, Membrana, Citoskelet/Citoplazma, Citoplazma, Citoplazma/jezgra, jezgra i nizvodni geni. Proteini s nepoznatim staničnim položajem razvrstani su u nizvodne gene. Program igraph R primijenjen je za pronalaženje najkraćeg puta između EZR -a i ATF3 (aktivirajući transkripcijski faktor 3) u ukupnoj podmreži DEG PPI. Proteinski članovi unutar ovih putova također su prikazani prema njihovoj staničnoj lokalizaciji.

2.5. Konstrukcija funkcionalnih karata oznaka

Kako bi se razumjelo koji su aspekti biološke funkcije uključeni za proteine ​​u ukupnoj podmreži DEG PPI, primijenjen je dodatak ClueGO za identifikaciju prezastupljenih termina ontologije gena (GO) za biološke procese za članove proteina u mreži. ClueGO integrira GO pojmove u PPI mrežu i stvara funkcionalnu mapu oznaka koja ukazuje na međusobne odnose pojmova [16]. Izračunat je kappa skor koji odražava odnose između pojmova na temelju sličnosti njihovih povezanih gena, a mi smo u ovoj studiji postavili prag na 0,3.

2.6. Slučajna šetnja s ponovnim pokretanjem radi određivanja prioriteta DEG -ova

Algoritam slučajnog hodanja s ponovnim pokretanjem (RWR) simulira slučajni hodač na mreži za izračunavanje blizine između dva čvora iskorištavanjem globalne strukture mreže [17]. Algoritam izračunava bod prioriteta za svaki čvor na temelju vjerojatnosti ustaljenog stanja. RWR je definiran kao sljedeća jednadžba:

gdje je vjerojatnost ponovnog pokretanja, matrica susjednosti normalizirana stupcem mrežnog grafa i vektor veličine jednak broju čvorova u grafikonu gdje

element zadržava vjerojatnost da se nalazi u čvoru u vremenskom koraku

. U ovoj studiji, RWR je proveden prilagođenim programom R u podmreži ukupne DEG PPI s EZR proteinom postavljenim kao čvor sjemena (vidi Dodatni materijal 1 dostupan na Internetu na http://dx.doi.org/10.1155/2014/651954 ). Parametar smo postavili na 0,7, isto s Kohlerovom studijom [18]. I pokazalo se da ovaj parametar u mnogim drugim studijama ima mali utjecaj na rezultat određivanja prioriteta [19]. DEG-ovi su rangirani prema vrijednostima u vektoru vjerojatnosti ustaljenog stanja

. To se dobilo u vrijeme upita izvršavanjem iteracije do promjene između i (mjereno pomoću

. Rezultati vjerojatnosti DEG -ova transformirani su u dnevnik 10 i smatrani su atributom čvora te su prikazani u Cytoscape -u.

3. Rezultati

3.1. PPI mreže DEG -ova

Ukupno smo dobili 244 različito eksprimirana gena (DEG), uključujući 199 reguliranih gena i 45 gena s nižom regulacijom (dopunski materijal 2). Od kritičnog je značaja istražiti potencijalne uloge Ezrina eksplikacijom DEG -a, a istraživanje njihovih interakcija s drugim proteinima dalo bi duboki uvid u funkcije Ezrina i njegovih DEG -ova. Subregulirana DEG PPI podmreža sadržavala je 187 čvorova i 384 ruba (interakcije), uključujući 21 niže regulirane DEG (slika 1 (a)). Unaprijed regulirana DEG PPI podmreža sadržavala je 799 čvorova i 3097 rubova, uključujući 103 unaprijed regulirana DEG -a (slika 1 (b)). Ukupna DEG PPI podmreža sastavljena od 942 čvora i 4095 rubova, koja sadrže 123 DEG -a (slika 1 (c)) (dopunski materijal 3). Ove tri podmreže pokazale su da je rušenje Ezrina uvelike poremetilo PPI mrežu u ESCC -u jer stotine DEG -a stupaju u interakciju s tisućama proteina kako bi povećale biološke posljedice. Podmreža koja se temelji na osi EZR-susjedi-DEG-susjedi također je konstruirana za otkrivanje odnosa između EZR-a i njegovih najbližih proteina DEG (slika 1 (d)). Ova osovinska podmreža sastavljena od 79 čvorova i 93 ruba, uključujući 16 DEG -ova, osim sniženih EZR -a, SDC2 i DCN -a, ostali su bili 13 reguliranih gena. Trenutni skup podataka o HPRD-u sadrži 44 proteina u interakciji s EZR-om, od kojih je samo SDC2 smanjen 2,6 puta, dok se drugi proteini nisu značajno promijenili (slika 1 (d)). DEG-DEG interakcije su stečene i pokazale su unutarnje interakcije između DEG. Ova podmreža sadržavala je 17 čvorova (4 spuštena i 13 regulirana čvora) i 10 rubova, tvoreći 3 interakcije s tri DEG i 4 interakcije s dva DEG (slika 1 (e)). EZR se povezuje s reguliranim KAL1 kroz svoju interakciju sa SDC2.


(a)
(b)
(c)
(d)
(e)
(a)
(b)
(c)
(d)
(e) PPI podmreže konstruirane su preslikavanjem DEG -ova na HPRD PPI mrežu. ((a) - (c)) PPI podmreže za snižene, povećane i ukupne DEG. (d) EZR-središnja PPI podmreža. (e) Unutarnje interakcije između DEG -ova. Četvrtasti čvorovi predstavljaju bjelančevine kodirane prema dolje reguliranim genima, dok okrugli čvorovi predstavljaju bjelančevine kodirane poviše reguliranim genima. Ostali proteini u interakciji bez značajno drugačije ekspresije predstavljeni su kao čvorovi u obliku dijamanta.
3.2. Analize topoloških svojstava mreže

Da li je raspodjela stupnjeva čvorova u mreži aproksimacija raspodjele zakona o snazi ​​standardni je karakter mreža bez skale. PPI mreža također poštuje ovo pravilo, po čemu se razlikuje od slučajne mreže [20]. Raspodjele stupnjeva čvora niže reguliranih, reguliranih i ukupnih DEG podmreža otprilike su slijedile distribucije koje odgovaraju zakonu moći, s

, 0,871, odnosno 0,905 (slika 2). Ove su naznačene tri PPI podmreže istinske stanične složene biološke mreže okarakterizirane kao bez skale. Ovi rezultati također sugeriraju da nekoliko proteinskih čvorova djeluje kao čvorišta s velikim brojem veza s drugim proteinskim čvorovima [21]. Ostali topološki parametri ovih podmreža, poput koeficijenta grupiranja, centralizacije mreže i gustoće mreže prikazani su u tablici 1. Također smo primijenili STRING bazu podataka [22] za izgradnju nove DEG PPI mreže (dopunski materijal 4), koja je također okarakterizirana kao bez kamenca (dopunski materijal 5). Uspoređujemo nekoliko kritičnih topoloških parametara ove dvije DEG PPI mreže i otkrivamo da su ti parametri vrlo slični (dopunski materijal 6). Smatramo da je naša DEG PPI mreža izvedena iz HPRD -a ili STRING -a pouzdana i robusna.


(a)
(b)
(c)
(a)
(b)
(c) Raspodjela zakona stepena čvora. (a) Raspodjela stupnjeva niže regulirane DEG PPI mreže. (b) Raspodjela stupnjeva unaprijed regulirane DEG PPI podmreže. (c) Raspodjela stupnjeva ukupne DEG PPI podmreže. Grafikon prikazuje opadajući trend raspodjele stupnjeva s povećanjem broja veza koje prikazuju topologiju bez skale.
3.3. Podstanična lokalizacija proteina u PPI podmreži

Nakon sinteze, proteini se transportiraju u stanične različite odjeljke ovisno o njihovoj molekularnoj ulozi, ponekad se čak transportiraju na više mjesta. Podaci o lokalizaciji bjelančevina vrijedne su informacije za pojašnjenje funkcija proteina [23].Kako bi se pokazala njihova podstanična lokalizacija i dali tragovi za njihove funkcije, ukupna DEG podmreža je u ovoj studiji preuređena u 8 slojeva (slika 3 (a)). Kao poveznica između proteina citoskeleta aktina i proteina plazma membrane, protein Ezrin EZR uglavnom se nalazi u citoskeletu/citoplazmi. Većina proteina u interakciji s EZR uglavnom se nalazi u membrani, citoskeletu ili citoplazmi, gdje se EZR uglavnom nalazi. Međutim, četiri proteina u interakciji ADRA1B, S100P, WWOX i CTNNB1 mogu se translocirati u jezgru (slika 3 (b)).


(a)
(b)
(c)
(d)
(a)
(b)
(c)
(d) Podstanične lokalizacije proteina u podmreži PPI ilustrirao je Cerebral. (a) Ukupna DEG PPI podmreža. (b) EZR i proteini u interakciji. (c) EZR-središnja PPI podmreža. (d) Najkraći putovi od EZR -a do ATF3.

S druge strane, proteini u EZR-središnjoj mreži također su uključivali različite podstanične lokalizacije (slika 3 (c)). Budući da je glavna komponenta protoka signala u staničnim signalnim kaskadama posredovana PPI -ovima, pretpostavili smo da su različiti procesi stanične transdukcije signala izgrađeni interakcijama između DEG -a i njihovih susjednih proteina, osim tradicionalno priznatih putova. Utvrdili smo da je transkripcijski faktor ATF3 porastao nakon obaranja Ezrina u našem prethodnom izvješću [6]. Da bismo pronašli mogući najkraći put od EZR -a do ATF3, primijenili smo algoritam najkraćeg puta, koji je u stanju pronaći najkraću vezu između dva čvora u grafikonu, za identifikaciju proteina koji povezuju između EZR -a i ATF3. Pronašli smo devet najkraćih putova od EZR -a do ATF3 (tablica 2) sa svim duljinama jednakim 3.

Radi bolje ilustracije, ti su proteini također preraspoređeni u više slojeva prema njihovim podstaničnim lokalizacijama (slika 3 (d)). Budući da je većina transdukcije signala inducirana iz citoplazme u jezgru, pretpostavili smo da četiri sljedeća najkraća puta imaju najveću vjerojatnost: EZR

ACTB SMAD3 ATF3 EZR PRKAR2A SMAD3 ATF3 EZR CTNNB1 NFKB1 ATF3 EZR WWOX TP53 ATF3.

3.4. Karta funkcionalnih bilješki PPI podmreže

ClueGO je generirao funkcionalnu mapu oznaka za ukupnu DEG PPI podmrežu, u kojoj su proteinski članovi predstavljeni čvorovima koji odgovaraju njihovim obogaćenim GO pojmovima, s rubovima koji pokazuju da dva pojma dijele iste obogaćene gene (slika 4). Zanimljivo je da su pronađeni mnogi pojmovi GO povezani s organizacijom citoskeleta, poput "organizacije citoskeleta", "regulacije procesa temeljenog na aktinskim filamentima" i "regulacije organizacije citoskeleta aktina". Na naše iznenađenje, PPI podmreža također je uključivala staničnu adheziju i izvanstanični matriks, poput "organizacije spajanja stanica-stanica", "regulacije adhezije staničnog matriksa" i "adhezije stanica-supstrat". Ovi rezultati sugeriraju da je rušenje Ezrina utjecalo na različite biološke aktivnosti putem poremećene PPI podmreže, koje su bile blisko u skladu s funkcijama EZR -a.


Funkcionalna karta bilješki ukupne PPI podmreže DEG -ova. Pojmovi koji se odnose na Ezrinove funkcije označeni su ružičastim oblikom.
3.5. Prioriteti DEG -ova

Obično za dobivanje stotina ili tisuća DEG -ova iz analize profila ili -omics, hitno je identificirati koji DEG -ovi su najviše povezani s ciljnim genima (genima) ili od kojih se očekuje da će se DEG naknadno istražiti kako bi se otkrili osnovni mehanizmi. RWR algoritam primijenjen je za davanje prioriteta proteinima u podmreži ukupnog DEG PPI s EZR postavljenim kao sjemenski čvor. Ocjene vjerojatnosti DEG -a kretale su se od -2,06 do -8,28 nakon pretvorbe log 10. Viši rezultati ukazuju na to da su čvorovi bliže povezani s EZR -om. Ocjene su učitane kao atributi čvora ukupne PPI podmreže navođenjem veličina čvorova (slika 5 (a)). DEG -ovi su prikazani samo radi boljeg razlikovanja (slika 5 (b)). Kako bi se bolje ilustrirala njihova udaljenost do EZR -a, DEG -ovi su klasificirani prema bodovnom rasponu i preuređeni u različite slojeve, na primjer, EZR je klasificiran kao A, DEG -ovi unutar bodova

razvrstani su u B, DEG unutar

razvrstani su u C i tako dalje (slika 5 (c)). Sniženi SDC2 rangirao je prve zatvorene DEG -ove prema EZR -u, dok su drugi povećani DEG -ovi, poput ITGA5 i NDRG1, rangirani u drugu klasu.


(a)
(b)
(c)
(a)
(b)
(c) Analiza prioriteta DEG -ova u PPI podmreži ukupnih DEG -ova. (a) Veličina svakog čvora u podmreži PPI dizajnirana je gradijentno na temelju rezultata. (b) DEG -ovi su ekstrahirani iz (a) kako bi se pokazala njihova veličina. (c) DEG -ovi su preuređeni prema njihovoj bliskosti s proteinom EZR.

4. Rasprava

ESCC je četvrti najčešće dijagnosticirani rak i četvrti vodeći uzrok smrti od raka u Kini [24]. Biološke uloge i molekularni mehanizmi Ezrina u ESCC -u daleko su od elaboracije. Veliki izazov u postgenomskoj eri je odrediti funkciju proteina na razini ljestvice. Akumulirana istraživanja pokazala su da integrativna analiza profila ekspresije gena i PPI mreže može dati nova svjetla u molekularne mehanizme specifičnih gena ili bolesti [25, 26].

U ovoj studiji razvijen je sistemski pristup povezivanjem DEG -ova s ​​javno dostupnim PPI podacima za generiranje podmreža, koji pružaju jedinstven uvid u mehanizam Ezrina s mrežnog aspekta. Tri PPI podmreže ukazuju na to da EZR utječe na proteinske aktivnosti izravno ili neizravno u interakciji s DEG i drugim proteinima, a njegovo rušenje može utjecati na različite biološke funkcije u ESCC -u. Predloženo je da su metode temeljene na mrežnom znanju važni pristupi bilježenju funkcija proteina u postgenomskoj eri [27]. Smatrali bismo da bi sniženi protein EZR -a u interakciji SDC2 također mogao biti ključan za organizaciju citoskeleta prije nego što smo počeli pretraživati ​​literaturu. Zapravo, Granés i sur. izvijestio je da Ezrin povezuje SDC2 s aktinskim citoskeletom kroz interakciju između Ezrinove N-terminalne domene i SDC2 citoplazmatske domene, što je potvrdilo našu pretpostavku [28].

PPI podmreža mogla bi dati tragove za objašnjenje potencijalnih molekularnih mehanizama koji ranije nisu otkriveni. Prethodno smo potvrdili da je rušenje Ezrina smanjilo invaziju ESCC stanica putem TGF-beta puta sa smanjenom razinom p-Smad2/3 [6]. Međutim, izravni dokazi nisu otkriveni. Nedavno su Mytilinaiou i sur. pokazalo je da je inhibicijom SDC-2 uklonjena adhezija stanica HT1080 inhibicijom TGF-beta-inducirane Smad2 fosforilacije [29]. Utvrdili smo da je SDC2 uvelike smanjen 2,6 puta u profilu ekspresije mRNA i potvrdili smanjenje SDC2 kao i p-Smad2/3 u našem prethodnom izvješću, koji su bili u skladu s Mytilinaiouovim izvješćem [6], dok su sniženi CYR61 i CTGF izravne transkripcijske mete Smad2/3, s konsenzusnim Smad veznim sekvencama u njihovim promotorima [30, 31]. Ovim kombiniranim analizama PPI podmreže i literature, predložili smo os kaskade signala EZR -a (

) SDC2 () p-Smad2/3 () CYR61 i CTGF ().

Budući da je Ezrinovo rušenje izazvalo široku promjenu profila ekspresije gena, zanimljivo je razumjeti kako se ovaj signal transducira s prednje strane/površine stanice u jezgru jer je EZR povezivač membransko-citoskeleta. Jedan od dokaza je da proteini s izravnom interakcijom EZR -a, poput CTNNB1 (

-Catenin), S100P, WWOX i ADRA1B, imaju sposobnost translokacije u jezgru [32–35]. Budući da bi se toliko izravno i neizravno međusobno povezanih proteina moglo premjestiti u jezgru, uvjereno je da je rušenje Ezrina imalo veliki utjecaj na profil ekspresije gena ESCC. Lokalizacija proteina jedan je od njegovih najvažnijih atributa, koji pruža koristan uvid u funkciju proteina i dubinsko razumijevanje kako su biološki procesi regulirani zamršenim putevima [36]. U ovoj studiji, informacije o podstaničnoj lokalizaciji uključene su u ukupnu podmrežu DEG PPI i generirale su biološki intuitivnije rasporede mreže slične stazama. Ovi rezultati pokazuju da je EZR utjecao na signalne kaskade izvanstanične membrane-citoskelet/jezgra citoplazme. Kako bismo ilustrirali snagu ove vrste analize, primijenili smo algoritam najkraćeg puta kako bismo pronašli veze između knockdown EZR -a i reguliranog ATF3. Pronađeno je devet mogućih najkraćih putova. Uvjereno je da PPI mreža u kombinaciji s lokacijom proteina subcelularno pruža veliku pomoć u budućoj eksperimentalnoj identifikaciji odnosa između Ezrina i DEG -a.

Kako odabrati kritični gen od stotina DEG -a veliki je izazov za istraživače da nastave s naknadnim pokusima nakon što je eksperiment s čipom završen. U ovoj studiji primijenjen je algoritam RWR za određivanje prioriteta DEG -a rangiranjem njihove bliskosti s EZR -om. Najvažnija prednost RWR -a je ta što može raditi bez postojećih bilješki o proteinima, što je korak ograničenja za analizu proteina velikih razmjera. Od najbližih DEG -ova zatvorenih za EZR, mnogi od njih važni su za organizaciju i raspored citoskeleta, a čak su uključeni u invaziju i metastaze u više karcinoma. AKAP12, protein skele za PKA i PKC, kontrolira reorganizaciju aktin-citoskeleta na prostorno-vremenski način [37]. ITGA5 je važna komponenta za žarišne adhezije kroz kratki citoplazmatski rep koji strukturno povezuje citoskelet s izvanstaničnim matriksom, prenoseći mehaničke signale preko plazma membrane u oba smjera i regulirajući migraciju stanica [38]. Ovi su rezultati dali prioritete drugim DEG -ovima uzimajući u obzir njihov odnos s EZR -om i dali važne naznake za identifikaciju DEG -a u eksperimentima.

Štoviše, metoda najkraćeg puta naširoko se koristi za otkrivanje gena bolesti na mreži, poput gena povezanih s kolorektalnim karcinomom i gena povezanih s rakom želuca [39, 40]. Ove dvije studije smatrale su da proteini na najkraćem putu mogu dijeliti neke zajedničke značajke dvaju poznatih gena povezanih s rakom te su otkrili desetke novih gena povezanih s rakom. U ovom smo istraživanju pretpostavili da će informacije prenesene s našeg ciljnog proteina EZR na drugi protein u mreži također usvojiti ove najekonomičnije načine, pa smo primijenili algoritam najkraćeg puta kako bismo ilustrirali kako EZR doseže određeni transkripcijski faktor. Slično, također smo otkrili da su neki proteini na ovim najkraćim stazama povezani s ESCC -om ili barem s rakom. Na primjer, postojana fosforilacija SMAD3 kritična je u EMT posredovanom TGF-beta1 u ESCC-u [41]. U našoj smo prethodnoj studiji otkrili da je aktiviranje signalizacije CTNNB1 (-Catenin) važno u promicanju agresivnosti ESCC stanica snižavanjem DSC2 [42]. Nadahnuti gore opisanim rezultatima, također smo pretpostavili da proteini bliski EZR -u također mogu dijeliti neke zajedničke značajke s EZR -om, što ukazuje na to da bi ti proteini mogli biti vrlo važni u ESCC -u. Razina gena i proteina ITGA5 povećana je u mucinoznim kolorektalnim karcinomima [43]. Jin i sur. Utvrđeno je da hipermetilacija promotora AKAP12 može razlikovati adenokarcinom jednjaka od karcinoma pločastih stanica jednjaka i normalnog jednjaka nakon što su otkriveni u 259 ljudskih tkiva jednjaka [44]. Dakle, oba rezultata slučajnog hodanja s ponovnim pokretanjem i najkraćeg puta različite su metode koje mogu pronaći ključne gene povezane s ESCC -om.

5. Zaključak

Ukratko, analize temeljene na PPI mreži uvelike su proširile naše razumijevanje profila ekspresije mRNA nakon Ezrinovog rušenja u ESCC -u. GO bilješka PPI mreže pruža širok raspon izbora za istraživanje potencijalne uloge Ezrina. I rezultati najkraćih putova i analize slučajnog hoda s ponovnim pokretanjem mogu pronaći važne gene povezane s ESCC -om, koji bi mogli poslužiti kao ciljevi istraživanja u budućim pokusima za potvrdu molekularnih mehanizama Ezrina u ESCC -u.

Sukob interesa

Autori izjavljuju da nema sukoba interesa u vezi s objavljivanjem ovog rada.

Zahvalnice

Ovaj su rad podržali Grantovi iz Zajedničkog fonda NSFC-Guangdong (U0932001), Nacionalnog programa temeljnih istraživanja (2012CB526608), Nacionalnog programa za istraživanje i razvoj visoke tehnologije Kine (2012AA02A503 i 2012AA02A209), Nacionalne zaklade za znanost Kine (30900560 ), Zaklada za istaknute mlade talente u visokom obrazovanju u Guangdongu (LYM09081) i Fond za medicinska istraživanja Sveučilišta Shantou. Autori zahvaljuju dr. Stanleyu Linu, odjelu za patofiziologiju, Laboratoriju za ključnu imunopatologiju u provinciji Guangdong, Medicinski fakultet Sveučilišta Shantou, na pomoći u revidiranju rada.

Dopunski materijali

Dopunski materijal 1: Ovo je R skripta za analizu najkraćeg puta pomoću igraph paketa.

Dopunski materijal 2: Diferencijalno eksprimirani geni generirani iz profila mRNA nakon Ezrinovog rušenja u karcinomu pločastih stanica jednjaka koristeći prag promjene 2 puta.

Dopunski materijal 3: Detaljni parovi interakcija protein-protein ukupne diferencijalno eksprimirane genske PPI mreže.

Dopunski materijal 4: Nova DEG PPI mreža izvedena iz skupa podataka STRING koja sadrži 8362 čvora (179 DEG) i 23117 rubova. Crni čvorovi predstavljaju DEG, bijeli mali čvorovi predstavljaju svoje proteine ​​u interakciji.

Dopunski materijal 5: Raspodjela stupnja čvora nove DEG mreže izvedena iz skupa podataka STRING.

Dopunski materijal 6: Topološki parametri mreže ukupne pod-mreže DEG PPI izvedeni iz STRING.

Reference

  1. S. Louvet-Vall ພ, "ERM proteini: od stanične arhitekture do stanične signalizacije," Biologija stanice, sv. 92, br. 5, str. 305–316, 2000. Pogled na: Mjesto izdavača | Google učenjak
  2. S. Moleirinho, A. Tilston-Lunel, L. Angus, F. Gunn-Moore i P. A. Reynolds, "Sve veća obitelj proteina FERM", Biokemijski časopis, sv. 452, br. 2, str. 183–193, 2013. Pogled na: Mjesto izdavača | Google učenjak
  3. A. L. Neisch i R. G. Fehon, "Ezrin, Radixin i Moesin: ključni regulatori interakcija membrane i korteksa i signalizacija", Trenutno mišljenje u staničnoj biologiji, sv. 23, ne. 4, str. 377–382, 2011. Pogled na: Mjesto izdavača | Google učenjak
  4. Z. Shen, L. Xu, E. Li i sur., "Ezrin, aktin i citoskelet u apoptozi epitelnih stanica jednjaka induciranim arsenovim trioksidom", Međunarodni časopis za molekularnu medicinu, sv. 12, ne. 3, str. 341–347, 2003. Pogledajte na: Google Scholar
  5. H. Zeng, L. Xu, D. Xiao i sur., "Promijenjena ekspresija ezrina u karcinomu pločastih stanica jednjaka", Časopis za histokemiju i citokemiju, sv. 54, br. 8, str. 889–896, 2006. Pogled na: Mjesto izdavača | Google učenjak
  6. J. J. Xie, L. Y. Xu, Y. M. Xie i sur., "Uloge ezrina u rastu i invazivnosti stanica skvamoznog karcinoma jednjaka", Međunarodni časopis za rak, sv. 124, br. 11, str. 2549–2558, 2009. Pogled na: Mjesto izdavača | Google učenjak
  7. S. Navlakha, A. Gitter i Z. Bar-Joseph, "Mrežni pristup za predviđanje nedostajućih interakcija na putu", PLoS Računska biologija, sv. 8, ne. 8, ID članka e1002640, 2012. Pogledajte na: Mjesto izdavača | Google učenjak
  8. R. Sharan, I. Ulitsky i R. Shamir, "Mrežno predviđanje funkcije proteina", Biologija molekularnih sustava, sv. 3, članak 88, 2007. Pogledajte na: Web mjesto izdavača | Google učenjak
  9. I. W. Taylor, R. Linding, D. Warde-Farley i sur., "Dinamička modularnost u mrežama interakcije proteina predviđa ishod raka dojke", Biotehnologija prirode, sv. 27, ne. 2, str. 199–204, 2009. Pogled na: Mjesto izdavača | Google učenjak
  10. J. De Las Rivas i C. Fontanillo, "Osnove proteinsko-proteinskih interakcija: ključni pojmovi za izgradnju i analizu interaktomskih mreža", PLoS Računska biologija, sv. 6, ne. 6., 2010. Pogledajte na: Web mjesto izdavača | Google učenjak
  11. R. Goel, B. Muthusamy, A. Pandey i T. S. K. Prasad, „Referentna baza podataka o ljudskim proteinima i ljudska proteinska studija kao izvori otkrića za molekularnu biotehnologiju“, Molekularna biotehnologija, sv. 48, ne. 1, str. 87–95, 2011. Pogled na: Mjesto izdavača | Google učenjak
  12. M. E. Smoot, K. Ono, J. Ruscheinski, P. Wang i T. Ideker, "Cytoscape 2.8: nove značajke za integraciju podataka i vizualizaciju mreže", Bioinformatika, sv. 27, ne. 3, str. 431–432, 2011. Pogled na: Mjesto izdavača | Google učenjak
  13. Y. Assenov, F. Ram írez, S.-S. Schelhorn, T. Lengauer i M. Albrecht, "Računanje topoloških parametara bioloških mreža", Bioinformatika, sv. 24, br. 2, str. 282–284, 2008. Pogled na: Mjesto izdavača | Google učenjak
  14. B. Wu, C. Li, P. Zhang i sur., "Disekcija interakcije miRNA-miRNA u karcinomu pločastih stanica jednjaka", PLOS ONE, sv. 8, ne. 9, ID članka e73191, 2013. Pogledajte na: Google Scholar
  15. A. Barsky, J. L. Gardy, R. E. W. Hancock i T. Munzner, "Cerebral: citocape dodatak za raspored i interakciju s biološkim mrežama pomoću bilješke o staničnoj lokalizaciji", Bioinformatika, sv. 23, ne. 8, str. 1040–1042, 2007. Pogled na: Mjesto izdavača | Google učenjak
  16. G. Bindea, B. Mlecnik, H. Hackl i sur., "ClueGO: dodatak Cytoscape za dešifriranje funkcionalno grupiranih ontologija gena i mreža označavanja staza", Bioinformatika, sv. 25, ne. 8, str. 1091–1093, 2009. Pogled na: Mjesto izdavača | Google učenjak
  17. H. Tong, C. Faloutsos i J. Pan, "Brzi nasumični hod s ponovnim pokretanjem i njegove aplikacije", u Zbornik radova 6. međunarodne konferencije o rudarstvu podacima (ICDM '06), str. 613–622, prosinac 2006. Pogled na: Mjesto izdavača | Google učenjak
  18. S. K öhler, S. Bauer, D. Horn i P. N. Robinson, "Hodanje interaktomom za određivanje prioriteta gena za bolest kandidata", American Journal of Human Genetics, sv. 82, br. 4, str. 949–958, 2008. Pogled na: Mjesto izdavača | Google učenjak
  19. Y. Li i J. C. Patra, "Integracija više izvora podataka radi određivanja prioritetnih gena kandidata pomoću sniženog sustava ocjenjivanja", BMC bioinformatika, sv. 11, članak S20, br. 1., 2010. Pogledajte na: Web mjesto izdavača | Google učenjak
  20. S. Maslov i K. Sneppen, „Specifičnost i stabilnost u topologiji proteinskih mreža“, Znanost, sv. 296, br. 5569, str. 910–913, 2002. Pogled na: Mjesto izdavača | Google učenjak
  21. A. L. Barab ási i Z. N. Oltvai, "Mrežna biologija: razumijevanje funkcionalne organizacije stanice", Nature Reviews Genetics, sv.5, br. 2, str. 101–113, 2004. Pogledajte na: Google Scholar
  22. A. Franceschini, D. Szklarczyk, S. Frankild i sur., "STRING v9.1: mreže interakcija protein-protein, s povećanom pokrivenošću i integracijom", Istraživanje nukleinskih kiselina, sv. 41, br. 1, str. D808 – D815, 2013. Pogled na: Mjesto izdavača | Google učenjak
  23. A. Kumar, S. Agarwal, J. A. Heyman i sur., "Stanična lokalizacija proteoma kvasca", Geni i razvoj, sv. 16, ne. 6, str. 707–719, 2002. Pogled na: Mjesto izdavača | Google učenjak
  24. Y. Lin, Y. Totsuka, Y. He i sur., "Epidemiologija raka jednjaka u Japanu i Kini", Časopis za epidemiologiju, sv. 23, ne. 4, str. 233–242, 2013. Pogled na: Mjesto izdavača | Google učenjak
  25. E. Nabieva, K. Jim, A. Agarwal, B. Chazelle i M. Singh, "Predviđanje funkcije proteina cijelim proteomima putem teoretske analize interakcijskih karata," Bioinformatika, sv. 21, dodatak 1, str. I302 – i310, 2005. Pogled na: Web mjesto izdavača | Google učenjak
  26. I. Lee, U. M. Blom, P. I. Wang, J. E. Shim i E. M. Marcotte, „Prioritiziranje gena kandidata za bolest jačanjem podataka o povezivanju genoma na mreži putem mreže“, Istraživanje genoma, sv. 21, ne. 7, str. 1109–1121, 2011. Pogled na: Web mjesto izdavača | Google učenjak
  27. R. Sharan, I. Ulitsky i R. Shamir, "Mrežno predviđanje funkcije proteina", Biologija molekularnih sustava, sv. 3, str. 88, 2007. Pogledajte na: Google Scholar
  28. F. Gran és, C. Berndt, C. Roy, P. Mangeat, M. Reina i S. Vilar ó, "Identifikacija novog mjesta vezanja za Ezrin u citoplazmatskoj domeni syndecan-2", Pisma FEBS -a, sv. 547, br. 1 𠄳, str. 212–216, 2003. Pogled na: Web mjesto izdavača | Google učenjak
  29. M. Mytilinaiou, A. Bano, D. Nikitović i sur., „Syndecan-2 je ključni regulator transformacijskog faktora rasta β 2/smad2 posredovana adhezija u stanicama fibrosarkoma, ” IUBMB Život, sv. 65, ne. 2, str. 134–143, 2013. Pogled na: Mjesto izdavača | Google učenjak
  30. L. Bartholin, L. L. Wessner, J. M. Chirgwin i T. A. Guise, "Ljudski gen Cyr61 je transkripcijska meta transformacije beta faktora rasta u stanicama raka", Pisma o raku, sv. 246, br. 1-2, str. 230–236, 2007. Pogled na: Mjesto izdavača | Google učenjak
  31. A. C. K. Chung, H. Zhang, Y. Kong i sur., „Napredni krajnji proizvodi glikacije induciraju cjevasti CTGF putem TGF-β-nezavisna Smad3 signalizacija, " Časopis Američkog društva za nefrologiju, sv. 21, ne. 2, str. 249–260, 2010. Pogled na: Web mjesto izdavača | Google učenjak
  32. J. Behrens, J. P. von Kries, M. K ühl i sur., "Funkcionalna interakcija β -katenina s transkripcijskim faktorom LEF -1," Priroda, sv. 382, br. 6592, str. 638–642, 1996. Pogled na: Mjesto izdavača | Google učenjak
  33. W. Kim, M. Kim i E. Jho, „Wnt/β-kateninska signalizacija: od plazma membrane do jezgre, " Biokemijski časopis, sv. 450, br. 1, str. 9–21, 2013. Pogled na: Mjesto izdavača | Google učenjak
  34. W. Si, Q. Kang, H. H. Luu i sur., "CCN1/Cyr61 je reguliran kanonskim Wnt signalom i igra važnu ulogu u diferencijaciji osteoblasta mezenhimalnih matičnih stanica izazvanoj Wnt3A," Molekularna i stanična biologija, sv. 26, ne. 8, str. 2955–2964, 2006. Pogled na: Mjesto izdavača | Google učenjak
  35. A. Maciejczyk, A. 𔆬ko, M. Ekiert i sur., "Povišena nuklearna ekspresija S100P povezana je sa lošim preživljavanjem u ranih pacijenata s rakom dojke", Histologija i histopatologija, sv. 28, ne. 4, str. 513–524, 2013. Pogledajte na: Google Scholar
  36. E. Glory i R. F. Murphy, "Automatsko određivanje podstanične lokacije i visokopropusna mikroskopija", Razvojna stanica, sv. 12, ne. 1, str. 7–16, 2007. Pogled na: Mjesto izdavača | Google učenjak
  37. S. Akakura i I. H. Gelman, "Ključna uloga AKAP12 u regulaciji dinamike stanične adhezije: kontrola citoskeletne arhitekture, migracija stanica i mitogena signalizacija", Časopis za prijenos signala, sv. 2012, ID članka 529179, 7 stranica, 2012. Pogledajte na: Web mjesto izdavača | Google učenjak
  38. R. O. Hynes, "Integrins: dvosmjerni, alosterični signalni strojevi", Stanica, sv. 110, br. 6, str. 673–687, 2002. Pogled na: Mjesto izdavača | Google učenjak
  39. B. Q. Li, T. Huang, L. Liu, Y. Cai i K. Chou, "Identifikacija gena povezanih s kolorektalnim karcinomom s mrmr i najkraćim putem u interakcijskoj mreži protein-protein", PLOS ONE, sv. 7, ne. 4, ID članka e33393, 2012. Pogledajte na: Mjesto izdavača | Google učenjak
  40. Y. Jiang, Y. Shu, Y. Shi, L.-P. Li, F. Yuan i H. Ren, "Identificiranje gena povezanih s rakom želuca pomoću algoritma za najkraći put i mreže interakcija protein-protein", BioMed Research International, sv. 2014, ID članka 371397, 9 stranica, 2014. Pogledajte na: Web mjesto izdavača | Google učenjak
  41. M. Natsuizaka, S. Ohashi, GS Wong i sur., "Protein-3 koji veže faktor inzulina sličan faktoru rasta potiče transformaciju faktora rasta i##x3b2 1 posredovanu epitelno-mezenhimsku tranziciju i pokretljivost u transformiranim ljudskim stanicama jednjaka, ” Karcinogeneza, sv. 31, ne. 8, str. 1344–1353, 2010. Pogled na: Web mjesto izdavača | Google učenjak
  42. W. K. Fang, L. D. Liao, L. Y. Li i sur., "Desmokolin-2 reguliran prema dolje potiče agresivnost stanica kroz preraspodjelu adhensnih spojeva i aktiviranje signalizacije beta-katenina u karcinomu pločastih stanica jednjaka," Journal of Pathology, sv. 231, str. 257–270, 2013. Pogledajte na: Google Scholar
  43. M. V. Denadai, L. S. Viana, R. J. Affonso Jr. i sur., "Ekspresija integrin gena i proteina u progresiji i diseminaciji kolorektalnog adenokarcinoma", BMC klinička patologija, sv. 13, ne. 1, članak 16., 2013. Pogled na: Web mjesto izdavača | Google učenjak
  44. Z. Jin, J. P. Hamilton, J. Yang i sur., "Hipermetilacija AKAP12 promotora biomarker je Barrettove udružene neoplastične progresije jednjaka," Biomarkeri i prevencija epidemiologije raka, sv. 17, ne. 1, str. 111–117, 2008. Pogled na: Mjesto izdavača | Google učenjak

Autorska prava

Autorska prava © 2014 Bingli Wu i sur. Ovo je članak s otvorenim pristupom distribuiran pod Licencom za dodjeljivanje autorskih prava Creative Commons, koji dopušta neograničenu upotrebu, distribuciju i reprodukciju na bilo kojem mediju, pod uvjetom da je izvorno djelo pravilno citirano.


Rasprava

Na temelju svojih središnjih mjesta, čini se da je P63104 (14-3-3 proteina zeta/delta) koji odgovara genu YWHAZ drugi najvažniji protein u tim procesima medijatora. To je u skladu s literaturom, navodeći da je P63104 pratilja [12] i bogato je povezan s nekoliko vrsta drugih molekula s uglavnom slabim karikama [13]. Konkretno, uključen je u rast stanica i karcinogenezu [14], ponovnu pojavu raka dojke nakon rezistencije na kemoterapiju [15], lutealnu osjetljivost na PGF [16] i, konačno, dio je antiapoptotika (P13K/AKT) i stanične proliferacije (ERK /MAPK) putevi [17]. Njegov povezujući položaj dokazan je mrežnom analizom koja pokazuje njezino sudjelovanje u nekoliko HSN-ova (visokoregularne podmreže [18]). Ogihara i sur. [19] sugerirali su da povezanost s proteinom 14-3-3 može igrati ulogu u regulaciji osjetljivosti na inzulin prekidom povezanosti između receptora inzulina i IRS1. To znači da P63104 vjerojatno posreduje HD i HO kroz proces regulacije inzulina (budući da je inzulin ključni hormon u ljudskom metaboličkom sustavu). Obično nije izravno odgovoran za bolesti (nisu dodijeljene nijednoj bolesti u bazi podataka OMIM), ali se vrlo često spominje kao protein kandidat u pozadini, što zahtijeva daljnja istraživanja [14].

Najvažniji protein, P62993 (protein 2 vezan za receptor faktora rasta) koji odgovara genu GRB2 vodi u svih šest ranga strukturne važnosti. Pojavljuje se na signalnom putu sisavaca Grb2-Ras s interakcijama domene SH2/SH3 i nekoliko funkcija u embriogenezi i raku [20]. Zhang i sur. [21] također su otkrili da je GRB2 bitan za srčanu hipertrofiju i fibrozu kao odgovor na preopterećenje tlakom te da različiti signalni putevi nizvodno od GRB2 reguliraju fibrozu, indukciju fetalnih gena i rast kardiomiocita. Ipak, čini se da u podgrafu HO posrednika P62993 ne zauzima središnje mjesto, ali njegove fenotipske osobine vjerojatno će biti pogođene povezivanjem s ne-posrednicima umjesto s drugim HO posrednicima. Ovakav strukturni raspored povoljan je za integraciju informacija, dok snažno povezana posrednička podmreža podrazumijeva funkcionalnu suvišnost.

Među tri ekskluzivna HO (ne-HD) medijatora, O14908 (protein GIPC1 koji sadrži domenu PDZ) koji odgovara genu GIPC1 pojavljuje se u podgrafu HO medijatora, dok su druga dva izolirana (Q14232-faktor inicijacije prevođenja eIF-2B podjedinica alfa koji odgovara genu EIF2B1 Q5JY77-protein za sortiranje povezan s G-proteinom povezan s receptorom 1 koji odgovara genu GPRASP1). To također može ukazivati ​​na to da je O14908 HD posrednik. Njegova povezanost sa srčanim bolestima je jasna, ali njezina interakcija s proteinima povezanim s dijabetesom nije dokumentirana u OMIM bazama podataka (također ne i za druga dva proteina). Međutim, ovu zaključenu funkciju dobro podržavaju Klammt i sur. [22] izvještavanje o ulozi O14908 u šećernoj bolesti. Mogući ishod analize mreže je sugeriranje mogućih ažuriranja u bazama podataka.

Jedini protein koji ima viši rang od HD medijatorskih proteina u stupnju centralnosti HD mreže je P00533 (receptor epidermalnog faktora rasta), koji odgovara genu EGFR. Mogli bismo nagađati da bi ovaj protein također mogao posredovati između H i D proteina. U ukupnoj PPI mreži, on je povezan s dva proteina D (Q9UQF2 - protein u interakciji s JNK 1 Q9UQQ2 - protein transdukcije signala Lnk), ali ne i s proteinom H. EGFR i njegovi ligandi su stanične signalne molekule uključene u širok raspon staničnih funkcija, uključujući staničnu proliferaciju, diferencijaciju, pokretljivost i razvoj tkiva [23]. Istraživanja o patogenezi EGFR -a bila su usmjerena na rak pluća [24] i nisu otkrila njegovu povezanost sa srčanim bolestima. Međutim, Iwamoto i njegovi kolege uočili su ulogu signalizacije ErbB u srčanim funkcijama [25]. Također se pokazalo da je središnji protein prema drugim sofisticiranim tehnikama analize mreže [26], koji dominira sastavom klika na određenim putovima.

Na temelju našeg statičkog, strukturnog zaključivanja nije lako odlučiti je li protein „snažno povezan s bolešću“ ili je to „protein bolesti“. Definicije su ovdje vrlo loše. Je li P00533 H protein (uzrokuje srčane bolesti) ili HD protein (posreduje između H i D proteina)? Rješenje je koristiti zaključke za stvaranje novih hipoteza, poboljšanje baza podataka i projektiranje eksperimenata, umjesto da se zaključeni nalazi smatraju rezultatima.


Povezani posao

Do sada su predloženi različiti računski načini za složeno predviđanje. Ovdje predstavljamo kratak pregled srodnih djela grubom klasifikacijom postojećih metoda u sljedeće tipove: metode temeljene na lokalnim gustim podgrafima, metode temeljene na modelu jezgrene vezanosti, metode temeljene na dinamičkim PPI mrežama, metode na temelju nadziranog učenja . Među njima, metode temeljene na lokalnim gustim podgrafima čine najveći dio postojećih djela. Imajte na umu da ova hijerarhija metoda samo odražava naš pogled na postojeća djela. U literaturi mogu postojati druge hijerarhije postojećih djela. I kratki pregled, ne možemo pokriti sve postojeće radove, ali se trudimo prezentirati glavne postojeće radove.

Metode temeljene na lokalnim gustim podgrafima

Kao jedna od najranijih računalnih metoda složenog predviđanja, MCODE [4] najprije ponderira svaki protein na temelju njegove gustoće grupiranja jezgre u PPI mreži, zatim protein (recimo str) s najvećom težinom odabran je kao sjemenski čvor primarnog kompleksa, koji se proširuje uključivanjem drugih proteina čija težina rekurzivno prelazi unaprijed postavljeni prag, sve dok ne bude više čvorova za dodavanje. Ako postoje neobrađeni čvorovi, novi će se kompleksi generirati na gornji način. Konačno, susjedi svakog gore generiranog kompleksa uključeni su u komplekse ako je njihova težina veća od unaprijed postavljenog parametra "fluff". MCL [5] predviđa komplekse zasnovane na slučajnom hodu u PPI mreži, to je brza i visoko skalabilna metoda grupiranja. Za simulaciju slučajnog hodanja koriste se dva operatora, ekspanzija i inflacija za iteracijsku manipulaciju matrice susjednosti. Cilj ova dva operatora je odvojiti guste podgrafe od mreže. Proteinski kompleksi predviđeni ovom metodom ne preklapaju se. ClusterONE [6] koristi novu mjeru za izračunavanje kohezivnosti jednog podgrafa i radi zasijavanjem i proširivanjem sa susjednim čvorovima. Ova metoda ima bolje rezultate od ostalih metoda kada je razvijena.

Budući da u PPI mrežama postoji veliki broj lažno pozitivnih i lažno negativnih rezultata. Neke metode ponderiraju rubove PPI mreže pomoću topologije PPI mreže, podataka o ekspresiji gena i funkcije proteina za poboljšanje pouzdanosti PPI mreža. DPClus [20] mjeri svaki rub prema broju zajedničkih susjeda para čvorova, a zatim se težina svakog čvora izračunava zbrajanjem težina svih njegovih rubova. Cao i sur. [21] tretirali su složeno predviđanje kao problem optimizacije i izgradili ciljnu funkciju uzimajući u obzir različite karakteristike topologije, a zatim je genetski algoritam upotrijebljen za otkrivanje kompleksa iz PPI mreža.

Općenito, proteini koji tvore funkcionalne skupine imaju sličnu ekspresiju gena, pa neke metode ponderiraju rubove PPI mreža koristeći podatke o ekspresiji. MATISEE [10] mjeri intenzitet interakcije para proteina koristeći korelaciju podataka o ekspresiji. Ou-Yang i sur. [11] otkriveni proteinski kompleksi iz potpisanih PPI mreža, znak svakog ruba izračunava se pomoću pearson koeficijenta korelacije ekspresije gena dvaju proteina.

Osim podataka o ekspresiji, funkcija proteina pruža važan trag za otkrivanje kompleksa proteina. SWEMODE [12] koji je predložio Lubovac odmjerava svaki rub na temelju semantičke sličnosti funkcije (a) dvaju proteina, težina svakog čvora dana je ponderiranim koeficijentima grupiranja najbližih susjeda. Cho i sur. [13] ponderirao je svaki rub prema funkcionalnoj sličnosti dva čvora, a težina svakog čvora je zbroj težina njegovih rubova. Algoritam simulacije protoka tada se koristi za razdvajanje protoka iz čvorova s ​​većim težinama. Kako svaki tok ide uz rubove i njegov utjecaj opada prema sličnosti svakog para čvorova koji prolazi, prestaje kad je njegov utjecaj manji od određenog praga. Tako je PPI mreža podijeljena na više podgrafa koji se sastoje od proteina povezanih protokom iz istog izvornog proteina.

U našim prethodnim radovima CPredictor [19] i CPredictor2.0 [16, 17] također smo koristili funkcionalne informacije o proteinima. No, za razliku od postojećih metoda, prvo smo upotrijebili funkcionalne informacije o proteinima za klasteriziranje proteina, a zatim preslikali klastere u PPI mreže. Razlika između CPredictor i CPredictor2.0 leži u upotrebi funkcionalnih informacija. U ovom radu slijedimo istu ideju CPredictor i CPredictor2.0, ali koristimo i podatke o izrazima. Odnosno, razmatramo dinamičko svojstvo PPI mreža.

Metode temeljene na modelu Core-Attachment

Gavin i sur. [1] proučavao je strukturu proteinskih kompleksa kvasca i otkrio da se svaki proteinski kompleks sastoji od dva dijela: jezgra je sastavljena od bjelančevina čvrsto povezanih i vezanosti koje imaju relativno rijetke interakcije s jezgrom.

Slijedeći strukturu pričvršćivanja jezgre, predložene su dvije metode CORE [14] i COACH [15]. CORE procjenjuje vjerojatnost da dva proteina pripadaju istoj jezgri koristeći svoje zajedničke susjede. Zatim se veće jezgre proizvode uzastopnim spajanjem jezgri veličine dva, tri i tako dalje. Konačno, protein se može dodati u jednu jezgru kao veza, ako ima interakcije s više od polovice proteina u jezgri. COACH prvo identificira male guste podgrafe oko proteina velike težine, a zatim generira jezgre spajajući te guste podgrafe. Koristi isti način dodavanja privitaka kao i CORE. Kasnije su Peng i sur. [22] je predložio WPNCA metodu koja dijeli ponderiranu PPI mrežu na više usko povezanih podgrafa pomoću PageRank-Nibble algoritma, a zatim se proteinski kompleksi generiraju u svakom podgrafu na temelju strukture Core-Attachment.

Metode temeljene na dinamičkim PPI mrežama

Ranije metode otkrivaju komplekse iz statičkih PPI mreža. Zapravo, interakcije među proteinima su dinamične i mijenjaju se tijekom vremena u različitim biološkim fazama. U posljednjih godinu dana postoji nekoliko radova na otkrivanju proteinskih kompleksa iz dinamičkih PPI mreža. Tang i sur. [18] primijenili su fiksni prag na klaster proteine ​​koristeći podatke o ekspresiji tako da se svaki klaster sastoji od proteina aktivnih u istoj vremenskoj točki. Budući da su razine ekspresije različitih proteina prilično različite, nerazumno je koristiti fiksni prag za sve proteine. Kasnije su Wang i sur. [23] predložio je model s tri sigme za izračun aktivnog praga za proteine ​​i postigao bolje performanse složenog predviđanja. Zhang i sur. [24] su prvo identificirali prolazne i stabilne proteinske interakcije za izgradnju dinamičkih PPI mreža temeljenih na modelu s tri sigme, zatim su predvidjeli proteinske komplekse iz dinamičkih PPI mreža. Lei i sur. [25] konstruirao je dinamičke PPI mreže koristeći istu metodu kao u [24], a zatim optimizirao parametre Markovskoga grupiranja algoritmom krijesnice za otkrivanje proteinskih kompleksa.

Metode temeljene na nadziranom učenju

Neki radovi koriste nadzirano učenje za otkrivanje proteinskih kompleksa. Qi i sur. [26] klasificirao je topološka svojstva proteinskih kompleksa u četiri kategorije, te je ta svojstva upotrijebio kao značajke za vježbanje Bayesove mreže vjerojatnosti, koja je korištena za nasumično predviđanje kompleksa iz podgrafa generiranih iz PPI mreža. Yong i sur. [27] su koristili prave komplekse kao podatke za obuku i razne informacije, kao što su interakcije, funkcije, tekst i topologija kao značajke, za uvježbavanje Bayesovog modela za predviđanje vjerojatnosti proteinskih interakcija uključenih u male komplekse, velike komplekse i nekomplekse, a zatim su ekstrahirani mali kompleksi veličine 2,3.


Sažetak

Mreža proteina-proteina za interakciju proteina (PPI) Methanobrevibacter ruminantium M1 (MRU), prevladavajući metanogen buraga, konstruiran je od njegovih metaboličkih gena pomoću algoritma genskog susjedstva, a zatim je uspoređen s blisko povezanim metanogenima buraga Koristeći PPI pristup na proteom, izgradili smo mrežu koja obuhvaća 2194 rubova i 637 čvorova u interakciji s 634 gena. Kvaliteta mreže i robusnost funkcionalnih modula ocijenjeni su terminima ontologije gena. Mapiranje metabolizma strukture-funkcije za svaki protein provedeno je s pokušajima da se iz literature izvuku eksperimentalne informacije o PPI-u. Rezultati našeg istraživanja otkrili su da su neka topološka svojstva njegove mreže robusna za dijeljenje homolognih proteinskih interakcija između heterotrofnih i hidrogenotrofnih metanogena. MRU proteom je pokazao da uspostavlja mnoge PPI podmreže za povezane metaboličke podsustave potrebne za opstanak u okolini buraga. Za genom MRU je otkriveno da dijeli međusobno povezane proteine ​​iz svoje PPI mreže uključene u specifične metaboličke podsustave za razliku od heterotrofnih i hidrogenotrofnih metanogena. Preko ovih proteoma, proteini u interakciji iz različitih PPI mreža bili su zajednički za biosintezu aminokiselina, nukleozida i nukleotida i energetski metabolizam u kojem je više frakcija proteinskih parova podijeljeno s Metanosarcina acetivorans. Naša komparativna studija ubrzava naše znanje za razumijevanje složene proteomske mreže povezane s tipičnim metaboličkim podsustavima MRU-a i za poboljšanje njegove rekonstrukcije na razini genoma u budućnosti.


Gledaj video: - Demonstracija izrade semantičke mreže - zadaci (Kolovoz 2022).