版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、如何從大量數(shù)據(jù)中挖掘出有意義的信息,如何把復(fù)雜的研究對象用精確而簡明的模型描述出來一直是數(shù)據(jù)處理工作中的中心課題。針對這個(gè)問題有兩種截然不同的方法:數(shù)據(jù)挖掘和復(fù)雜網(wǎng)絡(luò)理論。復(fù)雜網(wǎng)絡(luò)和數(shù)據(jù)挖掘方法不僅有著相似的研究目的,而且其分析對象在多數(shù)情況下也相同。但在實(shí)驗(yàn)數(shù)據(jù)分析中將兩者協(xié)同應(yīng)用解決同一問題的情況比較少,主要原因是兩者在分析對象上有較多重疊,在多數(shù)情況下僅用一種方式就可以解決問題。但實(shí)際上,將數(shù)據(jù)挖掘和復(fù)雜網(wǎng)絡(luò)很好的結(jié)合起來解決問題
2、會(huì)給數(shù)據(jù)分析提供新的思路。本研究將復(fù)雜網(wǎng)絡(luò)和數(shù)據(jù)挖掘相結(jié)合,同時(shí)用于分析癌癥相關(guān)基因/蛋白,結(jié)果表明復(fù)雜網(wǎng)絡(luò)和數(shù)據(jù)挖掘技術(shù)的協(xié)同應(yīng)用可以為生物學(xué)數(shù)據(jù)的分析提供新的切入點(diǎn)。
對癌癥的研究積累了大量而且類型豐富的數(shù)據(jù),利用這些數(shù)據(jù)發(fā)現(xiàn)癌細(xì)胞中關(guān)鍵的基因及其作用途徑一直是重要的研究方向。得益于豐富的數(shù)據(jù),癌癥領(lǐng)域的數(shù)據(jù)分析方法也層出不窮,其中結(jié)合蛋白質(zhì)相互作用網(wǎng)絡(luò)分析基因及蛋白功能的方法是一個(gè)重要的類別。在癌癥相關(guān)的信號(hào)傳導(dǎo),細(xì)胞定
3、位和表達(dá)調(diào)控等過程中蛋白質(zhì)相互作用扮演重要的角色,因此以蛋白質(zhì)相互作用為基礎(chǔ)整合其它組學(xué)數(shù)據(jù)的生物信息方法對分析參與這些過程的關(guān)鍵基因及蛋白至為重要。本研究不僅以人類蛋白質(zhì)相互作用網(wǎng)絡(luò)為基礎(chǔ),結(jié)合基因表達(dá)、基因重要性及基因突變數(shù)據(jù)優(yōu)選并分析了癌癥相關(guān)基因/蛋白和蛋白組合,還利用新的模型將生物網(wǎng)絡(luò)與組學(xué)數(shù)據(jù)有效的結(jié)合起來,為后續(xù)分析提供幫助。本文的工作主要包含以下兩個(gè)方面:
(1)結(jié)合蛋白質(zhì)相互作用網(wǎng)絡(luò)和蛋白質(zhì)、基因的表達(dá)數(shù)據(jù)預(yù)
4、測新的癌癥相關(guān)基因和蛋白質(zhì)組合。蛋白質(zhì)相互作用網(wǎng)絡(luò)是典型的復(fù)雜網(wǎng)絡(luò),網(wǎng)絡(luò)中每條邊表示一對蛋白質(zhì)的相互作用關(guān)系。表達(dá)數(shù)據(jù)包含基因或蛋白質(zhì)在癌癥組織、癌癥細(xì)胞系和正常組織的樣本中的表達(dá)量的信息,比較兩類樣本可以得到與癌癥關(guān)聯(lián)密切的基因或蛋白質(zhì)。本研究將蛋白質(zhì)相互作用網(wǎng)絡(luò)用于構(gòu)建稀疏的自動(dòng)編碼機(jī),而后用癌癥細(xì)胞系和正常組織的差異表達(dá)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),訓(xùn)練后的自動(dòng)編碼機(jī)同時(shí)包含相互作用信息和差異表達(dá)信息。將訓(xùn)練得到的自動(dòng)編碼機(jī)用于構(gòu)建一個(gè)深層模
5、型,來模擬每個(gè)蛋白質(zhì)/基因敲降對其它蛋白質(zhì)/基表達(dá)的影響,最后將這種影響關(guān)系表示為有向網(wǎng)絡(luò)的形式。蛋白間相互影響的有向網(wǎng)絡(luò)可以用于鑒定新的癌癥相關(guān)蛋白。在本研究優(yōu)選的TOP500個(gè)高可信度的癌癥相關(guān)蛋白中有211個(gè)為已知的癌癥藥物靶點(diǎn),其余蛋白質(zhì)的功能與癌癥也密切相關(guān)。與其它方法相比較該方法有較高的AUC值(>0.8)。蛋白間相互影響的網(wǎng)絡(luò)也可以用于預(yù)測蛋白組合。本文中提到的蛋白組合可以是合成致死組合,也可以是藥物靶標(biāo)的組合。這兩類蛋白
6、組合在蛋白相互影響網(wǎng)絡(luò)中都與特定的蛋白存在密切聯(lián)系。本研究利用已知的蛋白組合將這組蛋白質(zhì)識(shí)別出來,并用于識(shí)別新的蛋白組合。交叉驗(yàn)證表明該策略有較高的準(zhǔn)確度(>0.85),可以用于鑒別新的蛋白組合。進(jìn)一步將該模型用于前列腺癌的單細(xì)胞測序數(shù)據(jù)集,單細(xì)胞測序可以檢測病患體內(nèi)癌細(xì)胞群體的演化,對臨床治療有重要意義。文中利用前列腺癌的數(shù)據(jù)集訓(xùn)練模型且計(jì)算了相應(yīng)的蛋白影響網(wǎng)絡(luò),然后利用該網(wǎng)絡(luò)識(shí)別了前列腺癌蛋白,其中包含已知的前列腺癌基因。這表明該模
7、型適用于單細(xì)胞測序數(shù)據(jù)和小樣本數(shù)據(jù),具有良好的應(yīng)用前景。
(2)結(jié)合蛋白質(zhì)相互作用網(wǎng)絡(luò)和基因重要性數(shù)據(jù)尋找復(fù)雜的基因關(guān)聯(lián)關(guān)系。在本研究中蛋白質(zhì)相互作用網(wǎng)絡(luò)依然表示兩個(gè)蛋白質(zhì)間的相互作用關(guān)系。基因重要性數(shù)據(jù)是通過CRISPR(Clustered regularly interspaced short palindromic repeats)試驗(yàn)方法隨機(jī)突變細(xì)胞系基因組得到,簡單來講基因重要程度越高,可以承受的突變越少。通過比較初
8、始CRISPR隨機(jī)突變的細(xì)胞系和經(jīng)過一段時(shí)間的培養(yǎng)的細(xì)胞系間基因組的差異可以得到基因重要性數(shù)據(jù)。本研究將基因的重要性數(shù)據(jù)通過新方法轉(zhuǎn)換為蛋白質(zhì)相互作用的重要性。相互作用的重要性可以用于篩選重要的互作,計(jì)算相互作用間的相關(guān)性以及重新評估基因的重要性。本研究利用蛋白相互作用的相關(guān)性發(fā)現(xiàn)了以細(xì)胞因子信號(hào)通路相關(guān)的蛋白互作為核心的網(wǎng)絡(luò),為理解細(xì)胞因子對其它生物學(xué)途徑的調(diào)控提供了方向。另外用高重要性相互作用構(gòu)建的子網(wǎng)絡(luò)包含了關(guān)鍵蛋白質(zhì)行使功能時(shí)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于病毒宿主蛋白-蛋白相互作用網(wǎng)絡(luò)進(jìn)行病毒分類.pdf
- 微管相關(guān)蛋白2與朊蛋白相互作用的研究.pdf
- 水稻蛋白相互作用網(wǎng)絡(luò)預(yù)測及數(shù)據(jù)庫的構(gòu)建.pdf
- 基于集成神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)相互作用研究.pdf
- 華法林的測定新方法及其與血清白蛋白相互作用研究.pdf
- 基于深度學(xué)習(xí)的蛋白質(zhì)-RNA相互作用預(yù)測模型構(gòu)建.pdf
- POT1蛋白相互作用蛋白的規(guī)?;l(fā)掘及相互作用網(wǎng)絡(luò)的初探.pdf
- 一.鼠疫菌毒力相關(guān)蛋白與人蛋白相互作用的初步研究二.鼠疫菌ⅲ型分泌系統(tǒng)內(nèi)蛋白相互作用及l(fā)crg調(diào)控的研究
- Mre11蛋白相互作用蛋白的篩選及驗(yàn)證.pdf
- 幾類重要蛋白-蛋白相互作用的分子模擬.pdf
- 集成神經(jīng)網(wǎng)絡(luò)在預(yù)測蛋白質(zhì)相互作用位點(diǎn)中的應(yīng)用.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的蛋白質(zhì)功能預(yù)測.pdf
- HCBP6蛋白與HCVcore蛋白相互作用的研究.pdf
- TRAF6蛋白相互作用蛋白的篩選與鑒定.pdf
- EBI3蛋白與Sedlin蛋白相互作用的研究.pdf
- PINK1蛋白相互作用蛋白的篩選與鑒定.pdf
- 一種新的hTERT相互作用蛋白的篩選及鑒定.pdf
- CHD4蛋白與PTEN蛋白相互作用的鑒定.pdf
- 食管鱗癌相關(guān)蛋白相互作用網(wǎng)絡(luò)拓?fù)浞治鲷邔?shí)驗(yàn)研究.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的代謝pathway預(yù)測.pdf
評論
0/150
提交評論