版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、后基因組時(shí)代生命科學(xué)中最重大的研究課題之一是蛋白質(zhì)組研究,對(duì)蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)研究在整個(gè)蛋白質(zhì)組計(jì)劃中占有著極其重要的地位。蛋白質(zhì)預(yù)測(cè)結(jié)構(gòu)研究內(nèi)容包括:序列預(yù)處理、二級(jí)結(jié)構(gòu)預(yù)測(cè)、超二級(jí)結(jié)構(gòu)預(yù)測(cè)、關(guān)聯(lián)圖預(yù)測(cè)、三級(jí)結(jié)構(gòu)預(yù)測(cè)等。本文對(duì)其中的序列預(yù)處理、二級(jí)結(jié)構(gòu)預(yù)測(cè)及關(guān)聯(lián)圖預(yù)測(cè)進(jìn)行了深入研究。
蛋白質(zhì)序列由DNA序列翻譯而來,DNA序列的質(zhì)量高低決定了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確性。現(xiàn)有的DNA序列預(yù)處理工具對(duì)垃圾堿基信息的過濾和清除效率
2、不高,且隨著DNA序列長度的增加出錯(cuò)概率會(huì)顯著升高。因此,本文對(duì)DNA序列的預(yù)處理進(jìn)行了研究。
BP神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)中,但是BP算法有其明顯的缺陷,如訓(xùn)練速度慢、容易陷入局部極值等,這對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)精度有重要影響,因此有必要對(duì)應(yīng)用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)算法進(jìn)行改進(jìn);目前二級(jí)結(jié)構(gòu)預(yù)測(cè)研究在特征表達(dá)上有缺陷,僅僅考慮氨基酸基本組成成份,特征信息表達(dá)不完整,忽略氨基酸疏水性特征以及氨基酸之問的長程作
3、用,因此,研究基于更完善特征表達(dá)的蛋白質(zhì)二級(jí)結(jié)構(gòu)分類方法是有必要的。
蛋白質(zhì)的三維空間結(jié)構(gòu)與其功能緊密相關(guān),目前,從蛋白質(zhì)二級(jí)結(jié)構(gòu)直接預(yù)測(cè)三維空間結(jié)構(gòu)非常困難,蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)是蛋白質(zhì)三級(jí)結(jié)構(gòu)和二級(jí)結(jié)構(gòu)之間的重要橋梁,因此蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)有著重要的研究意義。
論文取得的主要成果與創(chuàng)新工作概括如下:
①提出一種新的融合智能檢測(cè)的DNA序列預(yù)處理方法,它不需要預(yù)先給出載體序列、剪接位點(diǎn)和克隆適配片段
4、等信息,通過統(tǒng)計(jì)分析、隨機(jī)搜索和圖操作等方法自動(dòng)發(fā)現(xiàn)并定位垃圾信息。此新方法可以作為組件工具供DNA序列數(shù)據(jù)處理管道系統(tǒng)調(diào)用。
②提出一種用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的改進(jìn)型動(dòng)態(tài)隧道神經(jīng)網(wǎng)絡(luò)算法。神經(jīng)網(wǎng)絡(luò)具有容易陷入局部極小的缺點(diǎn),動(dòng)態(tài)隧道神經(jīng)網(wǎng)絡(luò)通過“鉆隧道”方式,讓目標(biāo)函數(shù)跳出局部最小,找到更小的可行域,從而避免神經(jīng)網(wǎng)絡(luò)陷入局部極小。傳統(tǒng)的動(dòng)態(tài)隧道技術(shù)隧道方向單一并且隨意,因此具有不穩(wěn)定性。為了有效提高動(dòng)態(tài)隧道的搜索效率,提
5、出了一種改進(jìn)型動(dòng)態(tài)隧道神經(jīng)網(wǎng)絡(luò)算法。該算法增加搜索的隧道數(shù),引入夾角彈性系數(shù)控制隧道方向,考察隧道之間的相互影響。在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)實(shí)驗(yàn)中,改進(jìn)型動(dòng)態(tài)隧道神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)的效果優(yōu)于神經(jīng)網(wǎng)絡(luò)算法和傳統(tǒng)的動(dòng)態(tài)隧道神經(jīng)網(wǎng)絡(luò)算法。
③針對(duì)氨基酸疏水性特征以及氨基酸之間的長程作用在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)中的影響進(jìn)行了比較試驗(yàn)分析。目前采用機(jī)器學(xué)習(xí)進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法,忽略氨基酸疏水性特征以及氨基酸之間的長程作用,因此準(zhǔn)確率不高
6、。用氨基酸對(duì)應(yīng)的疏水能值替換蛋白質(zhì)中相應(yīng)的氨基酸,可以得到一個(gè)疏水能值的序列。實(shí)驗(yàn)中發(fā)現(xiàn),用長的疏水能值序列,訓(xùn)練BP網(wǎng)絡(luò),對(duì)長程作用起主導(dǎo)的E結(jié)構(gòu)(β-折疊)的預(yù)測(cè)效果好。
④基于比較完善的蛋白質(zhì)特征表達(dá)提出Co-training算法。比較試驗(yàn)分析表明,氨基酸的長程作用在二級(jí)結(jié)構(gòu)預(yù)測(cè)中對(duì)E結(jié)構(gòu)(β-折疊)有重要的作用。因此,提出基于Profile編碼特征和疏水能值特征兩個(gè)獨(dú)立冗余視圖的Co-training算法。該算法的
7、主要步驟為:在Profile特征空間訓(xùn)練SVM分類器,在疏水性特征空間訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)分類器,協(xié)同對(duì)氨基酸二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè);對(duì)SVM分類器和BP分類器有分歧的樣本,基于主動(dòng)選擇思想,給予兩個(gè)分類器不同的優(yōu)先級(jí)進(jìn)行仲裁。實(shí)驗(yàn)表明,Co-training方法有較高的準(zhǔn)確性,對(duì)長程作用起主導(dǎo)的E結(jié)構(gòu)(β-折疊),短程作用起主導(dǎo)的H結(jié)構(gòu)(α-螺旋)預(yù)測(cè)準(zhǔn)確率都有提高。
⑤首次將馬爾科夫邏輯網(wǎng)應(yīng)用到蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)研究中。Marko
8、v邏輯網(wǎng)是將Markov網(wǎng)與一階邏輯相結(jié)合的一種全新的統(tǒng)計(jì)關(guān)系學(xué)習(xí)模型,該方法可以計(jì)算出世界的概率分布,進(jìn)而為推理服務(wù)。本文利用該方法的這一優(yōu)點(diǎn),將蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)問題形式化。具體采用了判別式訓(xùn)練的學(xué)習(xí)算法和MC-SAT推理算法,并詳細(xì)闡述了如何用少量的謂詞公式來描述蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)中不同方面的本質(zhì)特征,將Markov邏輯表示的各方面組合起來形成各種模型。實(shí)驗(yàn)結(jié)果表明基于Markov邏輯網(wǎng)的蛋白質(zhì)關(guān)聯(lián)圖預(yù)測(cè)方法可以取得比基于神經(jīng)網(wǎng)絡(luò)的方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于智能計(jì)算的蛋白質(zhì)功能預(yù)測(cè)研究.pdf
- 基于計(jì)算智能的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 25175.基于計(jì)算智能技術(shù)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
- 基于智能計(jì)算的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 16013.智能計(jì)算在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中應(yīng)用研究
- 蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè).pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 基于多信息融合的蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型的研究.pdf
- 基于智能計(jì)算的蛋白質(zhì)相互作用預(yù)測(cè)方法研究.pdf
- 基于智能計(jì)算模型的蛋白質(zhì)功能位點(diǎn)的預(yù)測(cè).pdf
- 基于多特征融合的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測(cè)研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的噪聲算法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法學(xué)研究.pdf
- 無序蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的混合智能優(yōu)化算法及并行化.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)新方法的研究.pdf
評(píng)論
0/150
提交評(píng)論