版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、目的: 本論文的研究目的是提出和實施了以下兩個思路,提高預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確率和效率: 1.在應(yīng)用3-狀態(tài)隱馬爾可夫模型(HiddenMarkovModel,HMM)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的基礎(chǔ)上,提出和建立了7-狀態(tài)和15-狀態(tài)的優(yōu)化HMM;進(jìn)而提出通過序列譜的HMM(sequence-profile-basedHMM)將優(yōu)化的HMM與BP神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork,BPNN)相
2、結(jié)合的預(yù)測方法,提高蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的準(zhǔn)確率。 2.綜合蛋白質(zhì)二級結(jié)構(gòu)信息和蛋白質(zhì)同源序列信息,進(jìn)行蛋白質(zhì)折疊預(yù)測中的二硫鍵預(yù)測,減少蛋白質(zhì)三維結(jié)構(gòu)預(yù)測中的蛋白質(zhì)構(gòu)象的搜索空間,提高預(yù)測的效率。 方法: 應(yīng)用優(yōu)化HMM的預(yù)測對象是從Cuff和Barton所建立的CB513數(shù)據(jù)集合中篩選出的492條已知蛋白質(zhì)二級結(jié)構(gòu)的蛋白質(zhì)序列,共82272個氨基酸殘基。將其隨機分為7組,每組平均的α螺旋(H),β折疊(E
3、),無規(guī)卷曲(C)分布分別為35%,23%和42%。分別應(yīng)用7-狀態(tài)和15-狀態(tài)HMM以及BPNN-HMM混合模型,對以上的蛋白質(zhì)序列進(jìn)行二級結(jié)構(gòu)預(yù)測,對預(yù)測的準(zhǔn)確率進(jìn)行7-交叉驗證,并將各類方法的預(yù)測結(jié)果進(jìn)行分析和比較。 二硫鍵預(yù)測研究的對象是從SWISS-PROT數(shù)據(jù)庫中篩選的252條蛋白質(zhì)序列,選取的每條蛋白質(zhì)序列鏈內(nèi)含有的二硫鍵個數(shù)至少為2個,至多為5個。首先對數(shù)據(jù)集中形成二硫鍵的半胱氨酸以及周圍的局部氨基酸殘基,在蛋
4、白質(zhì)二級結(jié)構(gòu)形成的使用偏性進(jìn)行統(tǒng)計分析,進(jìn)而綜合蛋白質(zhì)二級結(jié)構(gòu)信息和蛋白質(zhì)序列的位置特異性得分矩陣(Position-SpecificScoringMatrix,PSSM),共同作為預(yù)測模型的輸入編碼進(jìn)行二硫鍵配對連接的預(yù)測,然后對預(yù)測準(zhǔn)確率進(jìn)行4-交叉驗證,并將預(yù)測結(jié)果進(jìn)行分析和比較。 結(jié)果: 應(yīng)用7-狀態(tài)HMM,在492條蛋白質(zhì)序列上的7-交叉驗證結(jié)果中,預(yù)測的整體準(zhǔn)確率Q3比應(yīng)用3-狀態(tài)HMM提高了3.11%,
5、三態(tài)片斷重疊準(zhǔn)確率SOV提高了6.15%,三態(tài)各自準(zhǔn)確率中的QE提高明顯,為6.49%;應(yīng)用15-狀態(tài)HMM,整體準(zhǔn)確率Q3比應(yīng)用7-狀態(tài)HMM提高了0.18%,SOV準(zhǔn)確率提高了1.8%,三態(tài)各自準(zhǔn)確率中的QE提高了5.74%;在15-狀態(tài)HMM基礎(chǔ)上加入序列的同源信息后,Q3準(zhǔn)確率比單序列15-狀態(tài)HMM提高了8.36%,SOV準(zhǔn)確率提高了8.2%,三態(tài)各自準(zhǔn)確率QH,QE,Qc分別提高了10.8%,15.8%,3.9%。
6、 應(yīng)用15-狀態(tài)HMM與BPNN相結(jié)合的混合模型,預(yù)測的整體準(zhǔn)確率Q3比典型的兩個BPNN的串聯(lián)模型提高了1.11%,SOV準(zhǔn)確率提高了1.69%,三態(tài)各自準(zhǔn)確率QH,QE,QC分別提高了1.3%,1.02%,4.6%。 二硫鍵配對連接的預(yù)測中,在相同BPNN結(jié)構(gòu)下(窗口寬度=15,隱含層個數(shù)=50),252條蛋白質(zhì)序列上的4-交叉驗證結(jié)果中,加入蛋白質(zhì)二級結(jié)構(gòu)信息后的預(yù)測敏感性Sn比未加入蛋白質(zhì)二級結(jié)構(gòu)信息前提高了3.06%
7、,特異性Sp提高了0.69%,相關(guān)系數(shù)Mcc提高0.041,總體二硫鍵配對預(yù)測準(zhǔn)確率Qc提高了1.1%,總體蛋白質(zhì)預(yù)測準(zhǔn)確率Qp提高了2.78%。 結(jié)論: 1.7-狀態(tài)HMM預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的性能優(yōu)于3-狀態(tài)HMM,15-狀態(tài)HMM總體預(yù)測性能和7-狀態(tài)HMM相當(dāng),但對β折疊預(yù)測能力好;在15-狀態(tài)HMM基礎(chǔ)上加入序列同源信息后,預(yù)測性能更好。 2.應(yīng)用BPNN和HMM的混合模型預(yù)測蛋白質(zhì)二級結(jié)構(gòu),比典型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測模型的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測模型優(yōu)化方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測
- 蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測方法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)域預(yù)測中的決策模型研究.pdf
- 基于非格點模型的蛋白質(zhì)結(jié)構(gòu)預(yù)測研究.pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測的噪聲算法研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測方法學(xué)研究.pdf
- 無序蛋白質(zhì)結(jié)構(gòu)預(yù)測方法研究.pdf
- 肉用綿羊代謝蛋白質(zhì)預(yù)測模型的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測新方法的研究.pdf
- 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測.pdf
- 蛋白質(zhì)設(shè)計及蛋白質(zhì)網(wǎng)絡(luò)模型的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)預(yù)測和比較的優(yōu)化研究.pdf
- 遺傳退火法預(yù)測蛋白質(zhì)結(jié)構(gòu).pdf
- 7965.基于序列的蛋白質(zhì)結(jié)構(gòu)預(yù)測的機器學(xué)習(xí)模型
- 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法研究.pdf
- 從頭預(yù)測蛋白質(zhì)結(jié)構(gòu)元啟發(fā)方法研究.pdf
評論
0/150
提交評論