2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩101頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、目的: 本論文的研究目的是提出和實施了以下兩個思路,提高預(yù)測蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確率和效率: 1.在應(yīng)用3-狀態(tài)隱馬爾可夫模型(HiddenMarkovModel,HMM)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的基礎(chǔ)上,提出和建立了7-狀態(tài)和15-狀態(tài)的優(yōu)化HMM;進(jìn)而提出通過序列譜的HMM(sequence-profile-basedHMM)將優(yōu)化的HMM與BP神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork,BPNN)相

2、結(jié)合的預(yù)測方法,提高蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的準(zhǔn)確率。 2.綜合蛋白質(zhì)二級結(jié)構(gòu)信息和蛋白質(zhì)同源序列信息,進(jìn)行蛋白質(zhì)折疊預(yù)測中的二硫鍵預(yù)測,減少蛋白質(zhì)三維結(jié)構(gòu)預(yù)測中的蛋白質(zhì)構(gòu)象的搜索空間,提高預(yù)測的效率。 方法: 應(yīng)用優(yōu)化HMM的預(yù)測對象是從Cuff和Barton所建立的CB513數(shù)據(jù)集合中篩選出的492條已知蛋白質(zhì)二級結(jié)構(gòu)的蛋白質(zhì)序列,共82272個氨基酸殘基。將其隨機分為7組,每組平均的α螺旋(H),β折疊(E

3、),無規(guī)卷曲(C)分布分別為35%,23%和42%。分別應(yīng)用7-狀態(tài)和15-狀態(tài)HMM以及BPNN-HMM混合模型,對以上的蛋白質(zhì)序列進(jìn)行二級結(jié)構(gòu)預(yù)測,對預(yù)測的準(zhǔn)確率進(jìn)行7-交叉驗證,并將各類方法的預(yù)測結(jié)果進(jìn)行分析和比較。 二硫鍵預(yù)測研究的對象是從SWISS-PROT數(shù)據(jù)庫中篩選的252條蛋白質(zhì)序列,選取的每條蛋白質(zhì)序列鏈內(nèi)含有的二硫鍵個數(shù)至少為2個,至多為5個。首先對數(shù)據(jù)集中形成二硫鍵的半胱氨酸以及周圍的局部氨基酸殘基,在蛋

4、白質(zhì)二級結(jié)構(gòu)形成的使用偏性進(jìn)行統(tǒng)計分析,進(jìn)而綜合蛋白質(zhì)二級結(jié)構(gòu)信息和蛋白質(zhì)序列的位置特異性得分矩陣(Position-SpecificScoringMatrix,PSSM),共同作為預(yù)測模型的輸入編碼進(jìn)行二硫鍵配對連接的預(yù)測,然后對預(yù)測準(zhǔn)確率進(jìn)行4-交叉驗證,并將預(yù)測結(jié)果進(jìn)行分析和比較。 結(jié)果: 應(yīng)用7-狀態(tài)HMM,在492條蛋白質(zhì)序列上的7-交叉驗證結(jié)果中,預(yù)測的整體準(zhǔn)確率Q3比應(yīng)用3-狀態(tài)HMM提高了3.11%,

5、三態(tài)片斷重疊準(zhǔn)確率SOV提高了6.15%,三態(tài)各自準(zhǔn)確率中的QE提高明顯,為6.49%;應(yīng)用15-狀態(tài)HMM,整體準(zhǔn)確率Q3比應(yīng)用7-狀態(tài)HMM提高了0.18%,SOV準(zhǔn)確率提高了1.8%,三態(tài)各自準(zhǔn)確率中的QE提高了5.74%;在15-狀態(tài)HMM基礎(chǔ)上加入序列的同源信息后,Q3準(zhǔn)確率比單序列15-狀態(tài)HMM提高了8.36%,SOV準(zhǔn)確率提高了8.2%,三態(tài)各自準(zhǔn)確率QH,QE,Qc分別提高了10.8%,15.8%,3.9%。

6、 應(yīng)用15-狀態(tài)HMM與BPNN相結(jié)合的混合模型,預(yù)測的整體準(zhǔn)確率Q3比典型的兩個BPNN的串聯(lián)模型提高了1.11%,SOV準(zhǔn)確率提高了1.69%,三態(tài)各自準(zhǔn)確率QH,QE,QC分別提高了1.3%,1.02%,4.6%。 二硫鍵配對連接的預(yù)測中,在相同BPNN結(jié)構(gòu)下(窗口寬度=15,隱含層個數(shù)=50),252條蛋白質(zhì)序列上的4-交叉驗證結(jié)果中,加入蛋白質(zhì)二級結(jié)構(gòu)信息后的預(yù)測敏感性Sn比未加入蛋白質(zhì)二級結(jié)構(gòu)信息前提高了3.06%

7、,特異性Sp提高了0.69%,相關(guān)系數(shù)Mcc提高0.041,總體二硫鍵配對預(yù)測準(zhǔn)確率Qc提高了1.1%,總體蛋白質(zhì)預(yù)測準(zhǔn)確率Qp提高了2.78%。 結(jié)論: 1.7-狀態(tài)HMM預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的性能優(yōu)于3-狀態(tài)HMM,15-狀態(tài)HMM總體預(yù)測性能和7-狀態(tài)HMM相當(dāng),但對β折疊預(yù)測能力好;在15-狀態(tài)HMM基礎(chǔ)上加入序列同源信息后,預(yù)測性能更好。 2.應(yīng)用BPNN和HMM的混合模型預(yù)測蛋白質(zhì)二級結(jié)構(gòu),比典型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論