基于計(jì)算智能的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè).pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)是由氨基酸序列預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)的過程。蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的基本假設(shè)是蛋白質(zhì)三級(jí)結(jié)構(gòu)由其氨基酸序列唯一決定。研究蛋白質(zhì)的結(jié)構(gòu)意義重大,不但有助于了解蛋白質(zhì)的作用,了解蛋白質(zhì)如何行使其生物功能,認(rèn)識(shí)蛋白質(zhì)與蛋白質(zhì)之間的相互作用,而且對(duì)生物學(xué)、醫(yī)學(xué)和藥學(xué)都有非常重要的作用。歷時(shí)十年的人類基因組計(jì)劃產(chǎn)生了海量的生物序列數(shù)據(jù),蛋白質(zhì)序列數(shù)據(jù)與結(jié)構(gòu)數(shù)據(jù)數(shù)量之間的差距越來越大,所以蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)變得日益緊迫和重要。
   本文

2、所要研究的是如何構(gòu)建一個(gè)蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)模型,使之能夠更加準(zhǔn)確有效的預(yù)測(cè)氨基酸對(duì)應(yīng)的蛋白質(zhì)三級(jí)結(jié)構(gòu)。內(nèi)容包括氨基酸序列的特征提取方式,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)及智能優(yōu)化算法的選擇。
   一、氨基酸序列特征提取。要對(duì)蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測(cè),首先必須把氨基酸序列中的信息提取出來,轉(zhuǎn)換成計(jì)算機(jī)可以處理的數(shù)據(jù),即進(jìn)行特征提取。選擇何種提取方式非常關(guān)鍵,不同的特征提取出的信息大不相同,現(xiàn)在的方法主要有氨基酸組成模型(AA)、二肽組成模型、多肽組成

3、模型、偽氨基酸組成(PseAA)、多特征融合、基于氨基酸物理化學(xué)性質(zhì)等,從不同角度對(duì)氨基酸特征進(jìn)行提取。本文采用了以上各種特征提取方式并進(jìn)行了特征融合。實(shí)驗(yàn)表明,不同的特征提取方式對(duì)于不同的數(shù)據(jù)集和分類模型效果不同。
   二、分類模型的建立。蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)實(shí)際上是根據(jù)提取出的有用信息,通過學(xué)習(xí)分析這些信息,總結(jié)出規(guī)律,實(shí)現(xiàn)對(duì)未知結(jié)構(gòu)氨基酸序列的結(jié)構(gòu)預(yù)測(cè)。對(duì)于蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)這種信息維數(shù)高,計(jì)算量大的問題,借助神經(jīng)網(wǎng)絡(luò)是非

4、常有效地。神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自組織、自學(xué)習(xí)、自適應(yīng)能力,能夠快速學(xué)習(xí)到序列中包含的特征,實(shí)現(xiàn)對(duì)結(jié)構(gòu)的預(yù)測(cè)。而對(duì)于網(wǎng)絡(luò),包括結(jié)構(gòu)的優(yōu)化和參數(shù)的優(yōu)化兩部分。選擇何種優(yōu)化算法是至關(guān)重要的,不同的算法會(huì)產(chǎn)生不同的時(shí)間效率,不同的算法對(duì)應(yīng)不同的預(yù)測(cè)正確率。本文中將對(duì)各種不同的優(yōu)化算法進(jìn)行比較,選擇出更適合的優(yōu)化算法。實(shí)驗(yàn)表明,參數(shù)優(yōu)化采用粒子群優(yōu)化算法(PSO)能取得較好的效果。BP神經(jīng)網(wǎng)絡(luò)在蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)中能大大提高預(yù)測(cè)準(zhǔn)確率。針對(duì)蛋白質(zhì)三

5、級(jí)結(jié)構(gòu)預(yù)測(cè)這種多分類問題,本文提出將多類問題轉(zhuǎn)換成多個(gè)二分類問題的集成。通過試驗(yàn)表明,單輸出方式比多輸出方式能有效的提高預(yù)測(cè)的正確率。為了尋找一種更優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu),本文首次將靈活神經(jīng)樹( FNT)應(yīng)用在蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)中,PSO對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,概率增強(qiáng)式程序進(jìn)化( PIPE)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化。實(shí)驗(yàn)表明,這種模型在預(yù)測(cè)25PDB這樣較大的蛋白質(zhì)數(shù)據(jù)集中,效果理想。它不但解決了以前預(yù)測(cè)時(shí)只能提前固定網(wǎng)絡(luò)結(jié)構(gòu)和采用試探法選擇隱層個(gè)數(shù)的問

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論