版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著人類基因組計劃(HGP)的順利完成和現(xiàn)代生物科學(xué)和技術(shù)的迅猛發(fā)展,每天都有大量的蛋白質(zhì)序列數(shù)據(jù)不斷涌現(xiàn)。對這些數(shù)據(jù)進(jìn)行深入研究以達(dá)到對化學(xué)和生物意義的深入理解,是現(xiàn)代生物信息學(xué)的熱點。盡管蛋白質(zhì)的結(jié)構(gòu)和功能可以通過實驗方法確定,但是實驗方法十分耗時并且費用昂貴。因此,從蛋白質(zhì)序列出發(fā),發(fā)展自動的、可靠的理論預(yù)測方法具有十分重要的理論意義和實用價值。本文基于近年來不斷涌現(xiàn)的蛋白質(zhì)序列數(shù)據(jù),采用新興的機器學(xué)習(xí)方法——支持向量機,并結(jié)合小
2、波變換以及信息融合等技術(shù),對蛋白質(zhì)的結(jié)構(gòu)和功能預(yù)測進(jìn)行研究,其主要內(nèi)容如下: 1.建立了酶亞家族類預(yù)測新方法。將Chou等人提出的兩性偽氨基酸組成與支持向量機結(jié)合,采用一對多的分類策略,建立了酶亞家族類預(yù)測模型。對Chou等人建立的氧化還原蛋白酶的標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行了jackknife檢驗,總預(yù)測精度達(dá)到了80.87%,分別比Huang等人和Chou提出的方法提高了4%和10%。在此基礎(chǔ)上,基于氨基酸殘基的疏水值,提出了一種新穎的偽
3、氨基酸組成,用于表征蛋白質(zhì)序列。與兩性偽氨基酸組成比較,本文提出的偽氨基酸組成表征方法具有計算簡便、運算快速的優(yōu)點。 2.建立了凋亡蛋白亞細(xì)胞位點預(yù)測新方法。基于信息融合技術(shù),提出了雙層支持向量機方法,用于凋亡蛋白亞細(xì)胞位點定位研究。在第一層中,分別對多個蛋白質(zhì)的性質(zhì),即氨基酸組成、雙殘基組成和兩性偽氨基酸組成建立三個子分類器,然后將這三個子分類器的預(yù)測結(jié)果經(jīng)過合并,輸入到第二層支持向量機中,由其給出最終的預(yù)測結(jié)果。對Zhou和
4、Doctor建立的標(biāo)準(zhǔn)數(shù)據(jù)集ZD98,以及Zhang等人的數(shù)據(jù)集ZW225進(jìn)行了jackknife檢驗,總預(yù)測精度分別為94.90%和88.44%,優(yōu)于現(xiàn)有文獻(xiàn)報道值。結(jié)果表明:雙層支持向量機方法能夠較好地利用信息之間的互補,從而取得比基于單一蛋白質(zhì)性質(zhì)的分類器更高的預(yù)測精度。 3.提出了新的蛋白質(zhì)序列表征方法。將加權(quán)思想引入Kurgan等人的組成位置向量概念,提出了加權(quán)組成位置向量的蛋白質(zhì)序列表征方法。與傳統(tǒng)的氨基酸組成表征方法相比,
5、加權(quán)組成位置向量不但包含了蛋白質(zhì)序列中氨基酸殘基的組成信息,還含有氨基酸殘基的位置信息。我們將加權(quán)組成位置向量與支持向量機結(jié)合,采用直接的多類分類策略,對蛋白質(zhì)結(jié)構(gòu)類預(yù)測進(jìn)行了研究。通過對兩個非同源的蛋白質(zhì)結(jié)構(gòu)類標(biāo)準(zhǔn)數(shù)據(jù)集Z277 and Z498的jackknife檢驗,預(yù)測精度優(yōu)于文獻(xiàn)報道的多數(shù)方法。結(jié)果表明:在組成位置向量表征方法中引入加權(quán)因子十分必要,通過調(diào)節(jié)加權(quán)因子可以明顯地提高預(yù)測精度。 4.構(gòu)建了新的偽氨基酸組成表
6、征方法。首先用氨基酸殘基疏水值將蛋白質(zhì)序列映射為數(shù)值序列,然后進(jìn)行小波包分解,計算小波包功率譜,最后將小波包功率譜與氨基酸組成相結(jié)合,構(gòu)成偽氨基酸組成表征蛋白質(zhì)序列。將其與支持向量機結(jié)合,采用直接的多類分類策略,對蛋白質(zhì)結(jié)構(gòu)類預(yù)測進(jìn)行了研究。對Zhou建立的結(jié)構(gòu)類標(biāo)準(zhǔn)數(shù)據(jù)集Z277進(jìn)行了預(yù)測,jackknife檢驗總預(yù)測精度達(dá)到了84.8%。結(jié)果表明:基于小波包變換建立的偽氨基酸組成表征方法能夠有效地反映蛋白質(zhì)序列中氨基酸殘基之間的順序
7、信息,從而提高預(yù)測精度。 5.建立了蛋白質(zhì)亞核位點預(yù)測方法。通過對支持向量機中基本的核函數(shù)進(jìn)行線性組合,得到組合核函數(shù)。將其與蛋白質(zhì)的氨基酸組成性質(zhì)結(jié)合,提出了蛋白質(zhì)的亞核位點預(yù)測方法。對蛋白質(zhì)亞核位點數(shù)據(jù)集SN370進(jìn)行了預(yù)測,5-折交叉驗證和jackknife檢驗總預(yù)測精度分別為66.03%和67.93%。在此基礎(chǔ)上,與線性核、多項式核、徑向基核支持向量機方法進(jìn)行了比較。結(jié)果表明,對于蛋白質(zhì)亞核位點定位問題,基于組合核函數(shù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于支持向量機的蛋白質(zhì)功能預(yù)測研究.pdf
- 基于支持向量機的蛋白質(zhì)功能預(yù)測新方法研究.pdf
- 基于支持向量機的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測.pdf
- 支持向量機在蛋白質(zhì)結(jié)構(gòu)預(yù)測中的應(yīng)用研究.pdf
- 基于支持向量機的蛋白質(zhì)分類研究.pdf
- 基于支持向量機的蛋白質(zhì)相互作用預(yù)測的研究.pdf
- 3430.基于模糊支持向量機的蛋白質(zhì)二級結(jié)構(gòu)智能預(yù)測
- 基于支持向量機的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測新算法及其在血管蛋白質(zhì)研究中的初步應(yīng)用.pdf
- 基于支持向量機的蛋白質(zhì)相互作用研究.pdf
- 基于蛋白質(zhì)網(wǎng)絡(luò)與蛋白質(zhì)功能的關(guān)鍵蛋白質(zhì)預(yù)測研究.pdf
- 基于支持向量機的蛋白質(zhì)溫?zé)嵝宰R別與亞細(xì)胞定位預(yù)測.pdf
- 使用支持向量機方法的蛋白質(zhì)分類研究.pdf
- 36645.基于支持向量機的蛋白質(zhì)相互作用位點的預(yù)測
- 14232.用支持向量機和離散增量方法預(yù)測人類血液分泌蛋白質(zhì)
- 基于支持向量機的蛋白質(zhì)網(wǎng)絡(luò)重要節(jié)點分類方法研究.pdf
- 基于動態(tài)規(guī)劃和支持向量機的蛋白結(jié)構(gòu)域預(yù)測.pdf
- 基于支持向量機的蛋白質(zhì)一級序列分類方法研究.pdf
- 蛋白質(zhì)的結(jié)構(gòu)和功能
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)功能模塊預(yù)測.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的蛋白質(zhì)功能預(yù)測.pdf
評論
0/150
提交評論