版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著人類基因組計(jì)劃的順利進(jìn)展,越來(lái)越多的蛋白質(zhì)序列被測(cè)定出來(lái);而通過(guò)實(shí)驗(yàn)確定其結(jié)構(gòu)與功能的蛋白質(zhì)序列則相對(duì)較少,且兩者之間的差距有迅速擴(kuò)大的趨勢(shì)。由于通過(guò)實(shí)驗(yàn)確定蛋白質(zhì)的結(jié)構(gòu)和功能費(fèi)時(shí)、費(fèi)力、費(fèi)財(cái),且實(shí)驗(yàn)中可能還會(huì)遇到一些目前無(wú)法解決的困難,因此探索利用理論及計(jì)算方法來(lái)研究蛋白質(zhì)結(jié)構(gòu)和功能具有重要意義。本文從蛋白質(zhì)的一級(jí)序列出發(fā),研究了蛋白質(zhì)的結(jié)構(gòu)、功能分類預(yù)測(cè),其主要貢獻(xiàn)如下: 1.提出一種新的組合分類思想,即將氨基酸組成成分
2、、自相關(guān)函數(shù)二種特征提取法與支持向量機(jī)恰當(dāng)組合,首次對(duì)蛋白質(zhì)同源二聚體和非同源二聚體進(jìn)行分類研究,并與國(guó)際上現(xiàn)有的Garian方法進(jìn)行了對(duì)比。在10CV檢驗(yàn)下,本文方法的分類總精度比Garian方法最大可提高17.1個(gè)百分點(diǎn)。 2.提出二種新的特征提取法,并引入以前已有的二種特征提取法,與支持向量機(jī)和不同的分類策略,進(jìn)行恰當(dāng)?shù)慕M合構(gòu)成分類系統(tǒng),首次對(duì)蛋白質(zhì)同源二聚體、同源三聚體、同源四聚體和同源六聚體進(jìn)行分類研究。結(jié)果表明整合了
3、氨基酸殘基序列順序信息的三種特征提取法,其分類能力均好于氨基酸組成成分特征提取法,尤以我們提出的加權(quán)自相關(guān)函數(shù)特征提取法的分類效果最好,其分類總精度可比氨基酸組成成分特征提取法最大可提高6.39個(gè)百分點(diǎn),比Chou的特征提取法提高2.41個(gè)百分點(diǎn);采用“一對(duì)一”策略的分類能力明顯優(yōu)于“一對(duì)多”策略,其分類總精度最大可提高17.69個(gè)百分點(diǎn)。 3.一種新的組合分類方法,即將自相關(guān)函數(shù)特征提取法和支持向量機(jī)、以及本文提出的“改進(jìn)的唯
4、一的一對(duì)多”分類策略恰當(dāng)組合,應(yīng)用于蛋白質(zhì)折疊子分類研究。結(jié)果顯示:對(duì)于獨(dú)立測(cè)試樣本,自相關(guān)函數(shù)特征提取法的分類總精度比氨基酸組成成分特征提取法,大約可提高7個(gè)百分點(diǎn);“改進(jìn)的唯一的一對(duì)多”分類策略優(yōu)于“一對(duì)多”策略,其獨(dú)立測(cè)試和5CV檢驗(yàn)的分類總精度,比“一對(duì)多”策略最大可分別提高約18和12個(gè)百分點(diǎn)。 4.引入加權(quán)思想,以一種新的特征提取法—加權(quán)自相關(guān)函數(shù),表示蛋白質(zhì)序列,并采用“一對(duì)多”、“一對(duì)一”分類策略對(duì)膜蛋白和亞細(xì)胞
5、定位進(jìn)行了分類和預(yù)測(cè)研究,結(jié)果有明顯改善: 1).對(duì)于膜蛋白分類,在采用支持向量機(jī)算法及“一對(duì)多”分類策略下,加權(quán)自相關(guān)函數(shù)特征提取法的分類總精度為87.98%,比氨基酸組成成分特征提取法提高3.38個(gè)百分點(diǎn);“一對(duì)一”策略的分類總精度可達(dá)到94.88%,比“一對(duì)多”策略提高6.9個(gè)百分點(diǎn)。 2).對(duì)于亞細(xì)胞定位預(yù)測(cè),原核蛋白和真核蛋白定位的預(yù)測(cè)總精度最高分別可達(dá)到92.38%和95.22%,真核蛋白定位的預(yù)測(cè)總精度遠(yuǎn)高
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 使用支持向量機(jī)方法的蛋白質(zhì)分類研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)網(wǎng)絡(luò)重要節(jié)點(diǎn)分類方法研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)功能預(yù)測(cè)研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)一級(jí)序列分類方法研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)相互作用研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測(cè)研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)相互作用預(yù)測(cè)的研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)功能預(yù)測(cè)新方法研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè).pdf
- 30625.基于支持向量機(jī)的線蟲蛋白質(zhì)相互作用判別
- 支持向量機(jī)在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中的應(yīng)用研究.pdf
- 基于支持向量機(jī)的蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)新算法及其在血管蛋白質(zhì)研究中的初步應(yīng)用.pdf
- 基于支持向量機(jī)的蛋白質(zhì)溫?zé)嵝宰R(shí)別與亞細(xì)胞定位預(yù)測(cè).pdf
- 3430.基于模糊支持向量機(jī)的蛋白質(zhì)二級(jí)結(jié)構(gòu)智能預(yù)測(cè)
- 36645.基于支持向量機(jī)的蛋白質(zhì)相互作用位點(diǎn)的預(yù)測(cè)
- 26832.基于支持向量機(jī)的原核生物蛋白質(zhì)耐熱性判別
- 蛋白質(zhì)的分類
- 基于支持向量機(jī)的分類算法研究.pdf
- 基于邊界向量樣本的支持向量分類機(jī).pdf
- 基于支持向量機(jī)的多分類算法研究.pdf
評(píng)論
0/150
提交評(píng)論