版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、近年來,高通量技術的應用帶來了蛋白質數(shù)據(jù)成指數(shù)的增長。在這些海量多樣的蛋白質數(shù)據(jù)中,蘊藏著大量有創(chuàng)新性的生物新規(guī)律和新概念。隨著人類基因組計劃(HGP)的順利完成,研究這些成指數(shù)增長且高噪聲的海量蛋白質數(shù)據(jù)需要高速、準確、可拓展的理論及其算法。因此,推動了一門新興學科一生物信息學的誕生和發(fā)展,蛋白質結構和功能的研究是生物信息學領域的前沿課題,也是后基因組時代的核心問題之一。本文基于蛋白質結構和功能的預測研究現(xiàn)狀,采用支持向量機等多種分類
2、器,并結合不同的特征提取算法,對蛋白質結構和功能進行分類預測研究,主要工作概括如下:
(1)提出了預測蛋白質同源寡聚體的新模型一小波支持向量機模型。本文通過離散小波變換有效地提取了蛋白質序列的特征信息,并采用了不同分類算法對同源寡聚體類型進行分類預測。通過留一法檢驗表明,小波支持向量機模型能更好地分類預測同源寡聚體的類型,同時預測結果比文獻報道的結果有明顯地提高;在此基礎上,進一步深入研究了數(shù)據(jù)集的大小對預測準確率的影響。
3、結果表明在數(shù)據(jù)集平衡的情況下,隨著數(shù)據(jù)集的減小,jackknife運算機制受到影響,而導致預測準確率降低,這與文獻報道一致。
(2)建立了同源寡聚體和異源寡聚體的分類預測新模型。該模型將離散小波和氨基酸的物理化學性質相結合,利用離散小波變換近似系數(shù)和細節(jié)系數(shù),將同源寡聚體和異源寡聚體的序列分解為多層次的小波系數(shù),即將一維序列分解為同時具有時.頻特性的二維序列,并從其中提取有效的特征向量信息。最后通過不同的分類算法對蛋白質序
4、列進行分類預測研究。同時對Chou構建的高序列一致性蛋白質數(shù)據(jù)庫和Xiao構建的低序列一致性蛋白質數(shù)據(jù)庫進行了分類預測研究,發(fā)現(xiàn)該模型不僅能夠提高預測準確率,而且能有效地克服低序列一致性數(shù)據(jù)庫預測準確率較低的問題。
(3)建立了蛋白質四級結構及亞結構的預測新模型。從氨基酸的疏水性和極性出發(fā),基于離散小波變換和決策樹算法,構建了預測蛋白質四級結構及亞結構的新模型DWT DT。本文重點研究了氨基酸疏水性和極性對預測結果的影響,
5、經(jīng)分析表明疏水性對蛋白質結構的預測準確率有重要的影響。同時,深入挖掘算法產(chǎn)生過擬合的原因,并通過ROC曲線和PR曲線的評價,闡明了我們所構建的模型能夠有效克服過擬合?;谏鲜鲅芯拷Y果,我們構建了網(wǎng)絡在線預測平臺,通過Internet向所有使用者提供開放式服務。
(4)建立了蛋白質棕櫚化修飾位點的預測新模型—WSM-Plam模型。該模型融合權重氨基酸成分、自相關函數(shù)和溶劑可及表面面積等多種特征提取方法表達棕櫚化位點樣本特征向
6、量信息,并通過不同的分類算法對其進行分類預測。實驗結果表明,融合的特征提取方法比單一的方法能夠包含更多的有效特征向量,從而更準確的對位點進行識別分類。此外,該模型計算簡單、分類精度高,且具有較強的自適應、泛化和推廣應用能力。最后,我們構建了棕櫚化位點的在線預測平臺(http://bioinfo.ncu.edu.cn/services-ptm.aspx)。
上述各種算法都已編寫了處理程序并實現(xiàn)網(wǎng)絡在線預測,可以極為方便地使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于氨基酸序列信息的蛋白質結構與功能預測研究.pdf
- 基于多肽片段中央氨基酸裝配的蛋白質結構預測.pdf
- 氨基酸蛋白質核酸
- 蛋白質和氨基酸
- 氨基酸蛋白質和蛋白質纖維
- 蛋白質氨基酸原創(chuàng)
- 氨基酸、肽和蛋白質
- 氨基酸、多肽與蛋白質
- 應用非天然氨基酸ONBY探究蛋白質結構與功能的方法研究.pdf
- 蛋白質和氨基酸課件
- 蛋白質分解氨基酸代謝
- 氨基酸、蛋白質、核酸備課
- 構成蛋白質的氨基酸種類
- 蛋白質與氨基酸的測定
- 基于結構信息和偽氨基酸組分信息預測抗凋亡蛋白質與促凋亡蛋白質.pdf
- 氨基酸、多肽、蛋白質和核酸
- 蛋白質降解與氨基酸代謝
- 蛋白質化學總論和氨基酸
- 基于序列特征的蛋白質功能類預測方法研究.pdf
- 蛋白質分解及氨基酸代謝
評論
0/150
提交評論