基因表達式編程與支持向量機在疾病診斷和QSAR-QSPR中的應用研究.pdf_第1頁
已閱讀1頁,還剩174頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、人工智能的發(fā)展對科技和經濟的發(fā)展起了重大的推動作用。尤其在解決復雜優(yōu)化、減少反應時間和促進產品的開發(fā)等方面表現更為突出。隨著科技的進步,大量數據的產生需要有效的方法才能得出更加可行的結果,有利于促進科技的快速發(fā)展。因此研究新的高效數據挖掘方法和尋找規(guī)律已成為人工智能研究的迫切需要。 本文對一種新的數據挖掘方法:基因表達式編程(geneexpressionprogramming,GEP)進行研究,GEP是一種新的機器學習算法,具有

2、優(yōu)異的泛化能力,是由FerreiraC.于1999年根據遺傳算法和遺傳程序發(fā)展而來的。本論文主要對GEP的原理和在定量結構—性質/活性關系(QSPR/QSAR)和疾病診斷方面的進行了應用研究。 第一章:對GEP算法原理、實現步驟以及研究現狀進行了詳細的綜述,并對GEP和支持向量機(supportvectormachines,SVM)在疾病診斷和QSAR中的應用現狀進行了綜述。 第二章:應用GEP和SVM方法對疾病的診斷和

3、發(fā)病率進行預測,包括:(1)用SVM方法對346例(冠心病172例,健康體檢174例)進行了分類判別,同時用線性判別分析方法(lineardiscriminantanalysis,LDA)作為對照研究,對訓練集的預測準確率分別是96.86%和78.18%,測試組的預測準確率分別是90.57%和72.73%;(2)用SVM和LDA算法對70例(腎病綜合征50例,腎小球腎炎20例)進行了診斷,訓練集的預測準確率分別是94.6%和89.86%

4、,測試組的預測準確率分別是78.18%和72.73%。表明用SVM方法建立的模型其預測能力要優(yōu)于LDA;(3)用GEP方法對2003年我國SARS的高發(fā)地區(qū)北京市和山西省的發(fā)病趨勢進行建模預測,其擬合情況與當時SRAS實際發(fā)病和死亡情況基本一致,實驗結果表明其在精度和速度上都優(yōu)于神經網絡算法。 第三章:GEP和SVM方法在藥物性質方面的應用研究:(1)應用啟發(fā)式方法(HM)和支持向量機方法建立了70種藥物與血漿蛋白結合率的定量構

5、效關系模型,研究了分子結構對藥物與血漿蛋白結合率的影響。兩種方法均得到了較好的結果,交互檢驗的相關系數平方(R2)分別為0.80和0.82;通過對模型的穩(wěn)定性和預測能力比較表明,支持向量機建立的QSAR模型能夠更好地預測藥物與血漿蛋白結合率;(2)應用GEP方法建立了抗艾滋病藥物核苷類的定量構效關系模型,研究了分子結構對此類藥物EC50的影響。用HM方法篩選5個描述符建立模型,平均誤差是0.41,而模型的相關系數(R)是091,對GEP

6、和SVM方法建立的模型進行了比較,GEP建立的模型中訓練集和測試集的相關系數分別是0.91和0.63,而SVM方法建立的模型中訓練集和測試集的相關系數分別是0.86和052,不論是測試集還是訓練集的預測結果,GEP都優(yōu)于SVM,因此GEP可以作為一種有效的手段預測核苷類的抗艾滋病藥物的EC50;(3)基于GEP方法建立1,4-二氫吡啶鈣離子通道拮抗劑的半數有效抑制濃度(IC50),用啟發(fā)式方法篩選6個相關描述符,用GEP建立QSAR模型

7、,得到了很好的預測結果,均方誤差(MSE)是0.19,R2是0.92,本文為藥物篩選和設計提供了一種新而有效的方法。 第四章:GEP和SVM方法在分析化學方面的研究應用:(1)建立了基于啟發(fā)式方法和支持向量機方法的QSAR模型,用于預測α-環(huán)糊精與單取代或1,4-二取代苯衍生物結合后包結物的穩(wěn)定常數。通過計算并用HM篩選6個參數,用于啟發(fā)式方法和支持向量機方法建立QSAR模型,其R值分別是094和0.98,留一法(leave-o

8、ne-out,LOO)交互檢驗的相關系數(RCV)分別為0.92和0.95。因此,用支持向量機方法建立的模型要優(yōu)于啟發(fā)式方法,其預測能力更強,模型的穩(wěn)定性更好;(2)應用啟發(fā)式方法和支持向量機方法建立了88種醛類化合物對大鼠急性毒性的定量構效關系模型,研究了醛類化合物分子結構對大鼠急性毒性的影響。兩種方法均得到了較好的結果,啟發(fā)式方法和支持向量機方法的交互檢驗的相關系數分別為0.90和0.93;通過對模型的穩(wěn)定性和預測能力比較,支持向量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論