支持向量機用于化合物構(gòu)效關(guān)系的研究.pdf_第1頁
已閱讀1頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。經(jīng)過這數(shù)十年的發(fā)展,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為處理化學(xué)化工數(shù)據(jù)的常規(guī)手段。 本文將支持向量機(supportvectormachine,SVM),一種特別適合用有限已知樣本訓(xùn)練建模,進而預(yù)報未知樣本屬性的數(shù)據(jù)挖掘新算法應(yīng)用于若干化合物體系的構(gòu)效關(guān)系研究。由于支持向量機算法的數(shù)學(xué)理論非常嚴

2、格,同時考慮到擬合精度和對過擬合的抑制,故能基于小樣本集作較可靠的計算機預(yù)報。其對所選體系的數(shù)據(jù)處理均得到了較好的預(yù)報結(jié)果,充分展現(xiàn)了SVM算法的優(yōu)點和廣闊的應(yīng)用前景。主要研究工作分三部分: 第一部分支持向量分類(SVC)算法用于藥物構(gòu)效關(guān)系研究。本工作由兩個章節(jié)構(gòu)成。 (1)3-甲基芬太尼衍生物(3-MF)的鎮(zhèn)痛活性研究。將支持向量分類(supportvectorclassification,SVC)算法用于3-MF及

3、其衍生物結(jié)構(gòu)與鎮(zhèn)痛活性關(guān)系的研究,用SVM預(yù)報結(jié)果來篩選結(jié)構(gòu)參數(shù)。所建SVC模型分類結(jié)果為95.12%,對41個3-MF的活性類別留一法預(yù)報正確率為92.68%,明顯高于主成分分析法(PCA)(85.37%),F(xiàn)isher法(87.80%)和KNN法(87.80%)。 (2)三唑類衍生物的抗真菌活性研究。用HyperchemTM軟件計算了23個該類藥物分子的量子化學(xué)參數(shù),基于SVM的特征篩選方法找出了影響活性目標變量的主要特征參

4、數(shù),用SVC算法建立了活性與參數(shù)間的定性模型并用留一法進行了類別預(yù)報。結(jié)果為:訓(xùn)練集的分類正確率為91.3%,留一法預(yù)報正確率為91.3%,優(yōu)于傳統(tǒng)的PCA方法(83%)和KNN方法(74%)。在此基礎(chǔ)上,進行了三唑類藥物分子的初步設(shè)計工作。 第二部分支持向量回歸(supportvectormachine,SVR)算法用于二取代[(吖啶-4-酰胺基)丙基]甲胺類衍生物的活性研究。在通過HyperchemTM軟件計算了40個該類藥

5、物分子的量子化學(xué)參數(shù)以及特征參數(shù)篩選后,用SVR算法對化合物的活性進行了定量建模和留一法預(yù)報。SVR建模的相對誤差為4.47%,優(yōu)于線性回歸算法(5.58%);留一法預(yù)報相對誤差為6.819%,優(yōu)于人工神經(jīng)網(wǎng)絡(luò)(ANN)算法(8.099%)。 第三部分支持向量回歸(SVR)算法用于偶氮染料分子的結(jié)構(gòu)性質(zhì)研究。將SVM特征篩選方法對已知偶氮染料分子分子描述符進行了壓縮提取,討論了有關(guān)結(jié)果。用特征篩選后的分子描述符構(gòu)建了染料分子親合

6、力的SVR模型,并用留一法考察了SVR模型的預(yù)報能力與可靠性,同時還用多種傳統(tǒng)方法對該體系進行了研究。結(jié)果是:ANN擬合最好,其平均相對誤差MRE僅0.28%,優(yōu)于SVR5.09%,MLR6.16%,PLS6.41%;SVR的預(yù)報正確率最高,其MRE為6.60%,而在訓(xùn)練中擬合最好的ANN其預(yù)報的MRE為10.89%,低于MLR9.30%和PLS9.52%。結(jié)果表明:與人工神經(jīng)網(wǎng)絡(luò)(ANN)法、多元線性回歸(MLR)法和偏最小二乘(PL

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論