基于生物醫(yī)學(xué)文本挖掘技術(shù)的天然產(chǎn)物的靶標(biāo)蛋白預(yù)測.pdf_第1頁
已閱讀1頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、指導(dǎo)小組成員名單周水庚教授張淑芹畐1教授朱山風(fēng)副教授摘要從天然產(chǎn)物或其衍十.物中尋找有顯著活性的先導(dǎo)小分化合物,是研制和開發(fā)新藥的重要途杼。這土耍閃為活性小分子與標(biāo)靶蛋白的相互作用是生命中最基本的相互作用之一,也足生命有機(jī)化學(xué)及藥物化學(xué)研究的重耍內(nèi)容。受限于傳統(tǒng)生物實(shí)驗(yàn)方法的低通量和高開誚,大然產(chǎn)物的標(biāo)靶蛋G預(yù)測一直以來都是一個(gè)研究熱點(diǎn)。隨右對生物醫(yī)學(xué)究的關(guān)注度越來越高,與該領(lǐng)域相關(guān)的文獻(xiàn)量正在以指數(shù)級別增長。如伺采訃算的方法,有效的利

2、爪這類數(shù)據(jù)來輔助標(biāo)靶蛋白的預(yù)測,是本論文討論的主要問題。數(shù)據(jù)挖掘是一種通過分析大暈數(shù)據(jù),從中尋找其內(nèi)在規(guī)律的技術(shù)。其中叢于文本的信息抽取過程是指把文本里包含的信息進(jìn)行結(jié)構(gòu)化處理,將廿結(jié)構(gòu)化或半結(jié)構(gòu)化的信息轉(zhuǎn)化為結(jié)構(gòu)化的信息。即從一段&然語言文本屮抽取指定的事件、事實(shí)信息,并以結(jié)構(gòu)化的形式描述信息,供信息査詢、文本的深層挖掘和S動(dòng)冋答等應(yīng)用。知識發(fā)現(xiàn)則是一種能從數(shù)據(jù)集中識別有效地、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程,其F

3、1的是提取有價(jià)值的信息并向使用者屏蔽原始數(shù)據(jù)的繁瑣細(xì)節(jié)。本論文有效的將數(shù)據(jù)挖掘技術(shù)結(jié)合到天然產(chǎn)物的標(biāo)靶蛋a預(yù)測這一個(gè)實(shí)際的應(yīng)用上。主要工作休現(xiàn)在以下兩個(gè)方面:信息抽?。↖nfmationExtraction:IE):概述了近年來基于生物醫(yī)學(xué)文獻(xiàn)信息抽取的研究進(jìn)展并探討了相關(guān)的技術(shù)實(shí)現(xiàn);從生物醫(yī)學(xué)文獻(xiàn)中抽取天然產(chǎn)物與靶標(biāo)蛋白之間,天然產(chǎn)物與天然產(chǎn)物之間,靶標(biāo)蛋白與靶標(biāo)蛋白之間的共現(xiàn)數(shù)據(jù),并提出一種高效的方法分析這些共現(xiàn)數(shù)據(jù)。知識發(fā)現(xiàn)(Kn

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論