中醫(yī)醫(yī)案文本挖掘的若干關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩127頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、中醫(yī)是我國(guó)勞動(dòng)人民數(shù)千年以來在與疾病斗爭(zhēng)中形成的豐富診療經(jīng)驗(yàn)的總結(jié),在長(zhǎng)期發(fā)展過程形成了一種以陰陽五行作為理論基礎(chǔ)的獨(dú)具特色的診療體系,留下了大量對(duì)中醫(yī)臨床決策有指導(dǎo)價(jià)值的文獻(xiàn)資料,這些“海量”中醫(yī)醫(yī)案文獻(xiàn)資料是中醫(yī)臨床診療的寶貴資源。目前,應(yīng)用不同的文本挖掘方法,致力于從“海量”的文獻(xiàn)資料中獲取可理解的、可用的知識(shí),用于分析中醫(yī)診療的用藥規(guī)律,以指導(dǎo)中醫(yī)臨床科研、教學(xué)及新藥研發(fā),已愈來愈成為該領(lǐng)域的研究熱點(diǎn)。然而,中醫(yī)醫(yī)案文本信息尚未

2、得以有效挖掘和利用,原因在于:構(gòu)建統(tǒng)一的中醫(yī)醫(yī)案本體存在一定的困難;命名實(shí)體識(shí)別效率不高;文本向量空間表示模型忽略了詞間的關(guān)聯(lián)性,不能很好地表示潛在語義信息;傳統(tǒng)文本聚類算法在處理數(shù)據(jù)時(shí)存在著對(duì)初始值的依賴性過強(qiáng)、易獲得局部最優(yōu)的弊端。
  針對(duì)上述問題,在前期研究基礎(chǔ)上,提出基于本體的命名實(shí)體識(shí)別算法和基于螢火蟲算法的中醫(yī)醫(yī)案文本聚類方法。本文的研究得到了山東省科技發(fā)展計(jì)劃:“基于醫(yī)用酶語義的文獻(xiàn)數(shù)據(jù)檢索挖掘算法的設(shè)計(jì)與實(shí)現(xiàn)(編

3、號(hào):2010G0020121)”、山東省電子專項(xiàng)工程:“山東省名老中醫(yī)診療輔助決策支持系統(tǒng)的開發(fā)與推廣(編號(hào):2150511)”及山東省中醫(yī)藥科技發(fā)展計(jì)劃:“基于仿生智能算法的心力衰竭綜合防治方案研究(編號(hào):2013-230)”的支持。
  本文數(shù)據(jù)來源為全國(guó)名老中醫(yī)、山東省名老中醫(yī)丁書文教授自2013年6月至2015年6月在山東中醫(yī)藥大學(xué)附屬醫(yī)院門診收集的2400份醫(yī)案,患者共757例,所用中藥共251種。
  本文的主要

4、研究?jī)?nèi)容和研究成果總結(jié)如下:
  1.把人工蜂群算法應(yīng)用于中醫(yī)醫(yī)案本體庫的構(gòu)建。設(shè)計(jì)基于人工蜂群算法的本體學(xué)習(xí)技術(shù),通過中文分詞技術(shù)、互信息及規(guī)則過濾等策略,以醫(yī)案中的中醫(yī)四診、中醫(yī)診斷、西醫(yī)診斷、證型、治法為信息語料進(jìn)行分析、驗(yàn)證,設(shè)計(jì)概念提取方法,同時(shí)利用小生境技術(shù)的融合、演化算法豐富種群的多樣性,結(jié)合人工蜂群算法尋優(yōu)速度快的優(yōu)勢(shì)抽取非分類關(guān)系,構(gòu)建本體。實(shí)驗(yàn)證明,組合的人工蜂群算法在中醫(yī)醫(yī)案非分類關(guān)系抽取過程中、在個(gè)體多樣性

5、及平均適應(yīng)度上均優(yōu)于普通的人工蜂群算法。
  2.提出一種基于本體的中醫(yī)醫(yī)案命名實(shí)體識(shí)別方法。應(yīng)用條件隨機(jī)場(chǎng)、基于本體的修正及特征模板的修正方法對(duì)中醫(yī)醫(yī)案命名實(shí)體進(jìn)行識(shí)別,構(gòu)建基于本體的中醫(yī)醫(yī)案命名實(shí)體識(shí)別算法,通過檢驗(yàn)性測(cè)試,獲得中醫(yī)四診、中醫(yī)診斷、西醫(yī)診斷、證型、治法的最優(yōu)實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)表明,基于本體的命名實(shí)體識(shí)別算法在中醫(yī)醫(yī)案命名實(shí)體識(shí)別時(shí)能取得較好效果。
  3.設(shè)計(jì)了一種基于詞共現(xiàn)組合的中醫(yī)醫(yī)案向量空間模型。利用關(guān)

6、聯(lián)規(guī)則算法抽取出中醫(yī)醫(yī)案的二階詞共現(xiàn)組合,定義詞共現(xiàn)的度量方法,構(gòu)建基于詞共現(xiàn)組合的向量空間模型。實(shí)驗(yàn)表明,該方法在中醫(yī)醫(yī)案知識(shí)獲取及分類上比經(jīng)典的向量空間模型具有更高的區(qū)分能力,并驗(yàn)證了中醫(yī)醫(yī)案辨證診療主題與二階詞共現(xiàn)的關(guān)聯(lián)性。
  4.提出一種基于螢火蟲算法的中醫(yī)醫(yī)案文本聚類算法。引入粒計(jì)算思想,通過適應(yīng)度變化情況動(dòng)態(tài)確定螢火蟲算法的迭代和模擬退火算法的抽樣,擴(kuò)大模擬退火的擾動(dòng)增加種群的選擇范圍,并在實(shí)驗(yàn)數(shù)據(jù)上進(jìn)行驗(yàn)證。實(shí)驗(yàn)表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論