基于電子病歷利用支持向量機構(gòu)建重度急性胰腺炎早期預測模型.pdf_第1頁
已閱讀1頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、目的:
  急性胰腺炎(acute pancreatitis,AP)是一種常見的消化系統(tǒng)疾病,指多種病因包括酒精中毒、高脂血癥、暴飲暴食、藥物等引起的胰酶激活,繼以胰腺局部炎性反應為主要特征,伴或不伴有其他器官功能改變的急癥。臨床上大多數(shù)患者為輕度急性胰腺炎,不伴有器官衰竭和局部并發(fā)癥。少數(shù)患者為重度急性胰腺炎,起病急且病情較重,常伴有器官衰竭和(或)局部并發(fā)癥,以致住院天數(shù)長、預后差、死亡率高。因此,AP的分級和嚴重程度對于臨床

2、實踐和研究十分重要。本研究旨在利用支持向量機基于電子病歷構(gòu)建重度急性胰腺炎預測模型,提出簡單易行、新型的預測模型,進一步開發(fā)設計Windows應用程序,創(chuàng)建重度急性胰腺炎早期預警系統(tǒng),輔助臨床決策。
  方法:
  隨機抽取遼寧省某醫(yī)院去識別化的2013年1月至2015年3月主診斷為急性胰腺炎的電子病歷。參考UpToDate臨床顧問數(shù)據(jù)庫中列出的AP嚴重程度危險因素,最終選取的研究變量(n=20)包括:年齡、白細胞計數(shù)、紅細

3、胞比積、尿素、肌酐、K+、Na+、Ca2+、血清淀粉酶、血清脂肪酶、體溫、心率、呼吸頻率、血壓(收縮壓/舒張壓)、腹痛時間,以及是否神清、有無器官衰竭、有無胰腺壞死、有無胸腔積液。時間選取入院48小時內(nèi)。本研究選用出院診斷重度急性胰腺炎與否作為結(jié)局變量。
  所納入變量中4項以文字描述形式出現(xiàn)在首次病程記錄,利用ICTCLAS軟件初步分詞處理各首次病程記錄之病例特點,建立添加用戶詞典,再調(diào)用NLPIR函數(shù)抽取所調(diào)整疾病嚴重程度特征

4、詞。
  獲得研究變量數(shù)據(jù)存在缺失值,剔除存在缺失值的樣本。腹痛時間變量單位統(tǒng)一至天。將納入樣本按3∶1分為訓練集和測試集。
  MATLAB2010a環(huán)境下,基于支持向量機(support vector machine,SVM)LIBSVM3.11,采用優(yōu)化后的徑向基核函數(shù)產(chǎn)生的分類器,同時結(jié)合統(tǒng)計學單因素及多因素Logistic回歸分析方法,進行特征變量選取,提出一種簡單易行的重度急性胰腺炎早期預測模型。依據(jù)所選取特征變

5、量,再次基于SVM構(gòu)建重度急性胰腺炎早期預測模型,比較預測性能前后是否有所提高,確定最終預測模型決策函數(shù)表達式。通過組件對象模型(component object model,COM)建立動態(tài)鏈接庫實現(xiàn)VB.NET與MATLAB的混合編程,調(diào)用預測模型決策函數(shù)設計開發(fā)重度急性胰腺炎早期預測應用程序。
  采用測試集數(shù)據(jù)客觀評估應用程序預測性能,評估指標包括準確率(accuracy)、靈敏度(sensitivity)、特異度(spe

6、cificity)、陽性預測值(positivepredictive value)和陰性預測值(negative predictive value)。
  結(jié)果:
  最終納入323例,其中非重度急性胰腺炎203例、重度急性胰腺炎120例。納入訓練集242例,90例出院診斷為重度急性胰腺炎,所占比例為37.19%;測試集81例,30例出院診斷為重度急性胰腺炎,所占比例為37.04%。
  分別針對訓練集和測試集數(shù)據(jù),采

7、用留一法進行交叉驗證,線性、多項式、徑向基、sigmoid核函數(shù)的預測準確率分別為69.83%、69.83%、59.09%、62.81%和67.90%、69.14%、70.37%、62.96%。選用徑向基核函數(shù),網(wǎng)格搜索參數(shù)優(yōu)化前后(未優(yōu)化:c=1,g=0.05;優(yōu)化后:c=16,g=0.0625)訓練集和測試集數(shù)據(jù)準確率分別為59.09%、69.01%和70.37%、67.90%。
  經(jīng)單因素分析納入Logistic回歸分析的

8、變量有白細胞計數(shù)、收縮壓、尿素、血清鈉離子、血清鈣離子、體溫、心率、舒張壓、血清淀粉酶、血清脂肪酶、腹痛時間、器官衰竭、胸腔積液。經(jīng)Logistic回歸分析,最終納入特征變量有:白細胞計數(shù)、血清鈣離子、血清脂肪酶、收縮壓、舒張壓以及有無胸腔積液。
  選用徑向基核函數(shù),結(jié)合網(wǎng)格搜索和交叉驗證方法選擇最優(yōu)參數(shù),基于選取特征變量,再次建立分類模型。c最優(yōu)值為2,g最優(yōu)值為1,模型支持向量數(shù)為180,訓練集和測試集準確率分別為65.29

9、%、70.37%。生成SAPSVM setup.exe安裝程序。SAPSVM安裝文件包括sapfile.zip、setup.exe、安裝說明。只需按照安裝說明將sapfile文件解壓后復制到程序安裝目錄下,點擊setup.exe默認安裝。SAPSVM涉及白細胞計數(shù)、血清鈣離子、血清脂肪酶、收縮壓、舒張壓以及有無胸腔積液6項指標。
  采用測試集數(shù)據(jù)對預測模型的性能進行客觀評估,其中SAP類設為正類、非SAP類設為負類,測試集81個

10、樣本中,經(jīng)程序預測后其中真正樣本數(shù)12、假負樣本數(shù)18、假正樣本數(shù)6、真負樣本數(shù)45。SAPSVM預測準確率、靈敏度、特異度、陽性預測值、陰性預測值分別為70.37%、40%、88.24%、66.7%、71.43%。相同測試集樣本BISAP評分系統(tǒng)準確率、靈敏度、特異度、陽性預測值、陰性預測值分別為48.12%、30%、58.82%、30%、58.82%。
  結(jié)論:
  本研究利用支持向量機基于電子病歷構(gòu)建重度急性胰腺炎預

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論