基于WordNet的語義相似度計(jì)算方法的研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、語義相似度計(jì)算是自然語言處理領(lǐng)域中的重要研究內(nèi)容,在過去幾十年的研究工作中,已有大量的語義相似度計(jì)算方法被提出并廣泛應(yīng)用于語義消歧、音頻識(shí)別錯(cuò)誤的檢測、信息提取、語音自動(dòng)摘要、人的姓名解析、文本相似度計(jì)算、文本分類和聚類等領(lǐng)域中。隨著互聯(lián)網(wǎng)的迅速發(fā)展,信息處理變得越來越重要,尤其是對文本信息的處理,變得更加復(fù)雜。因此,提高語義相似度計(jì)算的準(zhǔn)確性,對文本信息的處理有著極其重要的意義。隨著本體研究的深入和本體技術(shù)的廣泛應(yīng)用,結(jié)構(gòu)化的領(lǐng)域本體

2、被提出并被應(yīng)用于衡量概念間的相似度,尤其是WordNet本體中的語義信息被廣泛應(yīng)用于語義相似度的計(jì)算。
  本文基于WordNet,利用概念結(jié)點(diǎn)在WordNet中的深度和下位詞等語義信息,改進(jìn)了信息量的計(jì)算模型。在此基礎(chǔ)上,同時(shí)考慮最短路徑距離和IC語義距離對語義相似度的影響,提出了新的混合式的語義相似度計(jì)算方法。實(shí)驗(yàn)結(jié)果表明,由于同時(shí)考慮了概念結(jié)點(diǎn)在WordNet中的深度、距離和下位詞等語義信息,所提方法優(yōu)于已有方法,其結(jié)果更加

3、接近人類的主觀判斷。
  基于本文提出的語義相似度計(jì)算方法對語義Web服務(wù)進(jìn)行匹配,因本文提出的語義相似度計(jì)算方法具有更高的皮爾森相關(guān)系數(shù),能夠更加準(zhǔn)確地對詞匯間的相似度進(jìn)行評(píng)判,與語義Web服務(wù)匹配的經(jīng)典算法相比,能夠更加有效地對語義Web服務(wù)中的輸入輸出進(jìn)行區(qū)別和細(xì)分,因此能夠匹配出更加準(zhǔn)確的Web服務(wù)。
  本文最后設(shè)計(jì)并開發(fā)了一個(gè)語義相似度計(jì)算系統(tǒng),本系統(tǒng)是一個(gè)交互式的GUI系統(tǒng),采用Java語言開發(fā),系統(tǒng)的主要功能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論