版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)的不斷壯大,WEB已成為當(dāng)今最大的信息載體,是人們獲取信息的主要來源。信息檢索技術(shù)作為人們獲取信息的最主要的手段之一已得到了迅速的發(fā)展,但日益增長的網(wǎng)絡(luò)信息資源,使得人們準(zhǔn)確檢索的需求并不能得到很好的滿足,同時(shí),WEB信息也無法被自動處理和有效利用。其中,最主要的原因在于:過大的資源基數(shù)使得通用檢索系統(tǒng)返回的信息廣而不精,且主題漂移現(xiàn)象頻繁出現(xiàn),用戶將浪費(fèi)較多的時(shí)間和精力來獲取有用信息;另一方面,語義孤島現(xiàn)象,即網(wǎng)絡(luò)信息異構(gòu)、
2、服務(wù)異構(gòu)以及人機(jī)理解的差別使得檢索系統(tǒng)的有效召回率和召回精度都大打折扣。
作為語義網(wǎng)核心的本體技術(shù)承擔(dān)著語義表達(dá)的重要責(zé)任,通過本體支持語義,支持人機(jī)之間的交流,從而實(shí)現(xiàn)機(jī)器智能,為Web的發(fā)展帶來了新的契機(jī)。本體在主題搜索引擎中的應(yīng)用,必將對信息檢索系統(tǒng)的易用性和效率產(chǎn)生極大的改進(jìn),從而最大程度迎合用戶的檢索需求?;诖?本文設(shè)計(jì)并構(gòu)建了一個(gè)基于本體的主題信息檢索原型系統(tǒng),力求一定程度上提高信息的有效利用率和檢索系統(tǒng)的效
3、率。主要研究內(nèi)容和創(chuàng)新有如下幾個(gè)方面:
①構(gòu)建了一個(gè)計(jì)算機(jī)技術(shù)領(lǐng)域中文本體。在現(xiàn)有本體理論、構(gòu)建方法和技術(shù)的基礎(chǔ)上,綜合應(yīng)用需求,對傳統(tǒng)的本體建模方法進(jìn)行了改進(jìn)和完善。一方面,為確保概念的質(zhì)量,本文綜合篩選科研文獻(xiàn)關(guān)鍵詞、分類主題詞表和一些通用知識庫中的概念;另一方面,以應(yīng)用需求為導(dǎo)向,明確本體構(gòu)建目的,一定程度上減少了細(xì)節(jié)的干擾?;诖?論文設(shè)計(jì)并半自動構(gòu)造了一個(gè)計(jì)算機(jī)技術(shù)領(lǐng)域的中文本體,并進(jìn)行了相關(guān)查詢實(shí)驗(yàn),為進(jìn)一步基
4、于本體的語義信息檢索應(yīng)用研究做鋪墊。
②基于本體的查詢擴(kuò)展實(shí)現(xiàn)。基于關(guān)鍵詞匹配的通用搜索引擎無法應(yīng)付語義孤島現(xiàn)象,因此,我們采用概念匹配,即對其進(jìn)行語義擴(kuò)展,以求解決相關(guān)、相似的信息由于主題詞表達(dá)方式的不同而無法被系統(tǒng)檢索和返回。本文的查詢擴(kuò)展主要是基于概念間的關(guān)聯(lián)程度。鑒于兩個(gè)概念之間的關(guān)聯(lián)度不僅與其概念之間定義的內(nèi)在關(guān)系(包括公有屬性等)有關(guān),還與其在本體樹中的分布距離相關(guān),也即由結(jié)構(gòu)內(nèi)和結(jié)構(gòu)外兩因素主導(dǎo),前者簡稱為相
5、關(guān)度,后者為相似度。本文在現(xiàn)有相似度算法研究基礎(chǔ)之上,綜合需求,對最終概念關(guān)聯(lián)算法進(jìn)行了改進(jìn),并以此設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)適合本文原型系統(tǒng)的擴(kuò)展算法。
③基于本體的主題信息檢索原型系統(tǒng)的設(shè)計(jì)與構(gòu)建。包括本體查詢子系統(tǒng)和Web主題語義檢索系統(tǒng)兩大模塊。一方面,為了方便用戶對領(lǐng)域概念和知識系統(tǒng)進(jìn)行了解和隨時(shí)查詢,同時(shí)也為規(guī)范主題信息檢索系統(tǒng)中查詢的概念表述,論文設(shè)計(jì)并構(gòu)建了一個(gè)簡單的本體查詢子系統(tǒng),查詢內(nèi)容有本體概念、屬性以及關(guān)系等
6、,并以本體樹的形式對本體進(jìn)行整體表述。另一方面,在已研究實(shí)現(xiàn)的領(lǐng)域本體、概念相似度計(jì)算以及查詢擴(kuò)展模塊的基礎(chǔ)上,論文設(shè)計(jì)并成功實(shí)現(xiàn)了一個(gè)web主題語義檢索系統(tǒng),以期改進(jìn)通用搜索引擎的效率。
為了驗(yàn)證改進(jìn)算法的有效性以及檢索系統(tǒng)的效率,文章最后進(jìn)行了對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,基于本體的主題查詢系統(tǒng)能很好的擴(kuò)展并返回查詢相關(guān)信息,一定程度上提高了基于關(guān)鍵詞匹配檢索系統(tǒng)的召回精度和召回率。
關(guān)鍵詞:語義網(wǎng);本體;主題
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 主題語義檢索技術(shù)在信息集成中的研究及應(yīng)用.pdf
- 基于領(lǐng)域主題的Web信息檢索技術(shù)研究.pdf
- 語義Web技術(shù)在信息檢索系統(tǒng)中的應(yīng)用研究.pdf
- 基于時(shí)態(tài)語義的Web信息檢索關(guān)鍵技術(shù)研究.pdf
- 基于語義Web的信息檢索應(yīng)用研究.pdf
- 基于語義Web技術(shù)的智能信息檢索研究.pdf
- Web信息檢索及應(yīng)用設(shè)計(jì)優(yōu)化技術(shù)研究.pdf
- Web信息檢索與主題提取的關(guān)鍵技術(shù)研究.pdf
- 基于語義Web的語義信息檢索的研究.pdf
- web中圖像的檢索技術(shù)研究
- web中圖像的檢索技術(shù)研究
- 語義Web在概念檢索中的研究與應(yīng)用.pdf
- web中圖像的檢索技術(shù)研究
- 支持語義的對等計(jì)算信息檢索技術(shù)研究.pdf
- Web信息檢索排序函數(shù)技術(shù)研究.pdf
- web中圖像的檢索技術(shù)研究
- Web信息檢索的關(guān)鍵技術(shù)研究.pdf
- 語義Web技術(shù)及其在教育資源檢索中的應(yīng)用研究.pdf
- 基于圖學(xué)習(xí)的Web信息檢索技術(shù)研究.pdf
- 基于領(lǐng)域本體的語義信息檢索及相關(guān)技術(shù)研究.pdf
評論
0/150
提交評論