版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、16信息檢索效率的探討信息檢索效率的探討摘要摘要在信息技術迅速發(fā)展的推動下,傳統(tǒng)信息服務機構和網(wǎng)絡信息服務運營商逐步走上由信息服務向知識服務的轉(zhuǎn)型之路。在這種趨勢下,信息檢索也由過去單純的字符匹配逐步轉(zhuǎn)向面向內(nèi)容、基于知識的信息檢索。在這里簡單探討一下基于知識服務的信息檢索效率的基本概念和評價指標,剖析語義分析程度、信息模型、檢索方法和信息收錄范圍等主要影響因素,最后通過一個實例,對比分析說明知識服務將提高用戶信息檢索的效率。關鍵詞關鍵
2、詞:知識服務;信息檢索:效率引言:進入知識經(jīng)濟時代,知識管理、知識服務的理念得到廣泛認同,信息檢索技術也由基于關鍵詞的信息檢索逐步轉(zhuǎn)向針對文章內(nèi)容的基于知識的信息檢索。后者不再是基于字符的機械匹配,而是更強調(diào)語義,模擬人類的思維方式,從語義和概念出發(fā),自動分析信息資源的語義信息,查找和發(fā)現(xiàn)具有相關知識單元的信息資源。較之前者,其檢索結果更準確,更貼近用戶需求。信息檢索是將信息按照一定的規(guī)律組織起來,找到所需信息的過程和技術,簡單的說,就
3、是信息的有序化識別和查找。信息檢索效率就是實施識別和查找過程的效率。信息檢索效率不僅是影響信息檢索工具價值的重要因素,也是評價信息檢索技術發(fā)展的重要指標。1、基于知識服務的信息檢索效率的主要評價指標有檢全率、檢準率、友好性和檢索耗時。1.11.1、檢全率檢出相關信息的記錄數(shù)與系統(tǒng)中全部相關信息的記錄數(shù)之比。這里的相關信息是指具有語義聯(lián)系的信息。1.21.2、檢準率是指檢出相關記錄數(shù)與檢出全部相關記錄數(shù)之比。1.31.3、友好性對檢索結果
4、按照相關度進行排序,便于用戶率先查看相關度高的結果再看36息資源的相互關系,區(qū)分出核心信息資源和一般信息資源,使檢索過程優(yōu)先匹配核心信息資源,縮減平均匹配時間,提高檢索效率。因此,信息資源的語義分析程度是影響信息檢索效率的關鍵因素。2.22.2、檢索模型信息檢索模型是描述信息檢索過程中文檔表示,查詢及其相互關系的模型。信息檢索模型決定了查詢過程的效率。目前主要的信息檢索模型有布爾模型、向量空間模型、概念模型和基于本體的信息檢索模型。2.
5、2.12.2.1、布爾模型布爾模型是基于集合論和布爾代數(shù)的一種簡單模型,該模型為用戶提供了一個容易掌握的方式,輸入布爾表達式即可查詢。布爾模型定義索引術語只有兩種狀態(tài):匹配和不匹配,這就導致了索引術語的權重都表現(xiàn)為二元性,要么文檔完全匹配,要么文檔完全不匹配,布爾模型只能進行精確檢索而不能進行模糊檢索。2.2.22.2.2、向量模型向量空間模型是利用空間相似性來表示語義的相似性。文檔和查詢都用多次元向量表示,如果查詢向量和文檔向量距離最
6、近,那么這個文檔和這個查詢的相關度就最大,匹配程度就越高。向量空間模型解決了布爾模型索引術語權重二元性的缺點,提供出符合某向量距離(即相關度數(shù)值)范圍內(nèi)的所有檢索結果,很大程度的提升了信息檢索的檢全率,但倘若相關度制定的過低,則會導致檢索結果數(shù)量過多,影響檢索效率。2.2.32.2.3、概率模型概率模型基于以下理論:給定一個查詢串q和集合中的文檔d,概率模型來估計用戶查詢串q與文檔d相關的概率。概率模型假設這種概率只由查詢串和文檔決定。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語義的圖像信息檢索-畢業(yè)論文
- 基于語義的圖像信息檢索-畢業(yè)論文
- 根據(jù)語義的圖像信息檢索-畢業(yè)論文
- 畢業(yè)論文---關于機車運用效率的探討
- 畢業(yè)論文基于web的信息檢索系統(tǒng)的研究
- 2004-2009國內(nèi)信息檢索研究論文的引文分析[畢業(yè)論文]
- 信息檢索10章 檢索效率及信息的利用
- 畢業(yè)論文圖像檢索.doc
- 模糊數(shù)學在信息檢索中的應用畢業(yè)論文
- 基于內(nèi)容的圖像檢索-畢業(yè)論文
- 文獻檢索與畢業(yè)論文
- 圖書檢索系統(tǒng)畢業(yè)論文
- 軟件工程畢業(yè)論文-農(nóng)業(yè)信息發(fā)布系統(tǒng)-信息檢索的設計與實現(xiàn)
- 畢業(yè)論文關于會計信息失真問題的探討
- 基于內(nèi)容的圖像檢索綜述-畢業(yè)論文
- 基于內(nèi)容的圖像檢索綜述-畢業(yè)論文
- 信息檢索中效率問題的研究
- 畢業(yè)論文——外觀專利圖像檢索平臺
- 畢業(yè)論文---中小企業(yè)財務管理效率的路徑探討
- 畢業(yè)論文--公司內(nèi)部控制信息披露問題探討
評論
0/150
提交評論