XML數(shù)據(jù)庫中全文檢索系統(tǒng)的研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著XML廣泛應(yīng)用,出現(xiàn)了大量的XML數(shù)據(jù)。為了更好的管理這些XML數(shù)據(jù),人們設(shè)計了XML數(shù)據(jù)庫。CoSQLRX系統(tǒng)是一個關(guān)系-XML雙引擎數(shù)據(jù)庫系統(tǒng),可以同時處理關(guān)系-XML查詢。本文著重于XML數(shù)據(jù)的全文檢索功能的研究,通過對全文檢索技術(shù)的分析,提出了CoSQLRX系統(tǒng)框架上的XML全文檢索功能的實現(xiàn)方式。
  首先,本文就全文檢索的相關(guān)工作進(jìn)行了介紹。介紹了XML中的全文檢索的查詢語法,以及與XQuery的關(guān)系,同時介紹了C

2、oSQLRX數(shù)據(jù)庫。
  其次,本文完成了針對全文檢索中各個模塊的設(shè)計,包括解析模塊的設(shè)計、查詢執(zhí)行計劃的中各個操作符的設(shè)計,同時設(shè)計了執(zhí)行模塊各個操作符的執(zhí)行算法。
  再次,在分析了初步構(gòu)建查詢執(zhí)行計劃執(zhí)行代價過高的基礎(chǔ)上,本文分別提出了對應(yīng)的邏輯查詢執(zhí)行計劃和物理查詢執(zhí)行計劃的優(yōu)化策略。此外就當(dāng)前XML編碼中的問題進(jìn)行了分析,針對原有編碼在XML更新方面的不足,本文設(shè)計了DCU編碼,并且就DCU編碼的編碼方式進(jìn)行了介紹

3、,主要包括:初始的DCU編碼、DCU編碼在XML結(jié)構(gòu)中的表示、DCU編碼的更新、DCU編碼在匹配度中的應(yīng)用等。同時還就設(shè)計的各個模塊如何在CoSQLRX數(shù)據(jù)庫當(dāng)中進(jìn)行的實現(xiàn)進(jìn)行了詳細(xì)的說明,包括擴展原有的語法規(guī)則、注冊新的針對全文檢索的操作符、在原有的執(zhí)行器基礎(chǔ)上添加新的執(zhí)行器等,同時就全文檢索,詳細(xì)介紹了各個操作符函數(shù)的調(diào)度關(guān)系。
  最后,經(jīng)過實驗結(jié)果的對比和分析,本文設(shè)計的全文檢索功能可以很好的實現(xiàn)在XML數(shù)據(jù)上的全文檢索,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論