版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于NoSQL存儲的海量文檔全文檢索系統(tǒng)是一種結(jié)合了分布式全文檢索和分布式存儲的新型文檔管理系統(tǒng)。它提供了文檔管理系統(tǒng)升級的一種方案,使文檔存儲滿足海量存儲要求,使文檔檢索更加準(zhǔn)確高效。
傳統(tǒng)的文檔管理系統(tǒng)大多使用文檔外部特征作為文檔查詢關(guān)鍵字,通過這些關(guān)鍵字和文檔內(nèi)容建立關(guān)聯(lián)并保存到關(guān)系型數(shù)據(jù)庫,文檔內(nèi)容直接保存到操作系統(tǒng)文件系統(tǒng)中。這種方式一般會造成兩個問題,一個是文檔都保存在一臺服務(wù)器上,造成系統(tǒng)存儲容量有限,擴展性不好
2、。另一個是使用外部特征搜索文檔內(nèi)容,搜索的準(zhǔn)確性很低。為解決這兩個問題,本文把業(yè)界兩種新興技術(shù)NoSQL和分布式全文檢索引擎引入到文檔管理系統(tǒng)中。
MongoDB在NoSQL領(lǐng)域非常有名,在DB Engines的排行榜中已進入前5,在行業(yè)中的應(yīng)用非常普遍。本文分析了MongoDB的特點、功能和適合場景,并重點研究了MongoDB實現(xiàn)分片和復(fù)制的原理,為學(xué)習(xí)分布式存儲提供了很好的案例。
ElasticSearch是一個
3、基于Lucene構(gòu)建的開源引擎,包涵有分布式、RESTful等功能。雖然是一個新興的分布式搜索引擎,但在性能、擴展性、成熟度多方面都表現(xiàn)很優(yōu)秀。本文重點深入ElasticSearch源碼,分析了其實現(xiàn)分布式搜索的原理。
本文主要研究工作是基于NoSQL存儲的海量文檔全文檢索系統(tǒng)的研究與實現(xiàn)。根據(jù)功能需要,本文設(shè)計了基于OSGi的模塊化插件結(jié)構(gòu)的系統(tǒng)架構(gòu),并把業(yè)務(wù)功能分為文件處理、文本提取、全文索引和查詢四個主要模塊。系統(tǒng)應(yīng)用插
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于全文檢索系統(tǒng)的文檔關(guān)聯(lián)研究與實現(xiàn).pdf
- 海量數(shù)據(jù)加密存儲與檢索系統(tǒng)的研究與實現(xiàn).pdf
- 基于HBase的海量小視頻存儲與檢索系統(tǒng)的研究與實現(xiàn).pdf
- 面向文檔的全文檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 異構(gòu)文檔庫全文檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 基于Lucene的多文檔全文檢索系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 分布式海量數(shù)據(jù)存儲檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 多源文檔全文檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 海量數(shù)據(jù)存儲與全文檢索.pdf
- 基于lucene中文全文檢索系統(tǒng)的研究與實現(xiàn).pdf
- 基于NoSQL的海量交通視頻監(jiān)控數(shù)據(jù)存儲與檢索技術(shù)研究.pdf
- 基于NoSQL的海量文檔分享平臺的設(shè)計與實現(xiàn).pdf
- 海量圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于MapReduce的全文檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于Lucene的全文檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于SolrCloud的文檔檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- 面向公安領(lǐng)域的海量數(shù)據(jù)存儲檢索系統(tǒng)的開發(fā).pdf
- 面向海量郵件的檢索系統(tǒng)研究與實現(xiàn).pdf
- 基于內(nèi)容的文檔圖像檢索系統(tǒng)設(shè)計與實現(xiàn).pdf
- Web全文信息檢索系統(tǒng)的研究與實現(xiàn).pdf
評論
0/150
提交評論