知識庫質(zhì)量控制平臺的設(shè)計與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、互聯(lián)網(wǎng)上擁有豐富的資源,但是,大多數(shù)的資源都只能被人理解,而機器無法理解。一個海量的中文知識圖譜可以幫助機器理解文本,從而邁向下一代搜索業(yè)務(wù),使得搜索更加智能化,能精準(zhǔn)的分析用戶的搜索意圖并給出結(jié)果,使搜索更有廣度和深度,全面提升搜索效果。而這一切都需要知識數(shù)據(jù)的支持,知識數(shù)據(jù)是知識圖譜部門最重要的產(chǎn)出,是一種強結(jié)構(gòu)化數(shù)據(jù),比網(wǎng)頁數(shù)據(jù)等無結(jié)構(gòu)化數(shù)據(jù)更為復(fù)雜,質(zhì)量問題也更為普遍。本質(zhì)量控制平臺就是為了保證知識圖譜部門產(chǎn)出的知識數(shù)據(jù)質(zhì)量,為

2、各種類型數(shù)據(jù)提供全面、系統(tǒng)的監(jiān)控而搭建的。
  本文以軟件工程思想為指導(dǎo),獨立完成了本平臺的數(shù)據(jù)計算、監(jiān)控報警、例行評估各功能模塊的需求分析、設(shè)計實現(xiàn)和測試等工作。首先,本文分析系統(tǒng)任務(wù)和目標(biāo)用戶以及數(shù)據(jù)計算、監(jiān)控報警、例行評估三大關(guān)鍵功能模塊,并在此基礎(chǔ)上劃分各模塊子功能點,明確系統(tǒng)的功能性和非功能性需求,然后從邏輯分層架構(gòu)、數(shù)據(jù)接口和數(shù)據(jù)庫角度完成系統(tǒng)概要設(shè)計,并基于Django框架和前端JQuery、vue.js、Ajax等

3、技術(shù)實現(xiàn)計算、報警配置,數(shù)據(jù)結(jié)果展示等功能。接著,建立知識庫指標(biāo)體系和計算系統(tǒng),以有效度量知識庫數(shù)據(jù)及效果,建立知識庫數(shù)據(jù)監(jiān)控系統(tǒng),以保證應(yīng)用數(shù)據(jù)穩(wěn)定性和產(chǎn)品服務(wù)穩(wěn)定性,建立知識庫例行評估系統(tǒng),定期抽樣數(shù)據(jù)對其進行準(zhǔn)確的分析評估。
  目前本平臺已建立較為完善的數(shù)據(jù)指標(biāo)體系,支持對kgbase、scan、userbase、streaming_ds、hdfs、ftp等7種數(shù)據(jù)源類型,kbjson、jsonld等4種數(shù)據(jù)格式進行檢測,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論