版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)2.0的興起,利用集體智慧的協(xié)作式編輯系統(tǒng)被廣泛地用于知識(shí)管理中。維基系統(tǒng)就是這樣一個(gè)例子,其中維基百科就是流行的一種維基系統(tǒng)。維基百科是目前最大的免費(fèi)在線(xiàn)百科全書(shū),它是由廣大的志愿者來(lái)共同編輯的。維基百科具備以下作為一個(gè)潛在的語(yǔ)義數(shù)據(jù)源的特征:廣泛的知識(shí)覆蓋面、明確定義的結(jié)構(gòu)化信息和隨著世界知識(shí)變遷而變遷動(dòng)態(tài)更新的特點(diǎn)。語(yǔ)義維基是對(duì)維基的一種擴(kuò)展,利用語(yǔ)義萬(wàn)維網(wǎng)的技術(shù)對(duì)維基元素增加顯示的語(yǔ)義。 然而,盡管這種自由的、
2、協(xié)作式的編輯方式促成了維基百科的成功,但是這同時(shí)也帶來(lái)了一些問(wèn)題。尤其地,它會(huì)導(dǎo)致大量的標(biāo)注缺失和噪音標(biāo)注的問(wèn)題,這會(huì)影響到文章的內(nèi)容質(zhì)量和妨礙術(shù)語(yǔ)的收斂。當(dāng)前,低質(zhì)量的標(biāo)注不得不由一小批專(zhuān)家去修改,這也成為了一種效率的瓶頸。 同時(shí),這些專(zhuān)家也是做了大部分編輯工作的最活躍的貢獻(xiàn)者,對(duì)他們而言,這無(wú)非是一個(gè)巨大的負(fù)擔(dān)。語(yǔ)義維基百科也面臨同樣的問(wèn)題:缺少標(biāo)注的語(yǔ)義和語(yǔ)義標(biāo)注者。特別地,對(duì)一個(gè)普通用戶(hù)來(lái)說(shuō),要編輯一個(gè)高質(zhì)量的維基百科文
3、章,必須處理好當(dāng)前編輯的文章與系統(tǒng)現(xiàn)有的文檔集的關(guān)系。這就要求用戶(hù)對(duì)系統(tǒng)文檔集以及其包含的知識(shí)有一定的了解,在編輯語(yǔ)義維基時(shí)還要理解其潛在的語(yǔ)義技術(shù)。他們要面臨以下一些問(wèn)題: 1) 什么時(shí)候有必要提供一個(gè)超鏈接指向一個(gè)被引用的實(shí)體?如何正確定位到它? 2) 可以用哪些類(lèi)別標(biāo)簽來(lái)恰當(dāng)?shù)貥?biāo)識(shí)這篇文章? 3) 可以用什么信息盒模板來(lái)描述文章主題對(duì)象的屬性? 4) 在編輯語(yǔ)義維基百科的時(shí)候,實(shí)體之間是否有潛在的語(yǔ)
4、義關(guān)系? 如果存在,則應(yīng)該用什么謂詞來(lái)標(biāo)注關(guān)系的類(lèi)型? 在本課題中,試圖通過(guò)知識(shí)抽取與知識(shí)重用來(lái)幫助用戶(hù)回答以上這些問(wèn)題。知識(shí)抽取是知識(shí)重用的前提和依據(jù),而知識(shí)重用是知識(shí)抽?取的目的。受到協(xié)同過(guò)濾的思想的啟發(fā):根據(jù)相似用戶(hù)的評(píng)價(jià)行為來(lái)產(chǎn)生對(duì)當(dāng)前用戶(hù)的推薦。類(lèi)似地,通過(guò)標(biāo)注推薦的方式來(lái)實(shí)現(xiàn)知識(shí)重用。為了達(dá)到這個(gè)目的,首先要從當(dāng)前維基百科中的標(biāo)注的數(shù)據(jù)集中抽取有用的知識(shí)作為作推薦的依據(jù)或背景知識(shí),這些知識(shí)是結(jié)構(gòu)化或半結(jié)構(gòu)化的
5、實(shí)體語(yǔ)義特征,包括:實(shí)體的術(shù)語(yǔ)詞典、實(shí)體的類(lèi)型、實(shí)體之間的關(guān)系特征等。還將提出一個(gè)統(tǒng)一的標(biāo)注推薦算法框架來(lái)重用所抽取的知識(shí),并將這個(gè)知識(shí)重用方案應(yīng)用到當(dāng)前的維基百科的編輯中去。將展示原形系統(tǒng)EachWiki,它對(duì)維基百科提供了以下的推薦服務(wù):鏈接推薦、類(lèi)別推薦、信息盒推薦、以及關(guān)系推薦,通過(guò)這種方式,使得用戶(hù)在編輯維基百科時(shí)可以充分利用集體的智慧。這些推薦服務(wù)不但可以便利用戶(hù)編輯高質(zhì)量的維基百科知識(shí),還可以幫助構(gòu)筑語(yǔ)義維基百科。最后,通
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于維基百科的人物關(guān)系抽取研究.pdf
- 自動(dòng)抽取維基百科文本中的語(yǔ)義關(guān)系.pdf
- 基于中文維基百科的知識(shí)庫(kù)構(gòu)建.pdf
- 基于維基百科的語(yǔ)義比較.pdf
- 基于中文維基百科的文本擴(kuò)充.pdf
- 基于維基百科的漁業(yè)知識(shí)庫(kù)構(gòu)建研究.pdf
- 基于中文維基百科的語(yǔ)義知識(shí)挖掘相關(guān)研究.pdf
- 基于維基百科的搜索結(jié)果挖掘.pdf
- 中文網(wǎng)絡(luò)百科全書(shū)的知識(shí)傳播研究——以維基百科與互動(dòng)百科為例.pdf
- 水楊酸維基百科
- 維基百科不自由
- 維基百科知識(shí)的層次化體系構(gòu)建.pdf
- 維基百科上的語(yǔ)義搜索.pdf
- 基于中文維基百科的全文語(yǔ)義標(biāo)注系統(tǒng).pdf
- 基于維基百科的語(yǔ)義相關(guān)度計(jì)算研究.pdf
- 中文維基百科類(lèi)別推薦的研究.pdf
- 關(guān)于維基百科內(nèi)容質(zhì)量的研究.pdf
- 中文維基百科的結(jié)構(gòu)化信息抽取及詞語(yǔ)相關(guān)度計(jì)算.pdf
- 基于維基百科的評(píng)論主題詞聚類(lèi).pdf
- 基于維基百科的垂直搜索查詢(xún)擴(kuò)展問(wèn)題研究.pdf
評(píng)論
0/150
提交評(píng)論