異構的語義Web環(huán)境下Ontology匹配問題的研究.pdf_第1頁
已閱讀1頁,還剩132頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、互聯(lián)網是人類到目前為止構建的一個最大的信息庫,全世界的用戶都可以在Web上提供內容.當越來越多的人開始使用互聯(lián)網時,Web上的數(shù)據開始以指數(shù)級規(guī)模增長,Web上的資源與服務也越來越豐富.未來Web的發(fā)展方向將是一個人和計算機"共存"的世界:智能agent代表其所有者,通過與Web上的各種服務和軟件agent的交互,代替所有者在 Web上執(zhí)行各種復雜操作. 現(xiàn)階段 Web 上的絕大部分內容都是為人的閱讀設計的,現(xiàn)有的軟件agent

2、還不能很好地集成Web上的各種頁面和服務.Web的簡單結構和匱乏語義極大地限制了 Web的進一步發(fā)展和應用,傳統(tǒng)Web很快就達到了它的臨界點,語義Web成為了未來 Web發(fā)展的方向. 通過給 Web 數(shù)據附加語義,理論上 Ontology 是一個語義Web上數(shù)據互操作的很好的解決方案.然而,在實際的Web環(huán)境中,語義異構或者說Ontology異構仍然是語義Web上一個不可回避的問題.語義的方法把Web上數(shù)據的異構性簡化為Onto

3、logy之間的異構性,從而向機器之間的相互操作前進了一大步,但在達到最終目標之前還存在著一個障礙.任何試圖改進語義Web互操作性的努力都最終地落在了協(xié)調不同系統(tǒng)之間的不同 Ontology上.這種協(xié)調通常能通過自動或者半自動地匹配Ontology達到.這篇論文的工作就是為了解決語義集成過程中必然會出現(xiàn)的Ontology匹配問題. 本文將主要研究在異構的語義Web的環(huán)境下,不同的Ontology之間的互操作問題.為了達成Ontol

4、ogy之間的相互操作,必須尋找Ontology之間的匹配關系.本文創(chuàng)造性地提出了基于數(shù)據實例分類的匹配模型DICM,使用多策略的文本分類技術,把Ontology的匹配問題歸結為Ontology數(shù)據實例的分類問題,為異構的語義互操作問題提供了一條創(chuàng)新的可靠的解決途徑.本文全面分析了Ontology匹配過程中可能出現(xiàn)的問題,然后對其中的三個問題進行了深入研究,包括Ontology概念結點的1-1匹配、Ontology屬性的1-1匹配以及On

5、tology元素的1-n匹配和層次Ontology的匹配問題.我們設計并實現(xiàn)了一個實驗平臺SIMON,這個基于多策略學習的Ontology匹配系統(tǒng)被成功地運用于歐洲委員會信息社會總司的eTEN項目上(No.C510711).在該平臺上,我們進行了大量的對比實驗,實驗結果驗證了本文提出的模型和算法的有效性. 本文的貢獻和創(chuàng)新性工作主要體現(xiàn)在以下幾個方面: 1.本文從對Ontology的數(shù)據實例進行分類的角度構建Ontolo

6、gy匹配的體系結構,為異構的Ontology匹配提供了一個創(chuàng)新的、可操作的模型DICM.在該模型的基礎上,建立了一個基于Ontology匹配的語義互操作系統(tǒng)SIMON以及用于測試匹配系統(tǒng)的數(shù)據實例庫DIBOM,并在一些實際的應用領域中取得了良好的匹配效果. 2.本文使用多策略的匹配學習方法尋找Ontology之間的匹配關系.我們的匹配學習方法盡量充分地并且分層次地挖掘數(shù)據實例當中隱含的信息,包括實例名、實例的內部特征以及實例之間

7、的關聯(lián)特征.我們在系統(tǒng)中除了使用通常的文本分類方法如樸素貝葉斯分類器來挖掘數(shù)據實例內部的分類匹配信息外,系統(tǒng)還引入一階邏輯學習算法FOIL來分析數(shù)據實例之間的語義聯(lián)系.為了結合單一分類器的結果,我們提出了創(chuàng)新的匹配委員會方法--最突出的冠軍BOC方法,從而能夠很好的累積單一分類器的正確匹配. 3.本文提出了一個完整的Ontology匹配系統(tǒng)的范例.由于我們擁有真實完整的數(shù)據實例庫DIBOM,使得我們不但能解決Ontology之間

8、概念結點的匹配問題,并且可以進一步深入地研究Ontology屬性匹配問題.針對屬性匹配的訓練樣本相對較少、對分類算法的精確度要求高的特點,我們把具有高分類精度的SVM算法引入到了DICM模型中;針對不同的屬性類型,我們提出了匹配搜索器的概念.匹配搜索器以插件的形式存在,使得屬性匹配系統(tǒng)高度模塊化,易于共享及擴充;針對特殊的對象類型屬性,我們提出了基于一階邏輯的解決方案FOOPM. 4.除了解決簡單的Ontology元素的1-1匹

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論