不確定數(shù)據(jù)skyline查詢研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人類正處于一個(gè)被數(shù)據(jù)包圍的時(shí)代,數(shù)據(jù)在人類的生產(chǎn)生中扮演著越發(fā)重要的角色。隨著人們對(duì)于數(shù)據(jù)挖掘和管理技術(shù)的理解深入,同時(shí)隨著技術(shù)本身的不斷進(jìn)步,不確定數(shù)據(jù)越發(fā)受到研究者的重視。在許多現(xiàn)實(shí)應(yīng)用中,例如軍事、金融、電信等領(lǐng)域,數(shù)據(jù)普遍存在不確定性。除了不確定數(shù)據(jù)極其龐大的可能世界,不確定數(shù)據(jù)還有一個(gè)特點(diǎn)就是種類多,同一種查詢,不同的不確定數(shù)據(jù)類型,往往需要建立不同的查詢模型和算法。特別是不確定數(shù)據(jù)的Skyline查詢,為了避免建立索引花費(fèi)過(guò)

2、多時(shí)間開(kāi)銷,有學(xué)者針對(duì)離散型存在級(jí)不確定數(shù)據(jù)提出了基于概率約束空間的非索引裁剪算法,然而針對(duì)其它類型不確定數(shù)據(jù)的快速非索引裁剪辦法還沒(méi)有。
  同時(shí),本文在研究中還發(fā)現(xiàn),離散型不確定數(shù)據(jù)兩兩數(shù)據(jù)對(duì)象之間的誰(shuí)支配誰(shuí)的邏輯關(guān)系是確定的,且屬性值以大取優(yōu)還是以小取優(yōu)都不會(huì)影響到數(shù)據(jù)對(duì)象Skyline概率的計(jì)算;而針對(duì)連續(xù)型不確定數(shù)據(jù),由于其屬性取值是在一段區(qū)間上,因此兩兩不確定數(shù)據(jù)對(duì)象之間誰(shuí)支配誰(shuí)的邏輯關(guān)系不確定,此外,屬性值以大取優(yōu)還

3、是以小取優(yōu)會(huì)直接影響到數(shù)據(jù)對(duì)象Skyline概率的計(jì)算。
  本文針對(duì)不確定數(shù)據(jù)的Skyline查詢問(wèn)題,對(duì)基于概率約束空間思想的不確定數(shù)據(jù)Skyline查詢進(jìn)行了研究,主要體現(xiàn)在:
  1.針對(duì)已有的針對(duì)存在級(jí)離散型不確定數(shù)據(jù)的PCS算法進(jìn)行了分析,發(fā)現(xiàn)PCS算法在裁減數(shù)據(jù)對(duì)象的時(shí)候,因?yàn)槠浣⒆钚∴徑泳匦紊筛怕始s束空間的策略具有隨機(jī)性,容易出現(xiàn)裁剪區(qū)域粗糙的情況,導(dǎo)致在高維情況下裁剪效率降低,而且考慮到Skyline查

4、詢最終要返回給用戶可靠的結(jié)果,因此要盡可能避免所有返回給用戶的最小鄰接矩形內(nèi)的數(shù)據(jù)對(duì)象都是置信度小于閾值的數(shù)據(jù)對(duì)象,應(yīng)該保證每個(gè)最小鄰接矩形內(nèi)至少有一個(gè)置信度大于閾值的數(shù)據(jù)對(duì)象。本章針對(duì)PCS算法以上兩點(diǎn)做出了改進(jìn),通過(guò)增加最小鄰接矩形的自更新策略,并為所有內(nèi)部數(shù)據(jù)對(duì)象概率都小于閾值的最小鄰接矩形添加至少一個(gè)概率大于閾值的數(shù)據(jù)對(duì)象的辦法,使得算法在較高維的情況下,保持了查詢的效率和可靠性。
  2.針對(duì)連續(xù)性不確定數(shù)據(jù)的特點(diǎn),本文

5、首次提出了連續(xù)性不確定數(shù)據(jù)Skyline查詢研究要分為以小取優(yōu)和以大取優(yōu)兩種情況,并以指數(shù)分布不確定數(shù)據(jù)為例作出說(shuō)明。
  3.首次研究了指數(shù)分布不確定數(shù)據(jù)的Skyline查詢,并首次提出了服從指數(shù)分布的連續(xù)性不確定數(shù)據(jù)模型,推導(dǎo)了其概率Skyline計(jì)算原理。本文分別基于以大取優(yōu)和以小取優(yōu)兩種情況,給出了兩種情況下數(shù)據(jù)對(duì)象的支配概率、Skyline概率計(jì)算模型,最后針對(duì)兩種模型各自給出了基于概率約束空間思想裁剪非Skyline數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論