版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、西南農(nóng)業(yè)大學(xué)碩士學(xué)位論文基于數(shù)據(jù)元標(biāo)準(zhǔn)與粗糙集的數(shù)據(jù)挖掘技術(shù)研究姓名:鄭濤申請學(xué)位級別:碩士專業(yè):農(nóng)業(yè)機械化工程指導(dǎo)教師:左源瑞20050501西南農(nóng)業(yè)大學(xué)碩七學(xué)位論文摘要性分析能力,而且無需提供除問題所需處理的數(shù)據(jù)集合之外的任何先驗信息,在處理不確定、冗余、噪聲、動態(tài)數(shù)據(jù)等方面有著較強的應(yīng)用優(yōu)勢,已成為數(shù)據(jù)挖掘領(lǐng)域知識獲取的重要途徑。這一部分首先討論了粗糙集的基本概念,包括知識與不可分辨關(guān)系、上近似集與F近似集、知識的約簡和核、知識的
2、依賴度以及屬性重要性等,在此基礎(chǔ)上研究了知識表達(dá)系統(tǒng)、決策表以及決策規(guī)則的產(chǎn)生。研究的重點和難點是決策表的離散化及決策表約簡。犰策表約簡是粗糙集理論的核心內(nèi)容之一包括屬性約簡和屬性值約簡。通常情況下,在數(shù)據(jù)隨機采集得到的近似空間中冗余屬性和屬性值是普遍存在的,一方面是資源的浪費,同時也影響產(chǎn)生的決策規(guī)則的n:確性和簡潔性。因此決策表約簡是十分重要的。本文重點研究了決策表約簡算法,對常見的屬性約簡算法如差別矩陣方法、基于互信息的MIBAR
3、K算法等進(jìn)行了分析對比,在此基礎(chǔ)上提出了基于屬性重要性和信息熵的屬性約簡算法。該算法的思想就是先選擇盡可能多的屬性進(jìn)入候選屬性集,從而保證了對條件屬性的約簡不失真,最大限度保留了原決策表中的客觀信息;而后判斷條件屬性之間的互信息,如果互信息很大的話說明兩者之間存在較強的依賴關(guān)系應(yīng)該在不影響分類質(zhì)量的前提下將冗余屬性刪除,保證了約簡結(jié)果的簡潔性。第三、重點研究了基于數(shù)據(jù)元標(biāo)準(zhǔn)與粗糙集的數(shù)據(jù)挖掘技術(shù)。在對數(shù)據(jù)元標(biāo)準(zhǔn)、租糙集相關(guān)理論技術(shù)深入分
4、析的基礎(chǔ)上,提出了基于數(shù)據(jù)元標(biāo)準(zhǔn)與粗糙集的數(shù)據(jù)挖掘框架,并將數(shù)據(jù)元標(biāo)準(zhǔn)、粗糙集研究內(nèi)容應(yīng)用到數(shù)據(jù)挖掘框架中。該數(shù)據(jù)挖掘框架主要包括兩個階段的工作:一、基于數(shù)據(jù)元標(biāo)準(zhǔn)數(shù)據(jù)預(yù)處理是將不同領(lǐng)域、不同主題的數(shù)據(jù)源按照統(tǒng)一的數(shù)據(jù)元表示規(guī)范表示,形成具有統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)庫資源,進(jìn)而通過基于XMLSchema存儲交換格式形成一個數(shù)據(jù)共享的基本數(shù)據(jù)環(huán)境,然后根據(jù)領(lǐng)域?qū)<抑R從不同的數(shù)據(jù)資源中抽取出特定主題的數(shù)據(jù)形成有待于進(jìn)一步數(shù)據(jù)挖掘的特定主題數(shù)據(jù)庫
5、。二、基于粗糙集規(guī)則挖掘階段首先將經(jīng)過基于數(shù)據(jù)元標(biāo)準(zhǔn)數(shù)據(jù)預(yù)處理得到的主題數(shù)據(jù)庫進(jìn)行數(shù)據(jù)預(yù)處理,主要進(jìn)行缺失值補齊、數(shù)據(jù)離散歸一化等工作,形成目標(biāo)數(shù)據(jù)庫,然后根據(jù)提出的屬性約簡算法進(jìn)行數(shù)據(jù)集約簡,最后生成規(guī)則。通過兩個階段的工作實現(xiàn)了數(shù)據(jù)元標(biāo)準(zhǔn)與粗糙集在數(shù)據(jù)挖掘中的結(jié)合應(yīng)用。最后,本文通過一個基于數(shù)據(jù)元標(biāo)準(zhǔn)與粗糙集的農(nóng)業(yè)病害規(guī)則挖掘?qū)嵗龑η懊娴难芯績?nèi)容進(jìn)行了綜合評價,并討論了數(shù)據(jù)元標(biāo)準(zhǔn)在農(nóng)業(yè)信息化中的應(yīng)用。本文通過對數(shù)據(jù)元標(biāo)準(zhǔn)錄I粗糙集的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于粗糙集的數(shù)據(jù)挖掘技術(shù)研究.pdf
- 基于粗糙集的數(shù)據(jù)挖掘研究與應(yīng)用.pdf
- 基于粗糙集的數(shù)據(jù)挖掘算法研究.pdf
- 基于粗糙集理論的數(shù)據(jù)挖掘研究.pdf
- 基于粗糙集的時態(tài)數(shù)據(jù)挖掘研究.pdf
- 數(shù)據(jù)倉庫及基于粗糙集的數(shù)據(jù)挖掘研究.pdf
- 基于粗糙集的數(shù)據(jù)挖掘應(yīng)用研究
- 基于粗糙集的時間序列數(shù)據(jù)挖掘.pdf
- 基于粗糙集的大數(shù)據(jù)集挖掘算法研究與實現(xiàn).pdf
- 基于粗糙集的數(shù)據(jù)挖掘算法研究與實現(xiàn).pdf
- 基于粗糙集的數(shù)據(jù)挖掘算法研究與應(yīng)用.pdf
- 基于粗糙集的數(shù)據(jù)挖掘算法的研究與應(yīng)用.pdf
- 基于粗糙集的多維數(shù)據(jù)挖掘的研究與應(yīng)用.pdf
- 基于粗糙集理論的商業(yè)數(shù)據(jù)挖掘.pdf
- 基于粗糙集的數(shù)據(jù)挖掘應(yīng)用研究.pdf
- 基于粗糙集的CRM數(shù)據(jù)挖掘理論與方法研究.pdf
- 基于粗糙集的網(wǎng)格海量數(shù)據(jù)挖掘若干關(guān)鍵技術(shù)研究.pdf
- 基于粗糙集理論的數(shù)據(jù)挖掘算法的研究.pdf
- 基于粗糙集的數(shù)據(jù)挖掘?qū)傩约s簡算法研究.pdf
- 基于粗糙集的數(shù)據(jù)及文本挖掘方法研究.pdf
評論
0/150
提交評論