版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)據(jù)流分類技術是數(shù)據(jù)流挖掘中的重要組成部分。然而在許多實際應用中,數(shù)據(jù)的不確定性是普遍存在的,并且隨著數(shù)據(jù)量的急劇增加,傳統(tǒng)的集中式的分類方法已經(jīng)不能有效地學習這樣的海量數(shù)據(jù)。面向不確定數(shù)據(jù)流的分類面臨如下的挑戰(zhàn):(1)如何對不確定流數(shù)據(jù)進行有效的分類處理;(2)對數(shù)據(jù)流概念漂移的檢測和處理;(3)如何利用分布式算法解決大數(shù)據(jù)的學習問題。
基于此,本文對于具有概念漂移的不確定數(shù)據(jù)流分類問題展開了以下研究工作:
首先,
2、了解不確定數(shù)據(jù)流產(chǎn)生的背景及特點,之后研讀并掌握已有的不確定數(shù)據(jù)的分類算法以及數(shù)據(jù)流分類算法的核心思想。其次,利用MapReduce技術對大矩陣運算進行優(yōu)化,提出了能夠滿足于大量數(shù)據(jù)處理的分布式極限學習機(Distributed ExtremeLearning Machine,DELM),使得傳統(tǒng)集中式的極限學習機(Extreme LearningMachine,ELM)能夠以更高的效率來適用于大規(guī)模流數(shù)據(jù)處理。再次,針對不確定數(shù)據(jù)流分
3、類問題,提出了基于分布式極限學習機的加權集成分類算法(Weighted EnsembleClassifier based on Distributed ELM,WE-DELM)。該算法首先建立不確定數(shù)據(jù)模型,將不確定數(shù)據(jù)通過建立可能世界模型的方式轉(zhuǎn)換為確定數(shù)據(jù)的處理,并且可以根據(jù)各個基分類器的分類結果動態(tài)的調(diào)整基分類器的權值,使得在發(fā)生概念漂移時,能夠刪除舊的不再適應新概念的基分類器,同時重新建立能夠更加快速準確地收斂于新概念的分類器。
4、然后,根據(jù)實際應用中數(shù)據(jù)流蘊含的概念往往會有一些往復出現(xiàn)的特點,基于WE-DELM算法提出了基于概念緩沖的加權集成分布式極限學習機算法(Concept BufferWeighted Ensemble Classifier based on Distributed ELM,CBWE-DELM),該方法有效的避免了已有的分類算法一般僅存儲當前的概念,當新概念發(fā)生時模型每次都需要重新學習的缺點,更加適用于有概念往復現(xiàn)象的數(shù)據(jù)流的學習。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于極限學習機的不確定數(shù)據(jù)分類算法.pdf
- 基于極限學習機的不確定XML文檔分類的研究與實現(xiàn).pdf
- 不確定數(shù)據(jù)流的分布并行Skyline查詢處理技術研究.pdf
- 基于密度的不確定數(shù)據(jù)流聚類算法的研究與實現(xiàn).pdf
- 不確定數(shù)據(jù)流中頻繁數(shù)據(jù)挖掘研究.pdf
- 不確定數(shù)據(jù)流環(huán)境下聚類算法的研究與實現(xiàn).pdf
- 基于滑動窗口的不確定數(shù)據(jù)流聚類算法研究.pdf
- 不確定數(shù)據(jù)流數(shù)據(jù)庫系統(tǒng)的研究.pdf
- 不確定數(shù)據(jù)流查詢處理算法的研究.pdf
- 不確定數(shù)據(jù)聚集查詢的分布式處理算法.pdf
- 面向不確定數(shù)據(jù)流的聚類算法分析.pdf
- 異構分布式數(shù)據(jù)流分類方法研究.pdf
- 不確定數(shù)據(jù)流中頻繁模式挖掘算法的研究.pdf
- 面向不確定數(shù)據(jù)流的頻繁模式挖掘算法研究.pdf
- 面向不確定數(shù)據(jù)流的聚類和模式挖掘技術研究.pdf
- 分布式數(shù)據(jù)流的查詢處理技術.pdf
- 基于極限學習機的XML文檔分類的研究與實現(xiàn).pdf
- 分布式數(shù)據(jù)流查詢處理技術的研究.pdf
- 基于概率密度網(wǎng)格結構的不確定數(shù)據(jù)流聚類算法研究.pdf
- 分布式數(shù)據(jù)流負載管理技術研究.pdf
評論
0/150
提交評論