2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩84頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著數(shù)據(jù)采集和存儲技術(shù)的飛速發(fā)展,很多領(lǐng)域都積累了大量的數(shù)據(jù)。為了從數(shù)據(jù)中發(fā)現(xiàn)有價值的知識和規(guī)律,人們結(jié)合數(shù)據(jù)庫、統(tǒng)計學(xué)及機(jī)器學(xué)習(xí)等技術(shù),提出數(shù)據(jù)挖掘來解決這一難題。聚類分析技術(shù)是數(shù)據(jù)挖掘中的經(jīng)典內(nèi)容,是各學(xué)科研究的重要工具。 本論文在廣泛閱讀相關(guān)文獻(xiàn)、深入了解聚類算法的原理與應(yīng)用的基礎(chǔ)上,在算法的改進(jìn)、應(yīng)用上做了如下工作: (1)針對經(jīng)典的聚類算法普遍存在的形狀依賴、合理的類別參數(shù)選擇及對噪聲敏感等問題,聯(lián)合數(shù)

2、值歸約、基于壓縮數(shù)據(jù)的變種K-means算法和加權(quán)投票法,同時結(jié)合RMSSTD&RS聚類有效性指標(biāo)提出了一個自動聚類算法。較好的解決了帶噪聲的任意形狀的大數(shù)據(jù)集的聚類問題,并具有一定的增量處理能力。 (2)傳統(tǒng)的基于密度的算法和經(jīng)典的CLIQUE子空間聚類算法都是從尋找數(shù)據(jù)的密集區(qū)域入手去解決問題。本文從稀疏區(qū)域的角度出發(fā)進(jìn)行了子空間聚類的嘗試,提出了基于競爭的修剪方式和形式化的“投影尋蹤”搜索策略來得到合適的子空間并生成類。實(shí)

3、驗(yàn)證明在控制計算復(fù)雜度的同時提高了算法的精度,在對輸入?yún)?shù)的魯棒性上也取得了較好的效果。 (3)針對具體的目標(biāo)識別問題。首先對幾個具有一定分類特性的特征進(jìn)行了簡單的融合;接著在本文提出的子空間聚類算法基礎(chǔ)上,采用基于競爭的修剪方式得到了新的易于區(qū)分的特征;最后用確定的類別參數(shù)代替聚類有效性指標(biāo)作為投票法的類融合停止準(zhǔn)則,建立了分類器的多中心表達(dá)模型,并結(jié)合兩級糾錯訓(xùn)練模式設(shè)計了合理有效的識別分類器,在分類測試中取得了較好的效果。

4、 本文的貢獻(xiàn)和創(chuàng)新主要體現(xiàn)在上述兩個算法的改進(jìn)和應(yīng)用上: (1)完成了自動聚類算法,其創(chuàng)新點(diǎn)體現(xiàn)在:一,結(jié)合多種方法較好的解決了傳統(tǒng)聚類算法遇到的問題;二,改進(jìn)了傳統(tǒng)的k-means算法使之適應(yīng)在壓縮數(shù)據(jù)上進(jìn)行聚類操作;三,對投票法進(jìn)行了加權(quán)處理以適應(yīng)壓縮數(shù)據(jù)。 (2)針對高維數(shù)據(jù)的聚類問題提出了從稀疏區(qū)域著手的基于密度和網(wǎng)格的子空間聚類算法,創(chuàng)新點(diǎn)體現(xiàn)在:一,提出了基于競爭的修剪方式;二,提出了一種形式化的“投

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論