基于matlab的數(shù)據(jù)挖掘技術研究【文獻綜述】_第1頁
已閱讀1頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、畢業(yè)論文文獻綜述畢業(yè)論文文獻綜述信息與計算科學信息與計算科學基于基于matlabmatlab的數(shù)據(jù)挖掘技術研究的數(shù)據(jù)挖掘技術研究數(shù)據(jù)挖掘是用于大規(guī)模數(shù)據(jù)處理的一種新的思維方式和技術手段,他是在現(xiàn)實生活中各種數(shù)據(jù)量呈指數(shù)級不斷增長,以及以數(shù)據(jù)庫(database)技術為核心的信息技術逐漸成熟的背景下產(chǎn)生的。數(shù)據(jù)挖掘可以幫助用戶發(fā)現(xiàn)影藏在大型數(shù)據(jù)庫中的規(guī)律和模式,它融合了人工智能(artificialintelligence)、統(tǒng)計(sta

2、tistics)、機器學習(nachinelearning)、模式識別(patternrecognition)和數(shù)據(jù)庫等多種學科的理論、方法與技術,已經(jīng)在商業(yè)、企業(yè)、政府、科研及體育等多種不同類型的組織機構和領域中獲得了非常廣泛的應用。即使在日常生活中,數(shù)據(jù)挖掘技術也已經(jīng)潛移默化地參與到人們的生活質(zhì)量改善過程中。數(shù)據(jù)挖掘有很多種技術和計算方法,包括決策樹方法(decisiontree)、人工神經(jīng)網(wǎng)絡方法(artificialneural

3、metwk,ANN)、聚類分析、模糊集合方法、遺傳算法(geicalgithm)、模擬退火算法(simulatedannealingSA)、進化式程序設計(evolutionaryprogramming)等。這里主要介紹一下聚類分析、遺傳算法和人工神經(jīng)網(wǎng)絡算法。聚類分析也稱無監(jiān)督學習,或無教師學習,或無指導學習,因為和分類學習相比,聚類的樣本沒有標記,需要由聚類學習算法來自動確定。聚類分析是研究如何在沒有訓練的條件下把樣本劃分為若干。聚

4、類(clustering)是對物理的或抽象的樣本集合分組的過程。聚類分析有很多種目標,但都涉及把一個樣本集合分組或分割為子集或簇(cluster)。從統(tǒng)計學的觀點看,聚類分析是通過數(shù)據(jù)建模簡化數(shù)據(jù)的一種方法。聚類分析主要針對的數(shù)據(jù)類型包括區(qū)間標度變量、二值變量、標稱變量、序數(shù)型變量、比例標度型變量以及由這些變量類型構成的復合類型。聚類算法應具有以下幾個特點:1處理不同字段類型的能力;2可伸縮性;3處理高維數(shù)據(jù)的能力;4發(fā)現(xiàn)具有任意簇的形

5、狀的族類能力;5能夠處理異常數(shù)據(jù);6對數(shù)據(jù)順序的不敏感性;7輸入?yún)?shù)對領域知識的弱依賴性;8聚類結果的可解釋性和實用性;9增加限制條件后的聚類分析能力。基因算法起源于對生物系統(tǒng)進行的計算機模擬研究,是一種受生物進化啟發(fā),使用計算機模擬生物進化的學習方法?;蛩惴ㄊ悄M生物進化過程的計算模型,是自然遺傳學與計算機科學互相結合、互相滲透而形成的新的計算方法?;蛩惴ǖ淖畲髢?yōu)點是問題求解與初始條件無關,搜索最優(yōu)解的能力極強。從數(shù)學的角度看,基

6、因算法是一種概率型搜索算法:從工程學角度看,它是一種自適應的迭代尋優(yōu)過程?;蛩惴ㄐ枰瓿蓛煞N數(shù)據(jù)轉換,算法實施之前進行從表現(xiàn)型到基因型的轉換,即將搜索空間中的參數(shù)或可行解轉化成遺傳空間中的染色體或個體,完成編碼操作;在算法[7]吳燕,科技文檔的層次聚類分析[J]商業(yè)文化.社會經(jīng)緯,2008(1):P353354[8]孟姍姍,全國地區(qū)小康和現(xiàn)代化指數(shù)的層次聚類分析[J][9]張利華,彭海燕,余淑媛,量子克隆遺傳算法的多用戶檢測技術研究[

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論