2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、畢業(yè)論文文獻(xiàn)綜述畢業(yè)論文文獻(xiàn)綜述信息與計(jì)算科學(xué)信息與計(jì)算科學(xué)基于基于matlabmatlab的數(shù)據(jù)挖掘技術(shù)研究的數(shù)據(jù)挖掘技術(shù)研究數(shù)據(jù)挖掘是用于大規(guī)模數(shù)據(jù)處理的一種新的思維方式和技術(shù)手段,他是在現(xiàn)實(shí)生活中各種數(shù)據(jù)量呈指數(shù)級(jí)不斷增長(zhǎng),以及以數(shù)據(jù)庫(kù)(database)技術(shù)為核心的信息技術(shù)逐漸成熟的背景下產(chǎn)生的。數(shù)據(jù)挖掘可以幫助用戶發(fā)現(xiàn)影藏在大型數(shù)據(jù)庫(kù)中的規(guī)律和模式,它融合了人工智能(artificialintelligence)、統(tǒng)計(jì)(sta

2、tistics)、機(jī)器學(xué)習(xí)(nachinelearning)、模式識(shí)別(patternrecognition)和數(shù)據(jù)庫(kù)等多種學(xué)科的理論、方法與技術(shù),已經(jīng)在商業(yè)、企業(yè)、政府、科研及體育等多種不同類型的組織機(jī)構(gòu)和領(lǐng)域中獲得了非常廣泛的應(yīng)用。即使在日常生活中,數(shù)據(jù)挖掘技術(shù)也已經(jīng)潛移默化地參與到人們的生活質(zhì)量改善過(guò)程中。數(shù)據(jù)挖掘有很多種技術(shù)和計(jì)算方法,包括決策樹(shù)方法(decisiontree)、人工神經(jīng)網(wǎng)絡(luò)方法(artificialneural

3、metwk,ANN)、聚類分析、模糊集合方法、遺傳算法(geicalgithm)、模擬退火算法(simulatedannealingSA)、進(jìn)化式程序設(shè)計(jì)(evolutionaryprogramming)等。這里主要介紹一下聚類分析、遺傳算法和人工神經(jīng)網(wǎng)絡(luò)算法。聚類分析也稱無(wú)監(jiān)督學(xué)習(xí),或無(wú)教師學(xué)習(xí),或無(wú)指導(dǎo)學(xué)習(xí),因?yàn)楹头诸悓W(xué)習(xí)相比,聚類的樣本沒(méi)有標(biāo)記,需要由聚類學(xué)習(xí)算法來(lái)自動(dòng)確定。聚類分析是研究如何在沒(méi)有訓(xùn)練的條件下把樣本劃分為若干。聚

4、類(clustering)是對(duì)物理的或抽象的樣本集合分組的過(guò)程。聚類分析有很多種目標(biāo),但都涉及把一個(gè)樣本集合分組或分割為子集或簇(cluster)。從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過(guò)數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法。聚類分析主要針對(duì)的數(shù)據(jù)類型包括區(qū)間標(biāo)度變量、二值變量、標(biāo)稱變量、序數(shù)型變量、比例標(biāo)度型變量以及由這些變量類型構(gòu)成的復(fù)合類型。聚類算法應(yīng)具有以下幾個(gè)特點(diǎn):1處理不同字段類型的能力;2可伸縮性;3處理高維數(shù)據(jù)的能力;4發(fā)現(xiàn)具有任意簇的形

5、狀的族類能力;5能夠處理異常數(shù)據(jù);6對(duì)數(shù)據(jù)順序的不敏感性;7輸入?yún)?shù)對(duì)領(lǐng)域知識(shí)的弱依賴性;8聚類結(jié)果的可解釋性和實(shí)用性;9增加限制條件后的聚類分析能力?;蛩惴ㄆ鹪从趯?duì)生物系統(tǒng)進(jìn)行的計(jì)算機(jī)模擬研究,是一種受生物進(jìn)化啟發(fā),使用計(jì)算機(jī)模擬生物進(jìn)化的學(xué)習(xí)方法?;蛩惴ㄊ悄M生物進(jìn)化過(guò)程的計(jì)算模型,是自然遺傳學(xué)與計(jì)算機(jī)科學(xué)互相結(jié)合、互相滲透而形成的新的計(jì)算方法?;蛩惴ǖ淖畲髢?yōu)點(diǎn)是問(wèn)題求解與初始條件無(wú)關(guān),搜索最優(yōu)解的能力極強(qiáng)。從數(shù)學(xué)的角度看,基

6、因算法是一種概率型搜索算法:從工程學(xué)角度看,它是一種自適應(yīng)的迭代尋優(yōu)過(guò)程?;蛩惴ㄐ枰瓿蓛煞N數(shù)據(jù)轉(zhuǎn)換,算法實(shí)施之前進(jìn)行從表現(xiàn)型到基因型的轉(zhuǎn)換,即將搜索空間中的參數(shù)或可行解轉(zhuǎn)化成遺傳空間中的染色體或個(gè)體,完成編碼操作;在算法[7]吳燕,科技文檔的層次聚類分析[J]商業(yè)文化.社會(huì)經(jīng)緯,2008(1):P353354[8]孟姍姍,全國(guó)地區(qū)小康和現(xiàn)代化指數(shù)的層次聚類分析[J][9]張利華,彭海燕,余淑媛,量子克隆遺傳算法的多用戶檢測(cè)技術(shù)研究[

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論