版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第1頁(yè)共3頁(yè)數(shù)據(jù)挖掘試卷數(shù)據(jù)挖掘試卷課程代碼:課程代碼:C0204413C0204413課程:課程:數(shù)據(jù)挖掘數(shù)據(jù)挖掘A卷一、判斷題(每題一、判斷題(每題1分,分,10分)分)1.從點(diǎn)作為個(gè)體簇開(kāi)始,每一步合并兩個(gè)最接近的簇,這是一種分裂的層次聚類方法。()2.數(shù)據(jù)挖掘的目標(biāo)不在于數(shù)據(jù)采集策略,而在于對(duì)已經(jīng)存在的數(shù)據(jù)進(jìn)行模式的發(fā)掘。()3.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()4.當(dāng)兩個(gè)點(diǎn)之間的鄰近度取它
2、們之間距離的平方時(shí),Ward方法與組平均非常相似。()5.DBSCAN是相對(duì)抗噪聲的,并且能夠處理任意形狀和大小的簇。()6.屬性的性質(zhì)不必與用來(lái)度量他的值的性質(zhì)相同。()7.全鏈對(duì)噪聲點(diǎn)和離群點(diǎn)很敏感。()8.對(duì)于非對(duì)稱的屬性,只有非零值才是重要的。()9.K均值可以很好的處理不同密度的數(shù)據(jù)。()10.單鏈技術(shù)擅長(zhǎng)處理橢圓形狀的簇。()二、選擇題(每題二、選擇題(每題2分,分,30分)分)1.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促
3、使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A.分類B.聚類C.關(guān)聯(lián)分析D.主成分分析2.()將兩個(gè)簇的鄰近度定義為不同簇的所有點(diǎn)對(duì)鄰近度的平均值,它是一種凝聚層次聚類技術(shù)。A.MIN(單鏈)B.MAX(全鏈)C.組平均D.Ward方法3.數(shù)據(jù)挖掘的經(jīng)典案例“啤酒與尿布試驗(yàn)”最主要是應(yīng)用了()數(shù)據(jù)挖掘方法。A分類B預(yù)測(cè)C關(guān)聯(lián)規(guī)則分析D聚類4.關(guān)于K均值和DBSCAN的比較,以下說(shuō)法不正確的是()A.K均值丟棄被它識(shí)別為噪聲的對(duì)象,而
4、DBSCAN一般聚類所有對(duì)象。B.K均值使用簇的基于原型的概念,DBSCAN使用基于密度的概念。C.K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀的簇D.K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并有重疊的簇5.下列關(guān)于Ward’sMethod說(shuō)法錯(cuò)誤的是:()A.對(duì)噪聲點(diǎn)和離群點(diǎn)敏感度比較小B.擅長(zhǎng)處理球狀的簇C.對(duì)于Ward方法,兩個(gè)簇的鄰近度定義為兩個(gè)簇合并時(shí)導(dǎo)致的
5、平方誤差D.當(dāng)兩個(gè)點(diǎn)之間的鄰近度取它們之間距離的平方時(shí),Ward方法與組平均非常相似6.下列關(guān)于層次聚類存在的問(wèn)題說(shuō)法正確的是:()A.具有全局優(yōu)化目標(biāo)函數(shù)B.GroupAverage擅長(zhǎng)處理球狀的簇C.可以處理不同大小簇的能力D.Max對(duì)噪聲點(diǎn)和離群點(diǎn)很敏感7.下列關(guān)于凝聚層次聚類的說(shuō)法中,說(shuō)法錯(cuò)誤的事:()A.一旦兩個(gè)簇合并,該操作就不能撤銷B.算法的終止條件是僅剩下一個(gè)簇C.空間復(fù)雜度為??2mOD.具有全局優(yōu)化目標(biāo)函數(shù)8.規(guī)則牛
6、奶,尿布→啤酒的支持度和置信度分別為:()題目一二三四五六七八九十總成績(jī)復(fù)核得分閱卷教師數(shù)學(xué)與信息科學(xué)學(xué)院學(xué)院專業(yè)級(jí)班姓名:學(xué)號(hào):2013—2014學(xué)年春季學(xué)期期末考試試題。學(xué)年春季學(xué)期期末考試試題。密封線第3頁(yè)共3頁(yè)4.什么是決策樹(shù)?如何用決策樹(shù)進(jìn)行分類?5.簡(jiǎn)述ID3算法的基本思想及其主算法的基本步驟四、四、算法題(每題算法題(每題10分,分,20分)分)1.由下圖已給出的距離矩陣,將Max用于6個(gè)點(diǎn)樣本數(shù)據(jù)集,畫出層次聚類的樹(shù)狀圖
7、?P1P2P3P4P5P6P10.000.240.220.370.340.23P20.240.000.140.200.130.25P30.220.140.000.150.280.11P40.370.200.150.000.290.22P50.340.130.280.290.000.39P60.230.250.110.220.390.002.假設(shè)數(shù)據(jù)挖掘的任務(wù)是將如下的8個(gè)點(diǎn)(用(xy)代表位置)聚類為3個(gè)類:X1(210)、X2(25)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 期末考試題
- 吉首大學(xué)通信原理期末考試期末考試題庫(kù)
- plc期末考試題
- 商法期末考試題
- 底盤期末考試題
- 民法期末考試題
- 數(shù)據(jù)庫(kù)期末考試題b
- 電路期末考試題
- 數(shù)據(jù)結(jié)構(gòu)期末考試題及答案
- javaweb期末考試題寶典
- 期末考試題答案
- sql數(shù)據(jù)庫(kù)期末考試題及答案
- 電視策劃期末考試題
- 電路分析a期末考試題
- 中職語(yǔ)文期末考試題
- 大學(xué)計(jì)算機(jī)基礎(chǔ)期末考試題
- 數(shù)學(xué)建模期末考試題
- 數(shù)字邏輯期末考試題
- 2015談判技巧期末考試題
- 網(wǎng)絡(luò)信息檢索期末考試題
評(píng)論
0/150
提交評(píng)論