考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩104頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、風(fēng)險(xiǎn)決策中廣泛存在著具有如下特征的一類問題,即風(fēng)險(xiǎn)決策者首先需要建立歷史數(shù)據(jù)樣本與自然狀態(tài)之間的依賴關(guān)系,然后根據(jù)該依賴關(guān)系估計(jì)一個(gè)新的數(shù)據(jù)樣本所對應(yīng)自然狀態(tài)的出現(xiàn)概率,最后建立風(fēng)險(xiǎn)決策模型,以最大化收益函數(shù)(或最小化風(fēng)險(xiǎn)損失函數(shù))為目標(biāo)選擇最優(yōu)行動方案。從建立歷史數(shù)據(jù)樣本與自然狀態(tài)的依賴關(guān)系這一意義上,可以將這類風(fēng)險(xiǎn)決策問題歸納為數(shù)據(jù)挖掘中的分類問題,因而數(shù)據(jù)挖掘中的各種分類方法可以應(yīng)用于該類風(fēng)險(xiǎn)決策問題。由于分類的高效性和準(zhǔn)確性對于

2、風(fēng)險(xiǎn)決策具有關(guān)鍵性影響,因此分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究具有重要的理論和現(xiàn)實(shí)意義。 已有的相關(guān)研究主要從分類方法及其應(yīng)用的角度考慮風(fēng)險(xiǎn)決策問題。事實(shí)上,在應(yīng)用各種數(shù)據(jù)挖掘技術(shù)前,探索了解數(shù)據(jù)的特性將對挖掘結(jié)果有重要甚至關(guān)鍵性的影響。在分類問題中,特征變量異質(zhì)性是一種重要的數(shù)據(jù)特性,對于分類方法的應(yīng)用結(jié)果具有顯著影響。因此,本文主要研究考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策問題中的應(yīng)用。研究目的在于探索數(shù)據(jù)中存在的特征異

3、質(zhì)性這一數(shù)據(jù)特性,并提出相應(yīng)的解決方法以提高分類的準(zhǔn)確性,使分類方法能夠更好地為風(fēng)險(xiǎn)決策提供支持。 本文從第一章到第六章的內(nèi)容安排如下: 第一章概述了本文的研究背景,回顧了分類方法及其在風(fēng)險(xiǎn)決策問題中的相關(guān)研究和分類問題中特征變量異質(zhì)性的研究現(xiàn)狀,說明了本文的研究內(nèi)容和研究意義。 第二章首先對分類問題進(jìn)行簡要介紹,然后概述分類問題中的特征變量相關(guān)性和特征變量選擇問題。在此基礎(chǔ)上,根據(jù)一系列理論和實(shí)際應(yīng)用研究對特征

4、變量異質(zhì)性的概念進(jìn)行描述。由于特征變量異質(zhì)性無法從數(shù)據(jù)樣本集合中直接觀察和測度,本章基于薈萃分析的基本思想,提出了一種利用全局特征變量選擇和數(shù)據(jù)樣本集合隨機(jī)劃分的方法來測度特征變量異質(zhì)性的方法。在一系列基準(zhǔn)數(shù)據(jù)集和人工構(gòu)造的混合數(shù)據(jù)集上的實(shí)驗(yàn)計(jì)算結(jié)果說明了該測度方法的有效性。 第三章主要考察特征變量異質(zhì)性對分類方法效果的影響。本章首先對特征變量異質(zhì)性的影響進(jìn)行簡要分析,然后通過實(shí)證研究說明分類問題中存在的特征變量異質(zhì)性對分類方法

5、的準(zhǔn)確率具有較為顯著的影響。本章采用的分類方法為一種將logistic回歸與支持向量機(jī)集成的分類方法,該方法的主要思想是應(yīng)用logistic回歸的輸出概率為支持向量機(jī)提供支持信息,以提高分類判別準(zhǔn)確性。實(shí)證研究以企業(yè)財(cái)務(wù)困境預(yù)測這一風(fēng)險(xiǎn)管理和決策問題為背景,通過比較考慮特征變量異質(zhì)性前后的分類預(yù)測準(zhǔn)確率,說明了在存在特征變量異質(zhì)性的分類問題中,考慮特征變量異質(zhì)性有利于提高分類方法的準(zhǔn)確率。 第四章提出了一種基于因子分析和聚類分析

6、的分類策略,該策略的基本思想是首先將原始的特征變量轉(zhuǎn)化為新的特征變量,使得新的特征變量能夠體現(xiàn)出原始特征變量在數(shù)據(jù)樣本空間中的異質(zhì)性,然后通過聚類分析得到各個(gè)具有特征變量同質(zhì)性的樣本子集,并在每個(gè)樣本子集中分別建立相應(yīng)的分類模型,從而減小特征變量異質(zhì)性對分類方法準(zhǔn)確率的影響。對于一個(gè)未知類標(biāo)記樣本,該分類策略首先將其轉(zhuǎn)化為因子得分向量,然后將該因子得分向量按照最近鄰規(guī)則劃分到與之最近的樣本子集合中,最后利用該樣本子集合中的分類模型進(jìn)行分

7、類。在一系列基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)計(jì)算結(jié)果說明了該分類策略的有效性。 第五章提出了一種考慮特征變量異質(zhì)性且具有增量式學(xué)習(xí)特性的分類方法,可有效應(yīng)用于一類具有特征變量異質(zhì)性且需要決策者利用分類方法進(jìn)行在線實(shí)時(shí)風(fēng)險(xiǎn)決策的問題。該方法首先利用基于網(wǎng)格的有指導(dǎo)聚類對數(shù)據(jù)樣本集合進(jìn)行劃分,從而得到若干數(shù)據(jù)簇,且每個(gè)數(shù)據(jù)簇中數(shù)據(jù)樣本點(diǎn)的類標(biāo)記相同。在去除異常數(shù)據(jù)點(diǎn)后,該方法計(jì)算各個(gè)數(shù)據(jù)簇的特征變量相關(guān)性,并將該相關(guān)性作為距離測度中各特征變量的權(quán)

8、重,應(yīng)用最近鄰方法進(jìn)行分類。本章最后將該分類方法應(yīng)用于一系列基準(zhǔn)數(shù)據(jù)集和市場營銷中的顧客確定問題,實(shí)證結(jié)果說明了該方法的有效性。 第六章總結(jié)本文的工作,歸納本文的主要?jiǎng)?chuàng)新點(diǎn),指出目前本文研究的局限,并根據(jù)已取得的研究結(jié)果對未來進(jìn)一步研究的問題進(jìn)行思考。 本文工作的主要?jiǎng)?chuàng)新點(diǎn)如下: (1)提出了一種有效的特征變量異質(zhì)性的測度方法,該方法可用于探索分類問題中存在的特征變量異質(zhì)性,為解決分類問題提供策略性的信息。

9、 (2)提出了一種基于logistic回歸與支持向量機(jī)集成的分類方法,該方法利用logistic回歸得到的后驗(yàn)概率信息對支持向量機(jī)的輸出結(jié)果進(jìn)行修正,能夠有效提高傳統(tǒng)支持向量機(jī)的分類準(zhǔn)確性。 (3)提出了一種有效的考慮特征變量異質(zhì)性的分類策略,該策略將具有特征變量異質(zhì)性的數(shù)據(jù)樣本集合劃分為若干同質(zhì)性的子集合,然后通過在各個(gè)子集合中分別建立分類模型來提高分類的準(zhǔn)確性。 (4)提出了一種具有增量式學(xué)習(xí)特性的分類方法,該方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論