版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第十二章 第十二章 主成分分析 主成分分析主成分分分析也稱作主分量分析,是霍特林(Hotelling)在 1933 年首先提 出。主成分分析是利用降維的思想,在損失較少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化 為較少的綜合指標(biāo)。轉(zhuǎn)化生成的綜合指標(biāo)即稱為主成分,其中每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分互不相關(guān)。Stata 對(duì)主成分分析的主要內(nèi) 容包括:主成分估計(jì)、主成分分析的恰當(dāng)性(包括負(fù)偏協(xié)方差矩陣和負(fù)偏相關(guān)系數(shù)矩陣、KMO(Kaiser-
2、Meyer-Olkin)抽樣充分性、復(fù)相關(guān)系數(shù)、共同度等指標(biāo)測(cè)度) 、主成分的旋轉(zhuǎn)、預(yù)測(cè)、各種檢驗(yàn)、碎石圖、得分圖、載荷圖等。p j n i b a y ij j i ij , , 2 , 1 , , 2 , 1 , ' ? ? ? ? ? ? ?主成分的模型表達(dá)式為:p pj ii i idiagv vv v ip V V C? ? ? ? ? ??? ? ? ? ?? ??? ? ? ? ?? ? 2 1 2 1 ), ,
3、, , (01其中,a 稱為得分,b 稱為載荷。主成分分析主要的分析方法是對(duì)相關(guān)系數(shù)矩陣(或協(xié)方差矩陣)進(jìn)行特征值分析。Stata 中可以通過(guò)負(fù)偏相關(guān)系數(shù)矩陣、負(fù)相關(guān)系數(shù)平方和 KMO 值對(duì)主成分分析的恰當(dāng)性進(jìn)行分析。負(fù)偏相關(guān)系數(shù)矩陣即變量之間兩兩偏相關(guān)系數(shù)的負(fù)數(shù)。非對(duì)角線元素則為負(fù)的偏相關(guān)系數(shù)。如果變量之間存在較強(qiáng)的共性,則偏相關(guān)系數(shù)比較低。因此,如果矩陣中偏相關(guān)系數(shù)較高的個(gè)數(shù)比較多,說(shuō)明某一些變量與另外一些變量的相關(guān)性比較低,主成分
4、模型可能不適用。這時(shí),主成 分分析不能得到很好的數(shù)據(jù)約化效果。Kaiser-Meyer-Olkin 抽樣充分性測(cè)度也是用于測(cè)量變量之間相關(guān)關(guān)系的強(qiáng)弱的重要指標(biāo),是通過(guò)比較兩個(gè)變量的相關(guān)系數(shù)與偏相關(guān)系數(shù)得到的。KMO 介于 0 于 1 之間。KMO 越高,表明變量的共性越強(qiáng)。如果偏相關(guān)系數(shù)相對(duì)于相關(guān)系數(shù)比較高,則 KMO 比較低,主成分分析不能起到很好的數(shù)據(jù)約化效果。根據(jù) Kaiser(1974) ,一般的判斷標(biāo)準(zhǔn)如下:0.00-0.49
5、,不能接受(unacceptable);0.50-0.59,非常差(miserable) ;0.60-0.69,勉強(qiáng)接受 (mediocre) ;0.70-0.79,可以接受(middling) ;0.80-0.89,比較好 (meritorious) ;0.90-1.00,非常好(marvelous) 。SMC 即一個(gè)變量與其他所有變量的復(fù)相關(guān)系數(shù)的平方,也就是復(fù)回歸方程 的可決系數(shù)。SMC 比較高表明變量的線性關(guān)系越強(qiáng),共性越強(qiáng),主
6、成分分析就越合適。成分載荷、KMO、SMC 等指標(biāo)都可以通過(guò) extat 命令進(jìn)行分析。 多元方差分析是方差分析在多元中的擴(kuò)展,即模型含有多個(gè)響應(yīng)變量。本章介紹多元(協(xié))方差分析以及霍特林(Hotelling)均值向量 T 檢驗(yàn)。12.1 12.1 主成分估計(jì) 主成分估計(jì)Stata 可以通過(guò)變量進(jìn)行主成分分析,也可以直接通過(guò)相關(guān)系數(shù)矩陣或協(xié)方差矩陣進(jìn)行。(1)sysuse auto,clearpca trunk weight lengt
7、h headroompca trunk weight length headroom, comp(2) covariance12.5 12.5 得分圖、載荷圖 得分圖、載荷圖得分圖即不同主成分得分的散點(diǎn)圖。命令為 scoreplot。webuse bg2,clearpca bg2cost*, vce(normal)scoreplot-4 -2 0 2 4Scores for component 2-6 -4 -2 0 2 4Scores
8、 for component 1Score variables (pca)載荷圖即不同主成分載荷的散點(diǎn)圖。命令為 loadingplot。webuse bg2,clearpca bg2cost*, vce(normal)loadingplotbg2cost1bg2cost2bg2cost3bg2cost4bg2cost5bg2cost6.3 .4 .5 .6Component 2-.4 -.2 0 .2 .4 .6Component 1
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- spss在主成分分析中的應(yīng)用
- 主成分分析在綜合評(píng)價(jià)中的應(yīng)用
- 主成分分析與matlab實(shí)現(xiàn)
- 主成分分析在能力驗(yàn)證中的應(yīng)用.pdf
- 主成分分析算法的FPGA實(shí)現(xiàn).pdf
- matlab主成分分析
- 主成分分析案例
- 主成分分析法matlab實(shí)現(xiàn)資料
- 主成分分析實(shí)例
- 迭代主成分分析在差分功耗分析中的應(yīng)用.pdf
- 主成分分析訓(xùn)練題
- 主成分分析和因子分析在財(cái)務(wù)診斷中的比較
- 主成分分析人臉識(shí)別的GPU實(shí)現(xiàn).pdf
- 實(shí)驗(yàn)八 主成分分析
- spss進(jìn)行主成分分析
- 主成分分析與二維主成分分析之比較研究.pdf
- 主成分分析法
- (10)主成分分析.pdf
- 張量主成分分析及在圖像序列識(shí)別中的應(yīng)用.pdf
- 非線性主成分分析方法及其在醫(yī)學(xué)中的應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論