版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、探索性因素分析,,主要內(nèi)容,因素分析簡介因素分析模型因素分析中的基本概念求共因素的主要方法因素旋轉(zhuǎn)方法因素得分應(yīng)用因素分析應(yīng)該注意的問題因素分析應(yīng)用舉例,因素分析簡介,行為科學(xué)和社會(huì)科學(xué)研究中多變量之間的統(tǒng)計(jì)分析方法主要有:1.將多個(gè)變量與某種稱為準(zhǔn)則變量的外部變量聯(lián)系起來進(jìn)行分析。回歸分析、方差分析等。2.不使用外部準(zhǔn)則而同等地對待所有變量,分析它們之間的相互關(guān)系。相關(guān)分析、因素分析等。,探索性因素分析,探索性因素分
2、析(Exploratory Factor Analysis)是一種常用的多元數(shù)據(jù)分析方法,它是從眾多可觀測“變量”中,概括和推論出少數(shù)不可觀測的“潛變量”(又稱因素),目的在于用最少的因素去概括和解釋大量的觀測事實(shí),并建立起最簡潔的,基本的概念系統(tǒng),以揭示事物之間的本質(zhì)聯(lián)系的一種統(tǒng)計(jì)分析方法。這種方法的原則是在盡可能保存原有資料信息的前提下,用較少的維度去表示原來的數(shù)據(jù)結(jié)構(gòu)。,因素分析模型,因素分析假定個(gè)體在某一變量上的反應(yīng)由兩部分組
3、成:一是各個(gè)變量共有的部分,稱為共同因素(Common Factor);另一部分是各變量所特有的部分,稱為獨(dú)特因素(Unique Factor),可用下式表示: 是第i個(gè)體在第j觀測變量上的得分,(? j k)是因素對觀測變量的加權(quán)系數(shù),(Fik)是個(gè)體i在因素F k上的得分,Uij為特殊因素,dj為特殊因素對觀
4、測變量的加權(quán)系數(shù);N為樣本容量,n為觀測變量的個(gè)數(shù),m為共因素的個(gè)數(shù)。 因素分析的模型主要有全分量模型和公因子模型兩個(gè)。,,,,全分量模型 (主成分分析模型),是指用n個(gè)新的因素來線性表示n個(gè)觀測變量的因素分析模型(m=n)。 此模型希望從一組相關(guān)觀測變量中每次取得的一個(gè)公共因素的方差在觀測變量的全部方差(或剩余方差)中所占的比例最大,這一思想也是全分量模型確定公共因素的一種數(shù)學(xué)準(zhǔn)則。 但在實(shí)際應(yīng)用中,人們總是只取少數(shù)幾
5、個(gè)對觀測變量的方差貢獻(xiàn)較大的即為首的幾個(gè)因素。于是得到截分量模型,截分量模型(主成分分析模型),在實(shí)際應(yīng)用中,人們總是只取少數(shù)幾個(gè)對觀測變量的方差貢獻(xiàn)較大的即為首的幾個(gè)因素。有些人把幾個(gè)方差貢獻(xiàn)較小的因素看作誤差項(xiàng)。于是全分量模型就成為: (j=1,2,3, ……n m<n) 這一模型確切地說應(yīng)稱為截分量模型(truncated component model),但經(jīng)常被稱作主成分分析模型。
6、誤差項(xiàng)ajej表示被忽略的幾項(xiàng)因素之和。,公共因素模型,指所有觀測變量中每個(gè)觀測變量均可被表示為m個(gè)公共因素和一個(gè)唯一性因素的線性加權(quán)之和: (j=1,2,3, ……n m<n) 其中公共因素可以解釋觀測變量之間的相關(guān),唯一性因素則用以解釋觀測變量除去公共因素的影響后所剩下的那部分方差。,公共因素模型,這一模型希望從觀測變量中抽取到的因素能盡可能好地再生觀測變量之間 的相關(guān)。在這一模
7、型中將觀測變量、公共因素和唯一性因素都假定為標(biāo)準(zhǔn)變量,平均數(shù)為0,標(biāo)準(zhǔn)差為1,而且n個(gè)唯一因素uj之間相互獨(dú)立,每個(gè)唯一性因素與各個(gè)公共因素Fp(p=1,2, ……,m)之間相互獨(dú)立。各公共因素Fp是隨機(jī)變量。若假定各公共因素為互相獨(dú)立的正態(tài)分布,則觀測變量Zj就服從多元正態(tài)分布。在實(shí)際應(yīng)用公共因素分析方法時(shí),通常把唯一性因素看作不包括模型誤差,也就是說因素分析沒有考慮抽樣誤差。因此,抽樣就必須足夠大,以使抽樣誤差被忽視,樣本究竟多大合
8、適,一般至少要大于100,或者是變量數(shù)目的 5——10倍。,因素分析中的基本概念,因素載荷(Factor loading)公共因素方差(Communality)唯一性方差(uniqueness)特征值(Eigenvalue)貢獻(xiàn)率(Explain of Variance),因素載荷(Factor loading),因素載荷指因素分析模型中各公共因素對觀測變量的加權(quán)系數(shù)?jk 。一般情況下,稱共因素的系數(shù)為因素載荷。即因素分析
9、模型中的系數(shù)。將所有的因素載荷以矩陣的形式表示即為因素載荷以矩陣。,,公共因素方差,公共因素方差一般用h2表示,又稱作“共同度”或“公共性”,公共因素方差是指被公共因素所決定的方差在觀測變量總方差中所占的比例。在對觀測數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的情況下,一個(gè)觀測變量的總方差Sj2為:其中由公共因素決定的方差為:,公共因素方差在測驗(yàn)或特質(zhì)行為的研究方面主要有以下用途:,1. 公共因素方差能反映該測驗(yàn)對所要測量行為屬性的測量程度,公共因素方差越大
10、,該因素所能反映的行為屬性程度就越強(qiáng),某一因素的方差貢獻(xiàn)率越大,說明該因素在他所測量的特質(zhì)中,它所起的作用就越大。2.如果在構(gòu)成一個(gè)測驗(yàn)的諸多項(xiàng)目中,某些項(xiàng)目構(gòu)成的因素的公共方差大,說明這些項(xiàng)目測定被試的個(gè)別差異的功能強(qiáng),也說明該組項(xiàng)目的區(qū)分度好,鑒別力高,同理公共因素方差越小,該項(xiàng)目的鑒別力越低。因此項(xiàng)目的公共因素方差,可用作評(píng)價(jià)項(xiàng)目區(qū)分度的一種指標(biāo)。,唯一性方差(uniqueness),歸因于唯一性因素的那部分方差稱為唯一性方差,
11、唯一性方差表示m個(gè)公共因素對觀測變量的方差不能作出解釋的部分,一部分歸因于所選變量的特殊性,稱為特殊性方差;剩余部分歸因于測量的不完備性。,特征值,特征值: 對于一個(gè)n階矩陣A,如果存在一個(gè)n維向量v和一個(gè)常數(shù),滿足條件則稱為矩陣A的一個(gè)特征值,稱v為對應(yīng)于特征值的一個(gè)特征向量。,,,特征值,在因素分析中,特征值表示每個(gè)因素在所有變量上的因素負(fù)荷的平方之和,它反映某一公共因素對各觀測變量的影響程度,也說明該公共因素的重要性。特征值越
12、大,說明該公共因素相對重要。,,,貢獻(xiàn)率,各因素的特征值(?j)在總的公共因素方差之和中所占的比例。反映該因素對所有觀測變量變異影響的大小。第j個(gè)共因素的方差貢獻(xiàn)率為:,變量共同度的估計(jì),在全分量模型中可以直接用相關(guān)矩陣求解因素載荷矩陣,在公共因素模型中,由于考慮特殊因素對變量的影響,求解因素載荷矩陣則以約相關(guān)矩陣為出發(fā)點(diǎn)。估計(jì)變量的共同度是得到約相關(guān)矩陣估計(jì)的關(guān)鍵,,最大相關(guān)系數(shù)估計(jì)法,最大相關(guān)系數(shù)估計(jì)法是把原相關(guān)矩陣每一行(或每一
13、列)絕對值最大的一個(gè)元素作為該行(或該列)變量共同度的估計(jì)。,復(fù)相關(guān)系數(shù)平方估計(jì)法,Z J變量的復(fù)相關(guān)系數(shù)的平方為:其中RJJ 為對角線元素為1的相關(guān)矩陣R的逆矩陣中第j個(gè)變量對角線的元素,SMC是共同度估計(jì)的下限。,,公共因素個(gè)數(shù)的確定,根據(jù)累計(jì)貢獻(xiàn)率確定因子個(gè)數(shù)以特征值是否大于等于1為標(biāo)準(zhǔn)碎石檢驗(yàn),根據(jù)累積貢獻(xiàn)率確定因子個(gè)數(shù),將約相關(guān)矩陣(在主成分分析中,用相關(guān)矩陣)的特征值從大到小排列,根據(jù)前面若干個(gè)共同因素所對應(yīng)的特征
14、值之和的百分比來確定。一般來說,這一比例要達(dá)到80%以上,但根據(jù)問題的復(fù)雜程度可做適當(dāng)調(diào)整。,,.以特征值是否大于等于1為標(biāo)準(zhǔn),特征值大于等于1的選為共因素,小于1的不選。,,碎石檢驗(yàn)(screen test),以特征值為縱坐標(biāo),以因素個(gè)數(shù)為橫坐標(biāo),按照因子被提取的順序,畫出因子的特征值隨因子個(gè)數(shù)變化的散點(diǎn)圖,根據(jù)圖的形狀來判斷抽取因子的個(gè)數(shù)。從第一個(gè)因子開始,曲線逐漸下降,然后變得平緩,最后近似于一條直線,曲線變平的前一點(diǎn)被認(rèn)為是提取
15、的最大因子數(shù)。,,初始因素載荷矩陣求解,對于全分量模型來說,直接從變量相關(guān)矩陣入手求解因素載荷矩陣;而對于公共因素模型,則從約相關(guān)矩陣出發(fā)來求解因素載荷矩陣A。目前,求解因素載荷矩陣使用較為普遍的一種方法是主因素解法(在全分量模型中稱為主成分分析法)。它的基本思想是,考慮第一共同因素的方差對所有變量的方差貢獻(xiàn)最大,第二共同因素對所有變量的方差貢獻(xiàn)次之,……依次將全部變量的方差分解為各共同因素方差,最終求得因素載荷矩陣。,求初始因素載荷矩
16、陣的一般方法,Principal ComponentsUnweighted Least SquaresGeneralized Least SquaresMaximum LikelihoodPrincipal Axis FactoringAlpha FactoringImage Factoring,,旋轉(zhuǎn)變換,初始因子解達(dá)到了數(shù)據(jù)化簡的目的。在求初始因子這一步中,我們既確定了共因素個(gè)數(shù),又確定了每個(gè)變量的公因子方差??墒歉鶕?jù)初
17、始因子解,往往很難解釋因子的意義,大多數(shù)因子都和很多變量相關(guān),但是在實(shí)際研究中,我們往往關(guān)心每個(gè)因子的實(shí)際意義是什么。因子旋轉(zhuǎn)是尋求這一實(shí)際意義的有效工具,因子旋轉(zhuǎn)的目的是通過改變坐標(biāo)軸的位置,重新分配各個(gè)因子所解釋的方差的比例,使因子結(jié)構(gòu)簡單并易于解釋。因子旋轉(zhuǎn)不改變模型對數(shù)據(jù)的擬合程度,不改變每個(gè)變量的公因子方差。,因子旋轉(zhuǎn)的方式,因子旋轉(zhuǎn)的方式有兩種,一種是正交旋轉(zhuǎn),另一種是斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)是使因子軸之間仍然保持90度角,即因子
18、之間是不相關(guān)的,而在斜交旋轉(zhuǎn)中,因子之間的夾角可以是任意的,即因子之間可以相關(guān)。,正交旋轉(zhuǎn),,①四次方最大法(QUARTIMAX),通過使因子載荷矩陣中每一行因子負(fù)荷平方的方差達(dá)到最大求得因子解。最終的簡化準(zhǔn)則為:,,②方差最大法(VARIMAX),四次方最大法的不同是它從簡化因子負(fù)荷矩陣的每一列出發(fā),使和每個(gè)因子有關(guān)的負(fù)荷平方的方差最大。方差最大法通過使下式達(dá)到最大求得因子解:,,③等量最大法(EQUIMAX),等量最大法把四次方最大
19、法和方差最大法結(jié)合起來,取V和Q的加權(quán)平均作為簡化準(zhǔn)則,通過使下式達(dá)到最大:權(quán)數(shù)γ等于m/2,和因子數(shù)有關(guān),當(dāng)因子數(shù)為2時(shí),等量旋轉(zhuǎn)法結(jié)果與方差最大法旋轉(zhuǎn)結(jié)果相同。,,斜交旋轉(zhuǎn),常見的為OBLIMIN,該方法應(yīng)用斜交參考軸求解。所謂的斜交參考軸是指斜主因子軸的垂直線。斜交因子解應(yīng)使變量盡可能落在主軸附近,變量落在主軸附近和變量在參考軸上的投影近似為零這兩個(gè)條件是相同的。OBLIMIN方法首先求出斜交參考矩陣,斜交因子負(fù)荷矩陣等于斜
20、交參考陣的逆矩陣再按行進(jìn)行規(guī)范化處理,使矩陣中每一行的元素的平方和等于1。參數(shù)δ控制因子斜交的程度,其取值一般小于等于零,等于零時(shí),因子之間的斜交程度最大,小于零時(shí)因子之間的斜交程度減小。另外還有Promax法。,,6.因子得分及應(yīng)用,在公式中可以將變量表示成公共因素的線性組合。但在有些場合,需要考慮通過變量Z的值來獲得共因素指標(biāo)F的值。這種由變量的觀測值來估計(jì)各公共因素值的方法稱為因素得分。,因素得分及其應(yīng)用,求因素得分涉及到用觀
21、測變量來描述因素,第p個(gè)因子在第i個(gè)個(gè)案上的值可以表示為:其中,zji 是第j個(gè)變量在第i 個(gè)個(gè)體上的值, wpj 是第p個(gè)因子和第j個(gè)變量之間的因子值系數(shù)。,,因素得分及其應(yīng)用,因子分析模型中是用因子的線性組合來表示一個(gè)觀測變量,因子負(fù)荷實(shí)際是該線性組合的權(quán)數(shù)。求因子得分的過程正好相反,它是通過觀測變量的線性組合來表示因子,因子得分是觀測變量的加權(quán)平均。因?yàn)楦鱾€(gè)變量在因子上的負(fù)荷不同,所以不能把變量簡單相加,權(quán)數(shù)的大小表示了變量
22、對因子的重要程度。,因素得分及其應(yīng)用,對于主成分分析法得到的因子解,可以直接得到因子值系數(shù),對于其他方法得到的因子解,只能得到因子值系數(shù)的估計(jì)值,通過用回歸法得到因子得分系數(shù)的估計(jì)值。有了因子得分,就可以把因子作為變量來用,進(jìn)行其他的統(tǒng)計(jì)分析。,,應(yīng)用因素分析應(yīng)該注意的問題,1.對數(shù)據(jù)的要求(1)數(shù)據(jù)類型(2)數(shù)據(jù)分布(3)對變量之間相關(guān)的檢驗(yàn) SPSS提供了三個(gè)統(tǒng)計(jì)量幫助判斷觀測數(shù)據(jù)是否適合作因素分析,對變量之間相
23、關(guān)的檢驗(yàn),反映象相關(guān)矩陣(Anti-image correlation matrix) 其元素等于負(fù)的偏相關(guān)系數(shù)。巴特利特球體檢驗(yàn)(Bartlett test of sphericity)對應(yīng)的零假設(shè)為相關(guān)矩陣為單位矩陣。KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)測度。該測度從比較觀測變量之間的簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小出發(fā),其值的變化從0到1。當(dāng)所有變量之間的偏
24、相關(guān)系數(shù)的平方和,遠(yuǎn)遠(yuǎn)小于簡單相關(guān)系數(shù)平方和時(shí),KMO值接近于1,一般,大于0.9說明適合作因素分析。,應(yīng)用因素分析應(yīng)該注意的問題,2.樣本容量The number of variablesThe potential number of factorsThe variable to factors ratioThe degree of factor loadingsThe degree of interfactor corre
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自我探索性格
- 探索性因子分析法
- 實(shí)驗(yàn)生理探索性試驗(yàn)
- 探索性實(shí)驗(yàn)論文
- spss探索性因子分析的過程
- 探索性實(shí)驗(yàn)項(xiàng)目驗(yàn)收表
- 自然探索性兒童公園
- 數(shù)學(xué)專題:探索性問題
- spss探索性因子分析報(bào)告地過程
- 引文分析方法應(yīng)用的探索性研究.pdf
- 數(shù)學(xué)的探索性學(xué)習(xí).pdf
- 品牌個(gè)性偏好的探索性研究
- 機(jī)械設(shè)計(jì)中cad應(yīng)用的探索性分析
- 探索性因子分析與驗(yàn)證性因子分析
- 我國壽險(xiǎn)公司銷售員激勵(lì)因素探索性研究.pdf
- 中國養(yǎng)生旅游探索性研究.pdf
- 債權(quán)讓與制度的探索性研究.pdf
- 組織內(nèi)部情緒表現(xiàn)探索性研究.pdf
- 氮原子簇的探索性研究.pdf
- 中學(xué)物理探索性實(shí)驗(yàn)研究.pdf
評(píng)論
0/150
提交評(píng)論