2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p><b>  判別分析論文</b></p><p>  作 者 鄺淑芳 </p><p><b>  目 錄</b></p><p><b>  第一章 判別分析</b></p><p>  §1.1什么是判別

2、分析3</p><p>  §1.2判別分析的分類.3</p><p>  §1.3判別分析的適用條件3</p><p>  §1.4判別分析的方法3</p><p><b>  第二章 距離判別法</b></p><p>  §2.1什么是距離判別

3、法4</p><p>  §2.2馬氏距離4</p><p>  §2.3兩個總體的判別4</p><p>  §2.4多個總體的判別5</p><p>  第三章 貝葉斯判別法</p><p>  §3.1什么是貝葉斯判別法6</p><p>

4、  §3.2貝葉斯判別的方法6</p><p>  §3.3最大后驗概率法6</p><p>  §3.4最小期望誤判法6</p><p>  第四章 費希爾判別法</p><p>  §4.1什么是費希爾判別法6</p><p>  §4.2費希爾判別法的基本

5、思想7</p><p>  §4.3費希爾判別函數(shù)和準(zhǔn)則7</p><p>  §4.4費希爾判別法的步驟8</p><p><b>  第五章 案列分析</b></p><p>  §5.1距離判別法10</p><p>  §5.2貝葉斯判別法

6、13</p><p>  §5.3費希爾判別法14</p><p><b>  附錄16</b></p><p><b>  第一章.判別分析</b></p><p>  §1.1什么是判別分析</p><p>  判別分析,是一種統(tǒng)計判別和分組技術(shù),

7、就一定數(shù)量樣本的一個分組變量和相應(yīng)的其他多元變量的已知信息,確定分組與其他多元變量信息所屬的樣本進行判別分組。用數(shù)學(xué)的語言來說,判別問題可以表述為:對于個樣品,每個樣品有個指標(biāo),已知每個樣品屬于某一類別(總體),對于每類別其分布函數(shù)分別為,對于一個給定樣品,我們要判斷出這個樣本來自哪個總體。判別分析的主要問題就是如何尋找最佳的判別函數(shù)和建立判別規(guī)則。</p><p>  §1.2判別分析的分類</

8、p><p>  根據(jù)判別中的組數(shù),可以分為兩組判別分析和多組判別分析;</p><p>  根據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;</p><p>  根據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;</p><p>  根據(jù)判別標(biāo)準(zhǔn)不同,可以分為距離判別、貝葉斯判別、費希爾判別等。</p><p>

9、;  §1.3判別分析的適用條件</p><p>  自變量服從正態(tài)分布。</p><p>  自變量之間沒有多重共線性。</p><p>  每個變量在各類中的取值應(yīng)存在顯著差異。</p><p>  §1.4判別分析的方法</p><p>  (本文主要介紹三種方法,其它方法暫不討論) <

10、;/p><p><b>  距離判別法。</b></p><p><b>  貝葉斯判別法。</b></p><p><b>  費希爾判別法。</b></p><p><b>  .距離判別法</b></p><p>  §

11、2.1什么是距離判別法</p><p>  距離判別法是最為直觀,其想法自然、簡單,就是計算新樣品到各組的距離,然后將該樣品判為離它距離最近的一組。</p><p><b>  §2.2馬氏距離</b></p><p>  關(guān)于在判別分析中使用的距離問題,因為歐式距離未能將變量之間通常存在的相關(guān)性考慮在內(nèi),故不太理想,而馬氏距離卻能很

12、好的彌補這種不足,因此在判別分析中通常使用馬氏距離。</p><p>  對于一個均值為μ,協(xié)方差矩陣為Σ的多變量向量,點到總體的平方馬氏距離為:。</p><p>  §2.3兩個總體的判別</p><p> ?、佼?dāng)Σ1=Σ2=Σ時的判別(Σ是協(xié)方差矩陣):</p><p>  判別規(guī)則:計算到兩個組的平方馬氏距離,按距離最近原則

13、判別,則可總結(jié)為:</p><p>  判別函數(shù):為兩組距離判別的判別函數(shù),又稱為線性判別函數(shù),稱為判別系數(shù)向量。,其中是兩個組均值的平均值,。</p><p>  那么判別規(guī)則可簡化為:</p><p>  誤判概率:用表示來自而誤判為的概率;用表示來自而誤判為的概率;即</p><p>  用表示這兩組之間的馬氏距離,因此兩個組越是分開(

14、即越大),誤判的概率就會越小,此時的判別效果越佳。當(dāng)兩個組很接近時,誤判概率將很大,這時做判別分析就沒有什么實際意義。</p><p> ?、诋?dāng)Σ1≠Σ2時的判別</p><p>  判別規(guī)則:計算到兩個組的平方馬氏距離,按距離最近原則判別,則可總結(jié)為:</p><p>  判別函數(shù): 相應(yīng)的判別規(guī)則為:</p><p>  §2.

15、4多個總體的判別</p><p>  設(shè)有個組,它們的均值分別是協(xié)方差矩陣分別是。</p><p>  到的總體平方馬氏距離:. 判別規(guī)則:</p><p><b>  ,判別規(guī)則簡化為:</b></p><p>  其中.此時為線性判別函數(shù)。</p>

16、<p>  實際中一般都是未知的。</p><p><b> ?、贂r,可估計為,</b></p><p>  的聯(lián)合無偏估計為,其中為組數(shù),為每組的樣本個數(shù),,組的樣本協(xié)方差矩陣。</p><p>  ②不全相等時,,可估計為,</p><p><b>  的聯(lián)合無偏估計為。</b>&l

17、t;/p><p>  第三章.貝葉斯判別法</p><p>  §3.1什么是貝葉斯判別法</p><p>  如果對多個總體的判別考慮的不是建立判別式,而是計算新給樣品屬于各總體的條件概率,比較這個概率的大小,然后將樣品判歸為來自概率最大的總體,這種判別方法稱為貝葉斯判別方法。</p><p>  §3.2貝葉斯判別的方法&

18、lt;/p><p><b>  最大后驗概率法</b></p><p><b>  最小期望誤判代價法</b></p><p>  §3.3最大后驗概率法</p><p>  基本思想:設(shè)有個組,且組的概率密度為樣品來自組的先驗概率為滿足。根據(jù)貝葉斯公式,屬于的后驗概率(即當(dāng)樣品已知時,它屬于

19、的概率)為.</p><p><b>  判別規(guī)則:.</b></p><p>  §3.4最小期望誤判代價法</p><p>  最大后驗概率法只考慮到了先驗概率,忽略了誤判代價,該方法等價于誤判代價相同時的最小期望誤判代價法,此時的總誤判概率達到最小,也可稱為最小總誤判概率法。</p><p>  第四章.

20、費希爾判別法</p><p>  §4.1什么是費希爾判別法</p><p>  Fisher判別是一種先進行高維向低位投影,再根據(jù)距離判別的一種方法。借助方差分析的思想構(gòu)造判別函數(shù)(相當(dāng)于一種投影),使組間區(qū)別最大、組內(nèi)離差最小,然后代入新樣本數(shù)據(jù),將其與判別臨界值比較以確定應(yīng)判為至哪一總體。</p><p>  §4.2費希爾判別法的基本思想

21、</p><p>  它的基本思想是通過將多維數(shù)據(jù)投影到某一方向上,使得投影后類與類之間盡可能的分開,然后再選擇合適的判別準(zhǔn)則,將待判的樣本進行分類判別。而衡量類與類之間是否分開的方法是借助于一元方差分析的思想,利用方差分析的思想來導(dǎo)出判別函數(shù)。</p><p>  §4.3 費希爾判別函數(shù)和判別準(zhǔn)則</p><p> ?。ㄔ谝韵掠懻撝?,我們需假定各組的協(xié)

22、方差矩陣相同,即.)</p><p>  設(shè)來自組的維觀測值為,,,將它們共同投影到某一維常數(shù)向量上,得到的投影點可分別對應(yīng)線性組合,,。這樣,所有的維觀測值就簡化為一維觀測值。下面我們用表示組中的均值,表示所有組的總均值,即 </p><p><b>  式中。</b></p><p>  的組間平方和:,式中為組間平方和及叉積和矩陣。

23、</p><p>  的組內(nèi)平方和:,式中為組內(nèi)平方和及叉積和矩陣。</p><p>  設(shè)的全部非零特征值依次為,相應(yīng)的特征向量依次記為。當(dāng)時達到最大值。所以,選擇投影到上能使各組的投影點最大限度地分離,稱為費希爾第一線性判別函數(shù),簡稱第一判別函數(shù)。</p><p>  有時僅僅使用第一判別函數(shù)是不夠的,我們應(yīng)該考慮建立第二個線性組合,我們在約束條件下尋找,使得達

24、到最大。當(dāng)時達到最大值,稱為費希爾第二線性判別函數(shù),簡稱第二判別函數(shù)。</p><p>  在約束條件下尋找,使得達到最大。當(dāng)時達到最大值,稱為第判別函數(shù),。</p><p>  表明了第判別函數(shù)對分離各組的貢獻大小,在所有個判別函數(shù)中的貢獻率為。</p><p>  而前個判別函數(shù)的累計貢獻率為。</p><p>  它表明了能代表進行判別

25、的能力。</p><p><b>  判別規(guī)則為:。</b></p><p>  有時我們也使用中心化的費希爾判別函數(shù),即。</p><p>  §4.4 費希爾判別的步驟</p><p>  ①由各組樣本資料,計算各組樣本均值;</p><p><b> ?、谟嬎憬M間矩陣;&

26、lt;/b></p><p><b> ?、塾嬎憬M內(nèi)矩陣;</b></p><p> ?、苡嬎憔仃嚨那疤卣髦?;</p><p><b>  ⑤構(gòu)造判別函數(shù)。</b></p><p>  案列分析:1991年30個省、市、自治區(qū)城鎮(zhèn)居民月平均收人數(shù)據(jù)表</p><p>&

27、lt;b>  單位:元/人</b></p><p>  x1:人均生活費收入 x6:人均各種獎金、超額工資(國有+集體)</p><p>  x2:人均國有經(jīng)濟單位職工工資 x7:人均各種津貼(國有+集體)</p><p>  x3:人均來源于國有經(jīng)濟單位標(biāo)準(zhǔn)工資

28、 x8:人均從工作單位得到的其他收入</p><p>  x4:人均集體所有制工資收入 x9:個體勞動者收入</p><p>  x5:人均集體所有制職工標(biāo)準(zhǔn)工資</p><p>  變量個數(shù)p=9,兩類總體各有11個樣品,即n1=n2=11 ,有2個待判樣品。一</p><p><b>  一、距離

29、判別法</b></p><p>  用SAS的proc corr程序算出第一、二組的均值和與協(xié)方差矩陣和,詳細代碼見附錄程序①。</p><p><b>  Σ的聯(lián)合估計為</b></p><p>  然后利用SAS算出判別函數(shù),詳細代碼見附錄程序②。</p><p>  于是我們得到判別函數(shù):</p&

30、gt;<p>  那么對于廣東和西藏兩個待判地區(qū):</p><p> ?、賹τ趶V東,計算得 所以依據(jù)馬氏距離判別法,應(yīng)該把廣東判為第一組。</p><p>  ②對于西藏,計算得 所以依據(jù)馬氏距離判別法,應(yīng)該把西藏判為第一組。</p><p>  ③回代結(jié)果:從下表可以得知誤判概率為0</p><p> ?、芙徊骝炞C結(jié)果:從

31、下表得知</p><p>  將第一組誤判到第二組的條件概率為:P(2|1)=0.33</p><p>  將第二組誤判到第一組的條件概率為:P(1|2)=0.11</p><p><b>  二、貝葉斯判別法</b></p><p><b>  最大后驗概率法</b></p><

32、;p>  假設(shè)兩組的均服從多元正態(tài)分布,依據(jù)上表的信息,我們給出先驗概率有了先驗概率,我們接下來要利用SAS算出后驗概率,詳細代碼見附錄程序③。</p><p>  (廣東)判為第一組G1,(西藏)判為第一組G1。</p><p>  從上表可以看出當(dāng)先驗概率為將第一組誤判到第二組的條件概率為:P(2|1)=0,將第二組誤判到第一組的條件概率為:P(1|2)=0.</p>

33、<p><b>  三、費希爾判別</b></p><p>  做費希爾判別需要假定兩組的的協(xié)方差矩陣相同,即Σ1=Σ2=Σ。</p><p><b>  本題中。經(jīng)計算</b></p><p><b>  組間矩陣:</b></p><p>  組內(nèi)矩陣,然后算

34、出,</p><p>  由下表可知,的特征值的個數(shù)為1,</p><p>  由下表可知,相應(yīng)的標(biāo)準(zhǔn)化特征向量為 </p><p>  所以中心化的費希爾判別函數(shù)為:</p><p><b>  判別函數(shù)的組均值為</b></p><p>  將、代入判別函數(shù)得出、,從而求出臨街值。</

35、p><p><b>  代入判別函數(shù)得:</b></p><p><b>  ,.</b></p><p>  所以把(廣東)判為第一組G1,(西藏)判為第一組G1。</p><p>  總結(jié):距離判別法,貝葉斯判別法,費希爾判別法都把廣東和西藏判為第一組,所以廣東和西藏應(yīng)該屬于第一組。</p&g

36、t;<p><b>  附錄</b></p><p>  程序①: proc corr data=work.A cov;</p><p><b>  run;</b></p><p>  proc corr data=work.B cov;</p><p><b>  ru

37、n;</b></p><p>  程序②:proc discrim data=work.AB listerr crosslisterr;</p><p><b>  class g;</b></p><p>  var x1-x9;</p><p><b>  run;</b></

38、p><p>  程序③:proc discrim data=work.AB testdata=work.C testlist;</p><p><b>  class g;</b></p><p>  priors '1'=0.5 '2'=0.5;</p><p>  var x1-x9;&l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論