2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p>  基于多元線性回歸模型對(duì)我國(guó)鋼鐵生產(chǎn)的分析</p><p>  摘要:鋼鐵工業(yè)是國(guó)民經(jīng)濟(jì)中最重要的基礎(chǔ)原材料產(chǎn)業(yè)和重要支撐產(chǎn)業(yè)。本文根據(jù)我國(guó)鋼材產(chǎn)量為研究對(duì)象,選取可能影響鋼材產(chǎn)量的粗鋼產(chǎn)量、發(fā)電量、房屋建筑面積、總能源消耗、鐵路運(yùn)輸量、對(duì)建筑工程的投資和汽車(chē)生產(chǎn)量七個(gè)因素,運(yùn)用多元線性回歸分析建立模型,先運(yùn)用普通最小二乘估計(jì)求回歸系數(shù)再對(duì)方程進(jìn)行異方差、自相關(guān)、和多重共線性診斷,用迭代法消除

2、了自變量之間的自相關(guān)。對(duì)于多重共線性問(wèn)題,先是用逐步回歸和剔除變量的方法,最終轉(zhuǎn)變?yōu)橛脦X回歸剔除粗鋼產(chǎn)量和發(fā)電量?jī)蓚€(gè)變量解決多重共線性,建立最終的嶺回歸方程:</p><p>  以其探究最后進(jìn)入回歸方程的幾個(gè)變量在影響鋼材生產(chǎn)方面孰輕孰重,達(dá)到學(xué)習(xí)與生活結(jié)合的效果。</p><p>  關(guān)鍵詞:多元線性回歸 異方差 自相關(guān) 多重共線性 逐步回歸 嶺回歸</p>&

3、lt;p><b>  一、引言</b></p><p>  中國(guó)的鋼鐵工業(yè)歷經(jīng)50年的發(fā)展,特別是改革開(kāi)放30年以來(lái)有了巨大的進(jìn)步,取得了舉世矚目的成就。鋼鐵工業(yè)的鋼產(chǎn)量增加速度加快、技術(shù)水平得到明顯提高,產(chǎn)品結(jié)構(gòu)不斷調(diào)整,成為名副其實(shí)的鋼鐵大國(guó)。1996年我國(guó)鋼產(chǎn)量首次超過(guò)1億噸大關(guān),躍居世界第一位,此后我國(guó)產(chǎn)量一直保持世界排名第一的位置。2002年實(shí)現(xiàn)鋼產(chǎn)量1.8億噸,到2003年

4、鋼產(chǎn)量突破2億噸,達(dá)到22234萬(wàn)噸,2004年全國(guó)共產(chǎn)鋼27279萬(wàn)噸,比上年增長(zhǎng)22.7%,生鐵、鋼材的產(chǎn)量分別達(dá)到創(chuàng)記錄的25185萬(wàn)噸與29723萬(wàn)噸(含重復(fù)材),同比增長(zhǎng)均在20%以上。在鋼材品種和質(zhì)量方面,已經(jīng)逐步形成能冶鐵包括高溫合金、精密合金再內(nèi)的1000多個(gè)鋼材品種,軋制和加工包括板、帶、管、型、線等各種形狀的4萬(wàn)多個(gè)品種規(guī)格的鋼材;各項(xiàng)技術(shù)經(jīng)濟(jì)指標(biāo)明顯提高。</p><p>  鋼鐵行業(yè)是國(guó)民

5、經(jīng)濟(jì)的支柱產(chǎn)業(yè),是加快實(shí)現(xiàn)工業(yè)化的先導(dǎo)產(chǎn)業(yè),其在拉動(dòng)上下游產(chǎn)業(yè)發(fā)展、擴(kuò)大城鄉(xiāng)勞動(dòng)力就業(yè)以及推動(dòng)區(qū)域經(jīng)濟(jì)發(fā)展等方面做出了重要的貢獻(xiàn)。雖然整個(gè)現(xiàn)代化建設(shè)以傳統(tǒng)原材料為主的狀況已經(jīng)發(fā)生改變,但鋼鐵行業(yè)對(duì)我國(guó)來(lái)說(shuō)仍然是基礎(chǔ)工業(yè),直接影響著國(guó)民經(jīng)濟(jì)的健康發(fā)展??梢哉f(shuō)鋼鐵行業(yè)的穩(wěn)定發(fā)展是實(shí)現(xiàn)我國(guó)新型工業(yè)化戰(zhàn)略目標(biāo)的關(guān)鍵一環(huán),其發(fā)展水平的高低是衡量我國(guó)工業(yè)化水平和綜合國(guó)力高低的重要標(biāo)志。隨著國(guó)際產(chǎn)業(yè)的轉(zhuǎn)移和我國(guó)國(guó)民經(jīng)濟(jì)的快速發(fā)展,我國(guó)鋼鐵工業(yè)取得了巨

6、大成就。本文研究了粗鋼產(chǎn)量、發(fā)電量、房屋建筑面積、總能源消耗量、鐵路運(yùn)輸量、對(duì)建筑工程的投資以及汽車(chē)生產(chǎn)總量7個(gè)變量對(duì)鋼材生產(chǎn)量的影響,以及它們之間的關(guān)系;以此可以看出這7個(gè)指標(biāo)中哪些指標(biāo)對(duì)鋼材生產(chǎn)量有著駐足輕重的關(guān)系,哪些指標(biāo)對(duì)鋼鐵產(chǎn)量的影響相對(duì)較弱。由此,可以看出怎么樣才能使鋼材產(chǎn)量更上一層樓,讓鋼鐵事業(yè)有著更加長(zhǎng)足且輝煌的發(fā)展。</p><p><b>  模型假設(shè)</b></p

7、><p>  假設(shè)選取的自變量指標(biāo)能基本上全面反映鋼鐵生產(chǎn);</p><p>  假設(shè)選取的年份期間沒(méi)有大的金融市場(chǎng)波動(dòng);</p><p><b>  假設(shè)隨機(jī)誤差。</b></p><p><b>  符號(hào)說(shuō)明</b></p><p>  1、y表示鋼材產(chǎn)量;</p>

8、;<p>  2、x1表示粗鋼產(chǎn)量;</p><p>  3、x2表示發(fā)電量;</p><p>  4、x3表示房屋建筑面積;</p><p>  5、x4表示總能源消耗;</p><p>  6、x5表示鐵路運(yùn)輸量;</p><p>  7、x6表示對(duì)建筑工程投資;</p><

9、;p>  8、x7表示汽車(chē)生產(chǎn)總量;</p><p>  9、表示模型的隨機(jī)誤差項(xiàng)。</p><p><b>  四、模型分析與建立</b></p><p>  4.1多元線性回歸模型</p><p>  多元線性回歸模型的一般形式 </p><p>  設(shè)隨機(jī)變量與一般變量 的線性回歸模型

10、為 </p><p>  (4.1) </p><p>  其中,是個(gè)未知參數(shù),稱(chēng)為回歸常數(shù),稱(chēng)為回歸系數(shù)。稱(chēng)為被解釋變量(因變量),是個(gè)可以精確測(cè)量并控制的一般變量,稱(chēng)為解釋變量(自變量)。 是隨機(jī)誤差,與一元線性回歸一樣,對(duì)隨機(jī)誤差項(xiàng)我們常假定</p><p><b> ?。?.2)</b></p>

11、<p><b>  稱(chēng)</b></p><p><b>  (4.3)</b></p><p><b>  為理論回歸方程。</b></p><p>  對(duì)一個(gè)實(shí)際問(wèn)題,如果我們獲得組觀測(cè)數(shù)據(jù),則線性回歸模型(4.1)式可表示為</p><p><b> 

12、?。?.4)</b></p><p><b>  寫(xiě)成矩陣形式為</b></p><p><b> ?。?.5)</b></p><p><b>  其中</b></p><p><b> ?。?.6)</b></p><p

13、>  是一個(gè)階矩陣,稱(chēng)為回歸設(shè)計(jì)矩陣或資料矩陣。</p><p>  多元線性回歸模型的基本假定</p><p>  為了方便地進(jìn)行模型的參數(shù)估計(jì),對(duì)回歸方程(4.4)式有如下一些基本假定:</p><p>  解釋變量是確定性變量,不是隨機(jī)變量,且要求。這里的,表明設(shè)計(jì)矩陣中的自變量列之間不相關(guān),樣本量的個(gè)數(shù)應(yīng)大于解釋變量的個(gè)數(shù),是一滿秩矩陣。</p&

14、gt;<p>  隨機(jī)誤差項(xiàng)具有零均值和等方差,即</p><p><b>  (4.7)</b></p><p>  這個(gè)假定常稱(chēng)為高斯—馬爾柯夫條件。,假設(shè)觀測(cè)值沒(méi)有系統(tǒng)錯(cuò)誤,隨機(jī)誤差項(xiàng)的平均值為0。隨機(jī)誤差項(xiàng)的協(xié)方差為0,表明隨機(jī)誤差項(xiàng)在不同的樣本點(diǎn)之間是不相關(guān)的(在正態(tài)假定下即為獨(dú)立的),不存在序列相關(guān),并且有相同的精度。</p>

15、<p>  (3)正態(tài)分布的假定條件為</p><p><b> ?。?.8)</b></p><p>  對(duì)于多元線性回歸的矩陣模型(4.5)式, 這個(gè)條件便可表示為</p><p><b> ?。?.9)</b></p><p>  由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機(jī)變量服從維正

16、態(tài)分布,回歸模型(4.5)式的期望向量</p><p><b>  (4.10) </b></p><p><b> ?。?.11)</b></p><p><b>  因此</b></p><p><b>  (4.12)</b></p>

17、<p>  4.2回歸參數(shù)的普通最小二乘估計(jì)</p><p>  線性回歸方程確定后的任務(wù)是利用已經(jīng)收集到的樣本數(shù)據(jù),根據(jù)一定的統(tǒng)計(jì)擬合準(zhǔn)則,對(duì)方程中的各個(gè)參數(shù)進(jìn)行估計(jì)。普通最小二乘就是一種最為常見(jiàn)的統(tǒng)計(jì)擬合準(zhǔn)則,在該準(zhǔn)則下得到的回歸參數(shù)的估計(jì)稱(chēng)為回歸參數(shù)的普通最小二乘估計(jì)。</p><p>  對(duì)于(4.5)式表示的回歸模型,所謂最小二乘法,就是尋找參數(shù)的估計(jì)值,使離差平方和達(dá)

18、到極小,即尋找滿足</p><p> ?。?.13) </p><p>  依照(4.13)式求出的就稱(chēng)為回歸參數(shù)的最小二乘估計(jì)。 </p><p><b> ?。?.14)</b></p>

19、<p><b>  為經(jīng)驗(yàn)回歸方程。</b></p><p><b>  五、案例分析</b></p><p><b>  5.1數(shù)據(jù)說(shuō)明</b></p><p>  原始數(shù)據(jù)(見(jiàn)附錄1))選取1990-2010年間鋼材產(chǎn)量()、粗鋼產(chǎn)量()、發(fā)電量()、房屋建筑面積()、總能源消耗()

20、、鐵路運(yùn)輸量()、對(duì)建筑工程投資()和汽車(chē)生產(chǎn)總量()八個(gè)指標(biāo),以鋼材產(chǎn)量為因變量,其余七個(gè)為自變量,研究鋼材產(chǎn)量()與粗鋼產(chǎn)量()、發(fā)電量()、房屋建筑面積()、總能源消耗()、鐵路運(yùn)輸量()、對(duì)建筑工程投資()和汽車(chē)生產(chǎn)總量()之間的關(guān)系。數(shù)據(jù)來(lái)源國(guó)家統(tǒng)計(jì)局網(wǎng)站統(tǒng)計(jì)年鑒。</p><p><b>  5.2求解分析</b></p><p>  5.2.1直接進(jìn)入法

21、</p><p><b>  表1 模型匯總</b></p><p><b>  模型匯總b</b></p><p>  由表1可以看出調(diào)整后的決定系數(shù),說(shuō)明回歸方程的擬合優(yōu)度比較好。</p><p><b>  表2 方差分析表</b></p><p>

22、;<b>  Anovab</b></p><p>  由表2方差分析表可以看出,F(xiàn)檢驗(yàn)的檢驗(yàn)值F=5598.148非常大,再看F檢驗(yàn)的P值=1.41E-210.000,可知此回歸方程高度顯著,即做出7個(gè)自變量整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為1.41E-210.000。</p><p><b>  表3 系數(shù)表</b><

23、;/p><p><b>  系數(shù)a</b></p><p>  此時(shí)得到的回歸方程為:</p><p>  首先看t檢驗(yàn)結(jié)果, 的t統(tǒng)計(jì)量及其相應(yīng)的值就是上表第五列(Sig.)的結(jié)果。我們可以發(fā)現(xiàn)顯著性水平時(shí)只有粗鋼產(chǎn)量()和對(duì)建筑工程投資()通過(guò)了顯著性檢驗(yàn)。盡管回歸方程的顯著性檢驗(yàn)高度顯著,但也會(huì)出現(xiàn)有某些自變量(甚至每個(gè))對(duì)無(wú)顯著影響的情況。

24、</p><p>  接著看看回歸系數(shù)的置信區(qū)間除了有粗鋼產(chǎn)量()系數(shù)95%置信區(qū)間[0.669,1.161]和對(duì)建筑工程投資()系數(shù)95%置信區(qū)間[0.049,0.175]不包含0,這也反映了回歸系數(shù)的不合理。</p><p>  再看回歸系數(shù)的正負(fù)情況,房屋建筑面積()、總能源消耗()和汽車(chē)生產(chǎn)總量()的回歸系數(shù)為負(fù),顯然回歸系數(shù)不合理。</p><p>  那

25、么究竟是什么原因?qū)е禄貧w方程出現(xiàn)上述結(jié)果呢,我們猜想可能是下列原因?qū)е碌摹?lt;/p><p><b>  異方差和自相關(guān)</b></p><p>  在回歸模型的基本假設(shè)中,假定隨機(jī)誤差性具有相同的方差,獨(dú)立或不相關(guān),即對(duì)于所有樣本點(diǎn),有</p><p>  但在建立實(shí)際問(wèn)題的回歸模型時(shí),經(jīng)常存在于此假設(shè)相違背的情況,一種是計(jì)量經(jīng)濟(jì)建模中常說(shuō)的異

26、方差性,即,當(dāng)時(shí)另一種是自相關(guān)性,即</p><p>  ,當(dāng)時(shí),異方差帶來(lái)的問(wèn)題:</p><p>  當(dāng)一個(gè)回歸問(wèn)題存在異方差時(shí),如果仍用普通最小二乘發(fā)估計(jì)位置參數(shù),將引起不良后果,特別是最小二乘估計(jì)量不再具有最小方差的優(yōu)良性,即最小二乘估計(jì)的有效性被破壞了。</p><p>  當(dāng)存在異方差時(shí),參數(shù)向量的方差大于在同方差條件下的方差,如果用普通最小二乘發(fā)估計(jì)參

27、數(shù),將出現(xiàn)低估的真是方差的情況,進(jìn)一步將導(dǎo)致高估回歸系數(shù)的t檢驗(yàn)值,可能造成本來(lái)不顯著的某些回歸系數(shù)變成顯著。這將給回歸方程的應(yīng)用效果帶來(lái)一定影響。</p><p>  當(dāng)存在異方差是,普通最小二乘估計(jì)存在以下問(wèn)題:</p><p>  參數(shù)估計(jì)值雖然是無(wú)偏的,但不是最小方差線性無(wú)偏估計(jì)。</p><p>  參數(shù)的顯著性檢驗(yàn)失效。</p><p

28、>  回歸方程的應(yīng)用效果極不理想。</p><p><b>  自相關(guān)帶來(lái)的問(wèn)題:</b></p><p>  當(dāng)一個(gè)線性回歸模型的隨機(jī)誤差項(xiàng)存在序列相關(guān)時(shí),就違背了線性回歸方程的基本假設(shè),如果仍然直接用普通最小二乘法估計(jì)未知參數(shù),將會(huì)產(chǎn)生嚴(yán)重后果,一般情況下,序列自相關(guān)性會(huì)帶來(lái)下列問(wèn)題:</p><p>  1、最小二乘估計(jì)量仍然是線性

29、的和無(wú)偏的。</p><p>  2、最小二乘估計(jì)量不是有效的,即OLS估計(jì)量的方差不是最小的,估計(jì)量不是最優(yōu)線性無(wú)偏估計(jì)量(BLUE)。</p><p>  3、OLS估計(jì)量的方差是有偏的。用來(lái)計(jì)算方差和OLS估計(jì)量標(biāo)準(zhǔn)誤的公式會(huì)嚴(yán)重的低估真實(shí)的方差和標(biāo)準(zhǔn)誤,從而導(dǎo)致t值變大,使得某個(gè)系數(shù)表面上顯著不為零,但事實(shí)卻相反。</p><p>  4、t檢驗(yàn)和F檢驗(yàn)不是

30、可信的。</p><p>  5、計(jì)算得到的誤差方差=(殘差平方和/自由度)是真實(shí)的有偏估計(jì)量,并且很可能低估了真實(shí)的。</p><p>  6、計(jì)算的也不能真實(shí)的反映實(shí)際。</p><p>  7、計(jì)算的預(yù)測(cè)方差和標(biāo)準(zhǔn)誤差通常是無(wú)效的。</p><p><b>  (2)多重共線性</b></p><

31、;p>  多元線性回歸有一個(gè)基本假設(shè),就是要求設(shè)計(jì)矩陣X的秩,即要求中的列向量之間線性無(wú)關(guān)。如果存在不全為零的個(gè)數(shù),使得</p><p><b> ?。?.1)</b></p><p>  則自變量之間存在完全多重共線性。在實(shí)際問(wèn)題中,完全的多重共線性并不多見(jiàn),常見(jiàn)的是(5.1)式近似成立的情況,即存在不全為零的個(gè)數(shù),使得</p><p>

32、;<b> ?。?.2)</b></p><p>  當(dāng)自變量存在(5.2)式的關(guān)系時(shí),稱(chēng)自變量之間存在多重共線性(multi-collinearity),也稱(chēng)為復(fù)共線性。</p><p>  多重共線性到來(lái)的影響:</p><p>  完全共線性下參數(shù)估計(jì)量不存在  </p><p>  近似共線性下OLS估計(jì)量非有效

33、,多重共線性使參數(shù)估計(jì)值的方差增大,為方差擴(kuò)大因子(Variance Inflation Factor, VIF)  </p><p>  參數(shù)估計(jì)量經(jīng)濟(jì)含義不合理  </p><p>  變量的顯著性檢驗(yàn)失去意義,可能將重要的解釋變量排除在模型之外 </p><p>  模型的預(yù)測(cè)功能失效。變大的方差容易使區(qū)間預(yù)測(cè)的“區(qū)間”變大,使預(yù)測(cè)失去意義。5.3 方程的異

34、方差、自相關(guān)以及多重共線性診斷</p><p>  5.3.1異方差診斷</p><p>  這里使用等級(jí)相關(guān)系數(shù)法檢驗(yàn),計(jì)算殘差絕對(duì)值(見(jiàn)附錄2)與自變量的相關(guān)性時(shí)采用Spearman等級(jí)相關(guān)系數(shù),而不采用Pearson簡(jiǎn)單相關(guān)系數(shù),這是由于等級(jí)相關(guān)系數(shù)可以反映非線性相關(guān)的情況,而簡(jiǎn)單相關(guān)系數(shù)不能如實(shí)反映非線性相關(guān)情況。</p><p><b>  表4

35、 異方差檢驗(yàn)表</b></p><p><b>  相關(guān)性</b></p><p>  由表4可得等級(jí)相關(guān)系數(shù)很P值,因?yàn)樵陲@著性水平下,每個(gè)值都大于,認(rèn)為殘差絕對(duì)值與自變量不顯著相關(guān),即認(rèn)為不存在異方差。</p><p>  5.3.2自相關(guān)診斷</p><p>  這里我們采用DW檢驗(yàn)??梢杂肧PSS算出

36、的值,結(jié)果如表5。</p><p><b>  表5 自相關(guān)檢驗(yàn)表</b></p><p><b>  模型匯總b</b></p><p>  由表5我們可以得到DW=2.56,查DW表,n=21,k=8,顯著性水平,得。由,可知不能判定殘差是否有自相關(guān)。下面借助圖示檢驗(yàn)法來(lái)判定自相關(guān)性。</p><p

37、>  繪制的散點(diǎn)圖。用作為散布點(diǎn)繪圖。</p><p><b>  圖1 的殘差散點(diǎn)圖</b></p><p>  從圖1我們不能看出大部分點(diǎn)落在Ⅰ,Ⅲ象限或者是Ⅱ,Ⅳ象限,不能判定隨即擾動(dòng)項(xiàng)存在自相關(guān)性。</p><p>  繪制按照時(shí)間順序回歸殘差項(xiàng)的圖形。</p><p>  圖2 時(shí)間序列殘差散點(diǎn)圖<

38、/p><p>  從圖2可以看出隨著t的變化逐次有規(guī)律地變化,呈現(xiàn)鋸齒形,表明存在負(fù)相關(guān),隨機(jī)擾動(dòng)項(xiàng)存在負(fù)的序列相關(guān)。</p><p>  5.3.3 消除自相關(guān)</p><p>  這里我們用迭代法消除自相關(guān),需要求出和,其中</p><p><b> ?。?.3)</b></p><p>  (5

39、.3)式中自相關(guān)系數(shù)是未知的,用來(lái)估計(jì),計(jì)算出后,帶入(5.3)式,計(jì)算變換因變量和變換自變量(見(jiàn)附錄3),然后用變換得到自變量和因變量作普通最小二乘回歸,看看自相關(guān)是否消除。</p><p>  表6 迭代后的自相關(guān)檢驗(yàn)表</p><p><b>  模型匯總b</b></p><p>  由表6我們可以得到DW=2.423,查DW表,n=2

40、0,k=8,顯著性水平,得。由,可知不能判定殘差是否有自相關(guān)。下面仍然借助圖示檢驗(yàn)法來(lái)判定自相關(guān)性。</p><p>  1、繪制的散點(diǎn)圖。用作為散布點(diǎn)繪圖。</p><p><b>  圖3 的殘差散點(diǎn)圖</b></p><p>  從圖3我們不能看出大部分點(diǎn)落在Ⅰ,Ⅲ象限或者是Ⅱ,Ⅳ象限,不能判定隨即擾動(dòng)項(xiàng)存在自相關(guān)性。</p>

41、<p>  繪制按照時(shí)間順序回歸殘差項(xiàng)的圖形。</p><p>  圖4時(shí)間序列殘差散點(diǎn)圖</p><p>  從圖4可以看出隨著t的變化并沒(méi)有呈現(xiàn)有規(guī)律地變化,不能看出存在自相關(guān)。即認(rèn)為同歸迭代法變換后消除了自相關(guān)。</p><p>  5.3.4多重共線性診斷</p><p>  這里采用方差擴(kuò)大因子和條件數(shù)檢驗(yàn)回歸方程的多

42、重共線性。方差擴(kuò)大因子法中,當(dāng)時(shí),就說(shuō)明自變量與其與自變量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會(huì)過(guò)度地影響最小二乘估計(jì)。條件數(shù)法中,當(dāng)時(shí),沒(méi)有多重共線性;時(shí),存在較強(qiáng)的多重共線性;時(shí),存在嚴(yán)重的多重共線性。用SPSS可以直接得到上述結(jié)果,見(jiàn)表7和表8。</p><p>  表7 方差擴(kuò)大因子檢驗(yàn)表</p><p><b>  系數(shù)a</b></p>

43、<p>  由表7可以看出發(fā)電量(),房屋建筑面積()的方差擴(kuò)大因子很大,分別為,,遠(yuǎn)遠(yuǎn)超過(guò)10,說(shuō)鋼材生產(chǎn)回歸方程存在著嚴(yán)重的多重共線性。</p><p><b>  表8 條件數(shù)檢驗(yàn)表</b></p><p><b>  共線性診斷a</b></p><p>  由表8,從條件數(shù)看到,最大的條件數(shù)=329

44、.135,說(shuō)明自變量間存在嚴(yán)重的多重共線性,這與方差擴(kuò)大因子法的結(jié)果一致。</p><p>  5.3.5消除多重共線性</p><p>  由表7可以看到,變量之間的多重共線性比較嚴(yán)重,我們先用逐步回歸的方法剔除一些變量。用普通最小二乘回歸對(duì)迭代法得到的數(shù)據(jù)進(jìn)行分析,輸出結(jié)果如表9。</p><p>  表9 逐步回歸后的多重共線性檢驗(yàn)表</p>&

45、lt;p><b>  系數(shù)a</b></p><p>  可以看到回歸方程保留了三個(gè)自變量,而方差擴(kuò)大因子均比較大,說(shuō)明自變量之間仍存在多重共線性。由于最大,剔除粗鋼產(chǎn)量這個(gè)變量在用普通最小二乘回歸得到表10。</p><p>  表10 剔除變量后的多重共線性檢驗(yàn)表</p><p><b>  系數(shù)a</b><

46、;/p><p>  由表10可以看到方差擴(kuò)大因子,依然存在多重共線性,此時(shí)回歸方程只剩下兩個(gè)自變量了,再剔除自變量的話就和實(shí)際問(wèn)題不符合了,所以用剔除解釋變量消除多重共線性的方法不可行。鑒于此我們用另外一種變換—嶺回歸,消除多重共線性,重新建立回歸方程。</p><p><b>  5.4嶺回歸法</b></p><p>  5.4.1嶺回歸的定義

47、</p><p>  當(dāng)自變量間存在多重共線性,||0時(shí),設(shè)想給加上一個(gè)正常數(shù)矩陣那么+接近奇異的程度就會(huì)比接近奇異的程度小得多??紤]到變量的量綱問(wèn)題,先要對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化后的設(shè)計(jì)矩陣仍用表示,定義稱(chēng)為的嶺回歸估計(jì),其中,稱(chēng)為嶺參數(shù)。由于假設(shè)已經(jīng)標(biāo)準(zhǔn)化,所以就是自變量樣本相關(guān)陣。可以標(biāo)準(zhǔn)化也可以未標(biāo)準(zhǔn)化,如果也經(jīng)過(guò)標(biāo)準(zhǔn)化,那么計(jì)算的實(shí)際是標(biāo)準(zhǔn)化嶺回歸估計(jì)。作為的估計(jì)應(yīng)比最小二乘估計(jì)穩(wěn)定,當(dāng)時(shí)的嶺回歸估計(jì)就是普

48、通的最小二乘估計(jì)。因?yàn)閹X參數(shù)不是唯一確定的,所以得到的嶺回歸估計(jì)實(shí)際是回歸參數(shù)的一個(gè)估計(jì)族。</p><p><b>  5.4.2嶺跡法</b></p><p>  嶺跡法的直觀考慮是,如果最小二乘估計(jì)看來(lái)有不合理之外,如估計(jì)值以及正負(fù)號(hào)不符合經(jīng)濟(jì)意義,希望能通過(guò)采用適當(dāng)?shù)膸X估計(jì)來(lái)加以一定程度的改善,嶺參數(shù)值的選擇就是尤為重要。選擇值的一般原則是:</p>

49、;<p>  (1)各回歸系數(shù)的嶺估計(jì)基本穩(wěn)定;</p><p>  (2)用最小二乘估計(jì)時(shí)符號(hào)不合理的回歸系數(shù),其嶺估計(jì)的符號(hào)變得合理。</p><p> ?。?)回歸系數(shù)沒(méi)有不合乎經(jīng)濟(jì)意義的絕對(duì)值;</p><p>  (4)殘差平方和增大不太多。</p><p>  嶺跡法與傳統(tǒng)的基于殘差方法相比,在概念上來(lái)說(shuō)是完全不同的

50、,嶺跡法對(duì)于分析各變量之間的作用和關(guān)系是有幫助的。</p><p>  5.4.3嶺回歸選擇變量的原則:</p><p>  1、在嶺回歸的計(jì)算中,假定設(shè)計(jì)矩陣X已經(jīng)中心化和標(biāo)準(zhǔn)化了,這樣可以直接比較標(biāo)準(zhǔn)化嶺回歸系數(shù)的大小??梢蕴蕹魳?biāo)準(zhǔn)化嶺回歸系數(shù)比較穩(wěn)定且絕對(duì)值很小的自變量。</p><p>  2、當(dāng)k值較小時(shí),標(biāo)準(zhǔn)化嶺回歸系數(shù)的絕對(duì)值并不是很小,但是不穩(wěn)定,

51、隨著k的增加迅速趨于零,像這樣嶺回歸系數(shù)不穩(wěn)定,震動(dòng)趨于零的自變量可以予以剔除。</p><p>  3.去掉標(biāo)準(zhǔn)化嶺回歸系數(shù)很不穩(wěn)定的自變量。如果有若干個(gè)嶺回歸系數(shù)不穩(wěn)定,究竟去掉幾個(gè),去掉哪幾個(gè),這并無(wú)一般原則可循,這需根據(jù)去掉某個(gè)變量后重新進(jìn)行嶺回歸分析的效果來(lái)確定。</p><p>  5.4.4 用嶺回歸選擇變量建立回歸方程</p><p>  對(duì)迭代法得

52、到的數(shù)據(jù)進(jìn)行分析,SPSS進(jìn)行嶺回歸程序如下:</p><p>  INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p>  RIDGEREG DEP=y/ENTER x1 x2 x3 x4 x5 x6 x7.</p><p><b>  得到圖5嶺跡

53、圖。</b></p><p><b>  圖5 嶺跡圖</b></p><p>  可以看到,變量的嶺回歸系數(shù)從負(fù)值迅速變成正值,和都迅速減少。從嶺回歸的角度看,與只要保留一個(gè)就可以了。其余變量的嶺回歸系數(shù)相對(duì)穩(wěn)定。在這里我們決定剔除,用與其余六個(gè)自變量作嶺回歸。把領(lǐng)參數(shù)步長(zhǎng)改為0.02,范圍減小到0.4。修改后的語(yǔ)句如下:</p><

54、p>  INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p>  RIDGEREG DEP=y/ENTER x2 x3 x4 x5 x6 x7</p><p>  /START=0.0/STOP=0.4/INC=0.02.</p><p><b&g

55、t;  得到嶺跡圖6。</b></p><p><b>  嶺跡圖6</b></p><p>  由圖6看,變量和變量的嶺回歸系數(shù)依然不穩(wěn)定,剔除,范圍減小到0.2再分析,語(yǔ)法如下:</p><p>  INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps

56、'.</p><p>  RIDGEREG DEP=y/ENTER x3 x4 x5 x6 x7</p><p>  /START=0.0/STOP=0.2/INC=0.02.</p><p><b>  結(jié)果如圖7。</b></p><p><b>  嶺跡圖7</b></p&g

57、t;<p>  從嶺跡圖7看,嶺參數(shù)k在0.040.1之間時(shí),嶺參數(shù)已經(jīng)基本穩(wěn)定,當(dāng)k=0.08時(shí),仍然很大,因而可以選取嶺參數(shù)k=0.08。重新作嶺回歸,語(yǔ)法如下:</p><p>  INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p>  RIDGEREG DEP=

58、y/ENTER x3 x4 x5 x6 x7</p><p><b>  /k=0.08</b></p><p><b>  計(jì)算結(jié)果如表11。</b></p><p>  表11 k=0.08的嶺回歸結(jié)果</p><p>  Mult R .998045</p>

59、<p>  RSquare .996093</p><p>  Adj RSqu .994698</p><p>  SE 2129.130623</p><p>  ANOVA table</p><p>  df SS MS F value

60、 Sig F</p><p>  Regress 5.000 1.62E+010 3.24E+009 713.8648164 .0000000</p><p>  Residual 14.000 63464761 4533197.2</p><p>  B SE(B) Beta

61、 B/SE(B)</p><p>  X3 .000002198 .000000164 .000018359 .001338742</p><p>  X4 .000007388 .000000560 .000023065 .001319257</p><p>  X5

62、 .000010632 .000000797 .000023194 .001334201</p><p>  X6 .000009249 .000000956 .000018122 .000967485</p><p>  X7 .000837960 .000095618 .000016448 .00

63、0876364</p><p>  Constant -2.731553041 .216522090 .000000000 -.001261559</p><p>  得到對(duì)的標(biāo)準(zhǔn)化嶺回歸方程為</p><p>  未標(biāo)準(zhǔn)化的嶺回歸方程為</p><p>  5.5結(jié)果分析 </p><p> 

64、 我們用上述嶺回歸的方法消除了自變量之間的多重共線性,并且得到了嶺回歸方程,各個(gè)嶺回歸系數(shù)也都為正值,與實(shí)際情況向符合,說(shuō)明鋼材生產(chǎn)量主要與房屋建筑面積()、總能源消耗()、鐵路運(yùn)輸量()、對(duì)建筑工程投資()和汽車(chē)生產(chǎn)總量()五個(gè)指標(biāo)有關(guān)。從最后得到的標(biāo)準(zhǔn)化嶺回歸方程可以用于比較最后進(jìn)入回歸方程的五個(gè)自變量對(duì)鋼鐵生產(chǎn)的影響程度大小,嶺回歸系數(shù)越大那么對(duì)鋼鐵生產(chǎn)的影響也就越大,可以看出鐵路運(yùn)輸量對(duì)鋼鐵生產(chǎn)的影響比較大。我們還可以從未標(biāo)準(zhǔn)化

65、的嶺回歸方程解釋五個(gè)自變量對(duì)鋼鐵生產(chǎn)的作用。</p><p><b>  六、模型評(píng)價(jià)與推廣</b></p><p><b>  6.1 模型評(píng)價(jià)</b></p><p><b>  6.1.1 優(yōu)點(diǎn)</b></p><p>  本文以多元線性回歸建立模型,分別選用了等級(jí)相關(guān)系

66、數(shù)法診斷異方差;圖示檢驗(yàn)法和DW檢驗(yàn)法診斷自相關(guān)迭代法消除自相關(guān);方差和擴(kuò)大因子法診斷多重共線性嶺回歸法消除多重共線性最終建立嶺回歸方程。用多元線性回歸模型得到的回歸方程能很明白的說(shuō)明問(wèn)題,容易理解。</p><p><b>  6.1.2 缺點(diǎn)</b></p><p>  為了解決多重共線性問(wèn)題,選取的七個(gè)自變量未能全部進(jìn)入最后的回歸方程。</p>&

67、lt;p><b>  6.2 模型推廣</b></p><p>  本文建立的多元線性回歸模型很好地決絕了實(shí)際問(wèn)題,并且能夠推廣應(yīng)用到現(xiàn)實(shí)生活中的很多問(wèn)題,如:</p><p>  分析國(guó)家財(cái)政收入與選取自變量之間的關(guān)系,并對(duì)其作出短期預(yù)測(cè);</p><p>  分析股票變動(dòng)與選取自變量之間的關(guān)系,并對(duì)其作出短期預(yù)測(cè)。</p>

68、<p><b>  七、參考文獻(xiàn)</b></p><p>  [1] 薛薇,《SPSS統(tǒng)計(jì)分析方法及應(yīng)用(第二版)》,北京:電子工業(yè)出版社,2009年</p><p>  [2] 茆詩(shī)松,《概率論與數(shù)理統(tǒng)計(jì)》,北京:高等教育出版社,2011年</p><p>  [3] 何曉群,《應(yīng)用回歸分析(第三版)》,北京:中國(guó)人民大學(xué)出版社

69、,2011年</p><p>  [4] 賈俊平,《統(tǒng)計(jì)學(xué)》,北京:清華大學(xué)出版社,2004年</p><p><b>  八、附錄</b></p><p><b>  附錄1</b></p><p><b>  附錄2</b></p><p><

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論