版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、<p><b> 本科畢業(yè)論文</b></p><p><b> (20 屆)</b></p><p> 曲線擬合方法及其在實際問題中的應用 </p><p> 所在學院 </p&g
2、t;<p> 專業(yè)班級 信息與計算科學 </p><p> 學生姓名 學號 </p><p> 指導教師 職稱 </p><p> 完成日期 年 月 </p><p
3、><b> 摘要</b></p><p> 回歸分析是統(tǒng)計學中的重要統(tǒng)計方法之一, 主要用來尋找并推斷具有相關關系的變量之間的數(shù)量關系式, 有著廣泛的應用領域和很高的實用價值. 本文主要通過一個實例詳細介紹了建立回歸模型步驟, 以及如何利用建立好的模型來進行預測. 通過定性分析選取與財政收入有較強相關性的幾個影響因素, 利用1994~2009年財政收入和其影響因素的數(shù)據(jù), 建立多元
4、線性回歸模型, 并根據(jù)此模型預測出2011年得財政收入, 且結果與其他文獻中的數(shù)據(jù)相吻合. </p><p> 關鍵詞: 多元線性回歸; 最小二乘; 財政收入預測</p><p><b> Abstract</b></p><p> Regression analysis is one of the important statistic
5、al methods of statistics, mainly using to find and infer a quantity equation between correlation variables, and it has a wide range of applications and high practical value. This thesis described in detail the steps to e
6、stablish regression models, and it makes use of well-established model to predict by an example, by qualitatively analysing and selecting several factors which have a strong related with revenue, using the data of revenu
7、e and i</p><p> Keywords: Multiple linear regression; Least squares; Revenue projections</p><p><b> 目錄</b></p><p><b> 摘要I</b></p><p> Abstr
8、actII</p><p><b> 1 前言1</b></p><p> 2 多元回歸分析3</p><p> 2.1 多元線性回歸模型的建立3</p><p> 2.2 多元線性回歸方程的檢驗4</p><p> 2.3 利用多元線性回歸方程進行預測5</p>
9、<p> 2.4 非線性回歸分析6</p><p> 3 多元線性回歸分析在實際問題中的應用8</p><p><b> 小結13</b></p><p><b> 參考文獻14</b></p><p> 致謝錯誤!未定義書簽。</p><p&g
10、t;<b> 1 前言</b></p><p> 在實際的工程應用和經(jīng)濟應用領域中, 人們往往只能測得一些分散的數(shù)據(jù), 為了從這些分散的數(shù)據(jù)點中找到規(guī)律, 就需要利用這些分散的數(shù)據(jù)點, 運用最小二乘法、多項式或其他的已知函數(shù)等方法來生成一個新的多項式或是新的函數(shù)來逼近這些已知點, 回歸分析就是從這些分散點之間的相互關系出發(fā), 通過對與對象有聯(lián)系的現(xiàn)象變動趨勢的分析, 進而推算出對象未來狀
11、態(tài)數(shù)量表現(xiàn)的一種方法. 但是, 客觀現(xiàn)象之間的聯(lián)系是復雜的, 許多現(xiàn)象的變動都涉及到多個變量之間的數(shù)量關系. 這種研究某一因變量與多個自變量之間的相互關系的理論和方法就是多元線性回歸法. </p><p> 回歸分析在現(xiàn)實社會中應用及其廣泛, 農(nóng)業(yè), 工業(yè), 醫(yī)學, 環(huán)境, 特別是經(jīng)濟等領域都得到廣泛的應用. 2002年禹學禮, 陳洪軍, 艾華水等人在文獻[1]中通過四元回歸分析, 改進了以往體重與體積的估計關
12、系式, 得出黃牛體重與體高、體斜長、胸圍、管圍有著密切的關系. 2005年徐東雨, 李靜在文獻[2]中通過Excel工具和多元回歸, 分析大量醫(yī)學實例數(shù)據(jù), 得到了人體中血糖的含量與胰島素含量和生長素含量的關系. 2006年王彬, 李川, 李蘭等人在文獻[3]中根據(jù)對上海市1995~2004年度各年生活垃圾產(chǎn)生量及各主要影響因子的大量數(shù)據(jù), 通過回歸分析, 得出利用原始數(shù)據(jù)建立模型對未來城市垃圾產(chǎn)生量進行預測不能只考慮垃圾產(chǎn)生量單方面的
13、因素, 應該對各個相關因素都考慮在內(nèi)且取相關性較大的因素建立模型, 進而提出了控制和治理城市垃圾的方案從而能夠達到令人滿意的效果. 2007年翟世杰, 杜啟花在文獻[4]中通過對以往投資與GDP或投資與財政收入之間的關系研究文獻的改進, 對1995~2004年度投資額與GDP和財政收入進行回歸分析, 得出投資與財政收入GDP之間擬合模型, 并根據(jù)此模型</p><p> 本文主要介紹了多元線性回歸模型的原理,
14、建立過程, 檢驗方法, 以及在實際問題中的應用, 并利用多元線性回歸方程對我國財政收入進行了分析和預測, 得出了財政收入與國民總收入, 總人口, 固定資產(chǎn)投資, 就業(yè)人口, 第一產(chǎn)業(yè)生產(chǎn)總值, 第二產(chǎn)業(yè)生產(chǎn)總值幾個因素的線性關系, 并預測出了2011年我國的財政收入. </p><p><b> 2 多元回歸分析 </b></p><p> 2.1 多元線性回歸模
15、型的建立</p><p> 假設隨機變量與個變量有關, 對于自變量的一組確定的值, 有它的分布. 則元線性回歸模型為</p><p><b> .(2.1)</b></p><p> 設有一組觀測值, 根據(jù)最小二乘原理, 只要求使</p><p><b> ,</b></p>
16、<p> 達到最小的. 由于Q是的一個非負二次型, 故其最小值必存在, 根據(jù)微積分的理論知道, 只要求Q對的一階偏導為0, 即</p><p><b> ,</b></p><p> 整理后可得關于的一個線性方程組</p><p><b> ,(2.2)</b></p><p>
17、; 稱上式為正規(guī)方程組, 其解為的最小二乘估計, 為了方便, 可用矩陣形式簡潔地表示出來. 令</p><p><b> ,</b></p><p> 因而用矩陣形式表示即為</p><p><b> ,</b></p><p> 在回歸分析中, 通常是非奇異的, 即存在, 這時最小二乘估
18、計可以表示為</p><p><b> ,(2.3)</b></p><p><b> 即回歸模型為</b></p><p><b> .(2.4)</b></p><p> 當求得了的最小二乘估計后, 就可建立回歸方程(2.1), 從而就可以利用它對指標進行預報和
19、控制.</p><p> 2.2 多元線性回歸方程的檢驗</p><p> 檢驗是從統(tǒng)計意義上看參數(shù)估計量是否成立, 而驗證是探討所擬定的模型是否與實際情況相符合.我們對所得出的參數(shù)估計量和數(shù)學模型, 要進行檢驗和驗證. 模型的假設檢驗和參數(shù)的檢驗是十分重要, 只有檢驗和驗證通過后, 方能進行進一步探討分析. </p><p> 1. 回歸方程的顯著性檢驗&l
20、t;/p><p> 對回歸方程的顯著性檢驗, 可以通過在多元線性回歸模型基本假定條件下對統(tǒng)計假設檢驗來完成, 一般用運用檢驗, 即檢驗</p><p><b> (2.5)</b></p><p><b> 是否成立.</b></p><p> 多元線性回歸方程顯著性檢驗的統(tǒng)計量</p&g
21、t;<p><b> ,</b></p><p> 其中是回歸平方和(為的平均值), 是殘差平方和, 回歸自由度, 是殘差自由度. 對于給定的顯著性水平, 當檢驗統(tǒng)計量的觀測值時, 拒絕原假設, 即認為與之間有線性關系. </p><p> 2. 回歸系數(shù)的顯著性檢驗</p><p> 當與之間有線性關系, 但是否每個變量
22、都能起到顯著性作用呢? 如果因子對的影響不顯著, 那么應近似有, 因此要檢驗因子對是否有顯著性影響, 就相當于檢驗假設</p><p><b> ,(2.6)</b></p><p><b> 是否成立</b></p><p><b> 使用統(tǒng)計量</b></p><p&g
23、t;<b> .</b></p><p> 來檢驗統(tǒng)計量是否為零, 即對的影響是否顯著. 這里是矩陣主對角線上第個元素. 對于給定的顯著性水平, 當?shù)挠^測值時, 拒絕假設, 認為對有顯著影響. </p><p> 2.3 利用多元線性回歸方程進行預測</p><p> 當確定了回歸方程后, 就可以用點預測對于給定的一組自變量來預測因變量
24、, 但在實際問題中還需要知道預測精度, 所以還需要給出預測區(qū)間, 設是一個隨機變量. 則</p><p><b> ,</b></p><p><b> 又已知</b></p><p><b> ,</b></p><p> 與相互獨立. 于是, 由分布定義有</
25、p><p><b> ,</b></p><p> 從而, 對于給定的顯著性水平, 可以找到使得</p><p><b> .</b></p><p><b> 若令</b></p><p><b> ,</b></p&
26、gt;<p><b> 則有</b></p><p><b> .(2.7)</b></p><p> 因此, 對于給定的, 以作為的估計值, 其誤差限為, 可靠性為; 的置信度為的預測區(qū)間. 這里不難看出用估計其精度與殘差平方和密切相關, 因此, 是回歸預測精度的一個重要指標. </p><p>
27、 2.4 非線性回歸分析</p><p> 前面主要介紹了多元線性回歸, 但在有些實際問題中, 變量之間關系是復雜的, 即(因變量)和(自變量)的關系并不是線性的, 這就需要運用非線性回歸分析. 非線性關系一般有三種類型, 第一種類型是通過變量替換可換轉成線性類型. 第二種是自變量和因變量之間關系的函數(shù)形式不是很明確, 這種需要運用多元逐步回歸來求解. 第三種是非線性問題, 自變量和因變量之間的函數(shù)關系式是明確
28、的, 但不能轉換為線性類型, 這就需要更為復雜的擬合方法來求解. </p><p> 一般情況下非線性回歸模型可以表示為</p><p><b> ,</b></p><p> 式中為可觀測的獨立隨機變量(自變量), 是待估的參數(shù)向量, 是獨立觀測變量(因變量), 是隨機誤差.</p><p> 非線性回歸模型主
29、要有兩種不同的解法. 其中一個是最小二乘法, 即求向量與集合的最短距離</p><p><b> ,</b></p><p> 假設函數(shù)對參數(shù)連續(xù)可微, 利用微分法,將對參數(shù)求偏導, 且令其為0, 得到個方程, 建立正規(guī)方程組, 求解使達到最小的, </p><p><b> , </b></p>&l
30、t;p> 一般用Newton求解該方程組, 得出. </p><p> 另外一種是極大似然法, 假設誤差的分布密度函數(shù)是已知的, 然后作似然函數(shù), 再求其最大值, 即</p><p><b> ,</b></p><p> 以上兩種非線性回歸模型的解法的使用場合各有不同, 一般情況下, 當模型的主體部分占優(yōu)勢時, 有最小二乘法比較
31、合適, 當隨機誤差作用占優(yōu)勢時, 則用極大似然法比較合適. </p><p> 3 多元線性回歸分析在實際問題中的應用</p><p> 財政收入作為一國政府的活動, 是政府職能的具體體現(xiàn), 主要有資源配置, 收入再分配和宏觀經(jīng)濟調控三大職能. 財政收入是政府部門的公共收入, 是國民收入分配中用于保證政府行使其公共職能、實施公共政策以及提供公共服務的資金需求. 財政收入的增長情況關系這
32、一個國家經(jīng)濟的發(fā)展和社會的進步. </p><p> 影響財政收入的因素很多, 但離不開一些基本的經(jīng)濟變量. 大多數(shù)相關的研究文獻中都把國民總收入這個指標作為影響財政收入的基本因素, 還有一些文獻中也提出了其他一些變量, 比如其總人口、固定資產(chǎn)投資、就業(yè)人口等. 從財政收入的部門又可以得出我國財政收入主要來自與工業(yè)、農(nóng)業(yè)、商業(yè)、交通運輸、與服務業(yè)等部門. 其中工業(yè)和農(nóng)業(yè)對財政收入的影響最大. 所以通過研究經(jīng)濟理
33、論對財政收入的解釋以及實踐的觀察, 本文認為財政收入主要與國民總收入、總人口、固定資產(chǎn)投資、就業(yè)人口、農(nóng)業(yè)生產(chǎn)總值、工業(yè)生產(chǎn)總值等有關系. </p><p> 本文樣本數(shù)據(jù)的來源為《中國統(tǒng)計年鑒》(1994年~2009年),如表3.1, 其中為財政收入, 為國民總收入 (億元), 為總人口(萬人), 為固定資產(chǎn)投資(億元), 為就業(yè)人口(萬人), 為農(nóng)業(yè)生產(chǎn)總值(億元), 為工業(yè)生產(chǎn)總值(億元). </p
34、><p> 將財政收入與各因素之間的關系寫成(2.2), 并用EXCEL進行多元回歸分析, 數(shù)據(jù)如下</p><p><b> 表3.2</b></p><p><b> 表3.3</b></p><p> 表3.1 財政收入與各指標的數(shù)據(jù)</p><p><b&g
35、t; 表3.4</b></p><p> 由表3.4和式(2.3)可看出各參數(shù)系數(shù)為</p><p> =0.627321, =-0.96687, =-0.0603, =0.494398, =-0.50519, =-0.65635. </p><p> 由表3.2得決定系數(shù)為0.999985, 非常接近1, 即財政收入可寫成國民總收入, 總人口,
36、 固定資產(chǎn)投資, 就業(yè)人口, 第一產(chǎn)業(yè)生產(chǎn)總值, 第二產(chǎn)業(yè)生產(chǎn)總值的多元線性回歸模型. 所以根據(jù)式(2.4)得到回歸方程為</p><p><b> .</b></p><p> (1) 回歸方程的顯著性檢驗</p><p> 對回歸方程的顯著性檢驗, 就是要看自變量從整體上對因變量是否有明顯的影響. 因此, 可提出統(tǒng)計假設</p&
37、gt;<p><b> .</b></p><p> 如果被接受, 則表明因變量與自變量之間的關系由線性回歸模型表示不合適, 多元線性回歸方程顯著性檢驗的統(tǒng)計量為 </p><p><b> , </b></p><p> 由表3.3得回歸離差平方和, 總的偏差平方和</p><p
38、><b> ,</b></p><p> 殘差平方和, 回歸自由度, 殘差自由度 </p><p><b> .</b></p><p> 取,查分布表得臨界值</p><p><b> , </b></p><p> 拒絕假設, 認為
39、在顯著性水平下, 對有顯著的線性關系, 也即回歸方程是顯著的. </p><p> (2) 回歸系數(shù)的顯著性檢驗</p><p> 回歸方程的顯著并不意味著每個自變量對因變量的影響都顯著, 就應從回歸方程中剔除那些次要的、可有可無的變量, 建立更為簡單的回歸方程. </p><p> 假設, 如果接受假設, 則不顯著; 如果拒絕假設, 則是顯著的.使用量式&l
40、t;/p><p><b> . </b></p><p> 來檢驗統(tǒng)計量是否為零, 即對的影響是否顯著. 這里是矩陣主對角線上第個元素. </p><p> 由上文可知殘差平方和, </p><p> 令顯著性水平, 根據(jù)matlab可得到</p><p> , , ,&l
41、t;/p><p> , , ,</p><p><b> 故由式</b></p><p><b> ,</b></p><p><b> 可得</b></p><p><b> , ,</b></p&g
42、t;<p><b> , ,</b></p><p><b> ,,</b></p><p> 查表的. 可看出變量對都有顯著影響, 故財政收入可寫成國民總收入, 總人口, 固定資產(chǎn)投資, 就業(yè)人口, 第一產(chǎn)業(yè)生產(chǎn)總值, 第二產(chǎn)業(yè)生產(chǎn)總值的多元線性回歸模型, 即回歸方程為</p><p><b&g
43、t; .</b></p><p><b> (3) 預測</b></p><p> 假設給定2011年(國民總收入)為 395900.12億元, (總人口)為134100萬人) , (固定資產(chǎn)投資為)為274632.5億元, (就業(yè)人口)為80012萬人, 為農(nóng)業(yè)生產(chǎn)總值為37087億元, 工業(yè)生產(chǎn)總值為163476.87億元. 即為</p&g
44、t;<p><b> ,</b></p><p> 假設, 估計2011年國家的財政收入, 以及其預測區(qū)間. 預測值</p><p><b> ,</b></p><p> 根據(jù)式(2.7)得出預測區(qū)間</p><p><b> ,</b></p&
45、gt;<p> 所以的置信度為95%的預測區(qū)間為. </p><p> 通過方程各種檢驗, 得到如下結論: 回歸方程通過了所有統(tǒng)計檢驗, 故2011年國家的財政收入為億元, 且在顯著性水平上, 我國財政收入的預測區(qū)間為. </p><p> 根據(jù)文獻[7]中, 崔志坤, 朱秀變通過對國民經(jīng)濟發(fā)展變化和財政收入本身的變動趨勢, 對國家財政收入進行的預測, 預測2011年國
46、家財政收入為93855.27億元, 這個結論在和本文的結論基本符合, 在預測區(qū)間內(nèi). 但他們提出財政收入預測屬于宏觀經(jīng)濟指標的預測, 是根據(jù)國民經(jīng)濟發(fā)展變化和財政收入本身的變動趨勢, 且只考慮了這個因素來對國家財政收入進行的預測, 但財政收入受多種因素影響, 而不僅僅是一個因素, 所以本文在此基礎上, 通過篩選影響財政收入的因素, 利用多元回歸分析, 擬合出一個相對比較合理的方程, 并對2011年中國的財政收入進行預測, 結果和大部分文
47、獻中的預測數(shù)據(jù)相符合. 但財政收入的預測不是依靠一個公式、一個方程就能解決的, 而是一個不斷完善的過程. </p><p><b> 小結</b></p><p> 回歸分析是數(shù)理統(tǒng)計中一種常用方法, 它通過建立統(tǒng)計模型研究變量間的相關關系, 既可以分析變量間關系的密切程度, 又是進行結構分析、政策評價、預測和控制的有效工具. 回歸分析技術隨著它本身的不斷完善和發(fā)
48、展以及應用領域的不斷擴大, 必將在統(tǒng)計學中占有更重要的位置, 所以研究回歸分析就顯得非常必要. </p><p> 本文系統(tǒng)介紹了多元線性回歸模型的原理, 建立過程, 檢驗方法, 預測方法. 并將其運用在財政收入的實際問題中. 通過建立財政收入與其相關影響因素的多元回歸方程, 以及進行方程和系數(shù)檢驗, 得到一個合理的方程, 并根據(jù)這個方程預測了2011年的財政收入以及它的預測區(qū)間, 可以看出多元線性回歸對實際生
49、活和生產(chǎn)中的問題可以作出一定的預測, 并對其有一定的指導作用. </p><p><b> 參考文獻</b></p><p> 禹學禮, 陳洪軍, 艾華水, 栗穎華, 昝林森. 引用四元回歸分析估測黃牛活重[J]. 西北農(nóng)林科技大學學報, 2002, 30(6): 72~77. </p><p> 徐東雨, 李靜. 利用Excel進行醫(yī)學
50、統(tǒng)計多元回歸分析[J]. 醫(yī)學信息, 2005, 18(6): 575~677. </p><p> 王彬, 李川, 李蘭, 王秋蘋. 多元線性回歸預測模型在城市垃圾產(chǎn)量預測中的應用[J]. 新疆環(huán)境保護, 2006, 24(3): 37~39. </p><p> 翟世杰, 杜啟花. 投資額與GDP 和財政收入的回歸分析及預測[J]. 改革與開放, 2009, 11(3): 133~
51、134. </p><p> 白萍. 影響我國財政收入的多元線性回歸模型[J]. 統(tǒng)計與決策, 2005, 5(13): 92~94. </p><p> Ruixiang Bi. Fiscal Revenue Forecasting System Research [C]. In: IEEE 2010 International Conference on Future Inform
52、ation Technology and Management Engineering, Beijing, 2010, 48~51. </p><p> 崔志坤, 牛秀變. 中國近期及中期財政收入預測分析[J]. 統(tǒng)計與決策, 2010, 311(11): 112~114. </p><p> 倪蘇敏, 劉萍. 多元線性回歸分析方法在計劃決策系統(tǒng)中的運用[J]. 北京聯(lián)合大學學報, 1
53、994, 3(4): 19~23. </p><p> 魏宗舒. 概率論與數(shù)理統(tǒng)計教程[M]. 北京: 高等教育出版社, 2008. </p><p> Richard L. Burden, J. Douglas Faires. Numerical Analysis [M]. Beijing: Higher Education Press, 2009. </p><
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 曲線擬合方法及其在實際問題中的應用【開題報告】
- 曲線擬合方法及其在實際問題中的應用【文獻綜述】
- 淺談導數(shù)在解決實際問題中的應用[畢業(yè)論文]
- 函數(shù)模型應用畢業(yè)論文--函數(shù)模型及其在解決實際問題中的應用
- matlab在實際問題中的分析與應用
- 淺談導數(shù)在解決實際問題中的應用[畢業(yè)論文+開題報告+文獻綜述]
- 曲線擬合原理及其應用研究.pdf
- 基于matlab的不同曲線擬合方式的比較研究畢業(yè)論文
- 線性規(guī)劃理論在實際問題中的應用
- origin曲線擬合
- 循環(huán)水泵曲線擬合及其應用研究
- 定積分在實際問題中的應用
- 動態(tài)規(guī)劃方法及其在資源分配問題中的應用【畢業(yè)論文】
- 淺談導數(shù)在解決實際問題中的應用[開題報告]
- 信息與計算科學畢業(yè)論文蒙特卡羅方法的應用
- 信息與計算科學畢業(yè)論文--貪心法及其應用
- 淺談導數(shù)在解決實際問題中的應用文獻綜述
- 基于深度函數(shù)的曲線擬合方法研究.pdf
- 基于曲線擬合方法的故障測距應用研究.pdf
- 第4單元 圓周運動在實際問題中的應用
評論
0/150
提交評論