stata面板數(shù)據(jù)回歸詳細(xì)介紹_第1頁
已閱讀1頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、面板數(shù)據(jù)回歸,,面板數(shù)據(jù)是同時(shí)在時(shí)間和截面上取得的二維數(shù)據(jù)。所以,面板數(shù)據(jù)(panel data)也稱時(shí)間序列截面數(shù)據(jù)(time series and cross section data)或混合數(shù)據(jù)(pool data)。,面板數(shù)據(jù)用雙下標(biāo)變量表示。例如 Yit, i = 1, 2, …, N; t = 1, 2, …, TN表示面板數(shù)據(jù)中含有N個(gè)個(gè)體。T表示時(shí)間序列的最大長度。,對于樣本點(diǎn)來說:,Stata中面板數(shù)據(jù)

2、的表示,在stata中,首先使用xtset命令指定個(gè)體特征和時(shí)間特征,然后可以用xtdes命令顯示面板數(shù)據(jù)的結(jié)構(gòu)。use grunfeld,clearxtset company yearxtdes,面板數(shù)據(jù)的建模方法主要有三種:固定效應(yīng)回歸模型隨機(jī)效應(yīng)回歸模型混合回歸模型,固定效應(yīng)模型,對于特定的個(gè)體i而言,ai 表示那些不隨時(shí)間改變的影響因素,如個(gè)人的消費(fèi)習(xí)慣、國家的社會制度、地區(qū)的特征、性別等,一般稱其為“個(gè)體效應(yīng)” (

3、individual effects)。如果把“個(gè)體效應(yīng)”當(dāng)作不隨時(shí)間改變的固定性因素, 相應(yīng)的模型稱為“固定效應(yīng)”模型。,固定效應(yīng)模型,對于固定效應(yīng)模型,可采用虛擬變量法?;舅枷耄汗潭ㄐ?yīng)模型實(shí)質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入 N-1 個(gè)虛擬變量,使得每個(gè)截面都有自己的截距項(xiàng)。由于固定效應(yīng)模型假設(shè)存在著“個(gè)體效應(yīng)”,每個(gè)個(gè)體都有其單獨(dú)的截距項(xiàng)。這就相當(dāng)于在原方程中引入n?1個(gè)虛擬變量(如果省略常數(shù)項(xiàng),則引入n個(gè)虛擬變量)來代表

4、不同的個(gè)體,獲得每個(gè)個(gè)體的截?fù)?jù)項(xiàng)。,例如:共有7個(gè)州,方程可以寫成:,7個(gè)州的回歸線斜率相同,但截距不同。第1個(gè)州的截距是:第2個(gè)州的截距是:第3個(gè)州的截距是:第4個(gè)州的截距是:,如何理解個(gè)體效應(yīng)、個(gè)體截距項(xiàng)的不同以及虛擬變量的引入?我們用一份模擬的數(shù)據(jù)來分析: use example,clear xtset company year xtdes 1。 畫出散點(diǎn)圖和擬合線,并建立OLS回歸方程。2。加入虛擬變量,并重

5、新畫出建立OLS回歸方程。,reg y x,gen d1=0gen d2=0replace d1=1 if id==2replace d2=1 if id==3reg y x d1 d2,固定效應(yīng)模型的估計(jì)算法,“個(gè)休中心化”O(jiān)LS算法或者組內(nèi)離差估計(jì)法假設(shè)原方程為:,(式1),給定第i 個(gè)個(gè)體,將(式1)兩邊對時(shí)間取平均可得,,(式2),(式1) – (式2),得:,可以用OLS方法一致地估計(jì)β ,稱為“固定效應(yīng)

6、估計(jì)量”(Fixed Effects Estimator),記為,由于 主要使用了每個(gè)個(gè)體的組內(nèi)離差信息,故也稱為“組內(nèi)估計(jì)量”(within estimator)。,固定效應(yīng)模型的優(yōu)勢和劣勢,面板固定效應(yīng)模型的優(yōu)勢是:即使個(gè)體特征ui與解釋變量Xit相關(guān),只要使用組內(nèi)估計(jì)量,就可以得到一致估計(jì),即即使存在不隨時(shí)間改變的遺漏變量,也可得到無偏一致的估計(jì)。面板固定效應(yīng)模型的劣勢是:模型無法估計(jì)不隨時(shí)間而變的變量之影響,這需要

7、用我們后面要講到的隨機(jī)效應(yīng)模型。,在交通事故死亡人數(shù)中的應(yīng)用,由于(10. 8)式中的“差分”回歸只用了1982年和1988年的數(shù)據(jù)(具體講就是這兩年的差額),而(10. 15)式中的固定效應(yīng)回歸用到了所有7年的數(shù)據(jù),因此這兩個(gè)回歸是不同的。由于利用了更多的數(shù)據(jù),因此(10. 15)式中的標(biāo)準(zhǔn)誤差小于(10. 8)式中的標(biāo)準(zhǔn)誤差。,固定效應(yīng)模型的stata實(shí)現(xiàn),use grunfeld,clear xtset company ye

8、ar xtdes xtline invest固定效應(yīng)模型:xtreg invest mvalue kstock ,fe,回歸結(jié)果解讀,1。三個(gè)R2哪個(gè)重要? 2。固定效應(yīng)為什么有兩個(gè)F檢驗(yàn)?F的自由度如何得出?3。corr(u_i, Xb) 的含義。4。 sigma_u、sigma_e、rho的含義。,1。因?yàn)楣潭ㄐ?yīng)模型是組內(nèi)估計(jì)量(離差),因此,只有within是一個(gè)真正意義上的R2,其他兩個(gè)是組間相關(guān)系數(shù)的平

9、方。2。右側(cè)的F統(tǒng)計(jì)量表示除常數(shù)項(xiàng)外其他解釋變量的聯(lián)合顯著性。最后一個(gè)F檢驗(yàn),原假設(shè)所有U_i=0,即不存在個(gè)體效應(yīng),此時(shí)證明pooled ols (混合回歸)更有效。,,首先注意:結(jié)果中的u_i不表示殘差,而是表示個(gè)體效應(yīng)。,3。corr(u_i, Xb) 個(gè)體效應(yīng)與解釋變量的相關(guān)系數(shù),相關(guān)系數(shù)為0或者接近于0,可以使用隨機(jī)效應(yīng)模型;相關(guān)系數(shù)不為0,需要使用固定效應(yīng)模型。4。sigma_u:表示個(gè)體效應(yīng)的標(biāo)準(zhǔn)差sigma_e

10、:表示干擾項(xiàng)的標(biāo)準(zhǔn)差rho:rho = sigma_u^2 / (sigma_u^2 + sigma_e^2) 表示個(gè)體效應(yīng)的波動(dòng)占整個(gè)波動(dòng)的比例。,拿到一份面板數(shù)據(jù),現(xiàn)在我們有四種方法進(jìn)行估計(jì):1。當(dāng)作一份截面數(shù)據(jù)直接估計(jì),這稱為混合OLS(pooled ols )。2。利用組內(nèi)離差法進(jìn)行估計(jì),這被默認(rèn)為固定效應(yīng)模型的一般估計(jì)方法。3。假設(shè)有i個(gè)個(gè)體,加入i-1個(gè)虛擬變量。4。為了得到每個(gè)個(gè)體具體的截距項(xiàng),加入i個(gè)虛擬變量

11、,同時(shí)省略常數(shù)項(xiàng)。我們用這四種方法進(jìn)行估計(jì)并比較結(jié)果。,use invest, clearxtset company year方法1:reg invest mvalue kstockest store ols方法2:xtreg invest mvalue kstock,feest store panel_1,方法3: tab company , gen(d)reg invest mvalue kstock d2

12、d3 d4 d5 est store panel_2方法4:reg invest mvalue kstock d1 d2 d3 d4 d5, nocons est store panel_3est table *, b(%6.3f) star(0.1 0.05 0.01),方法3還可以用如下簡單等價(jià)的命令實(shí)現(xiàn): xi:reg invest mvalue kstock i.company 即LSDV方法或者

13、添加虛擬變量法。,面板數(shù)據(jù)格式不符合要求的處理。例如如下表格格式該如何處理?處理方法:扁平數(shù)據(jù)變長條數(shù)據(jù)的命令:reshape use invest2,clear edit reshape long invest kstock, i(company) j(year),時(shí)間固定效應(yīng)回歸,其中St是只隨時(shí)間改變,不隨個(gè)體改變的變量。,和個(gè)體固定效應(yīng)能控制不隨時(shí)問變化但個(gè)體間不同的變量一樣,時(shí)間固定效應(yīng)能控制個(gè)體間相同

14、但隨時(shí)間變化的變量。 由于新車安全性能的提高是發(fā)生在全國范圍內(nèi)的。因此它們能夠減少所有州的交通死亡事故。故把汽車安全性能視為隨時(shí)間變化但對所有州都相同的遺漏變量是合理的。于是加入用St表示的汽車安全性能的效應(yīng)后,得:,只有時(shí)間效應(yīng),我們暫時(shí)假設(shè)Zi不出現(xiàn),方程變?yōu)椋?我們的目的是在控制St條件下估計(jì)ß1,在上述例子中加入時(shí)間固定效應(yīng)。實(shí)際上添加了t-1個(gè)時(shí)間虛擬變量。主要反映隨著時(shí)間變化的一些特征。 t

15、ab year,gen(yr) edit drop yr1 xtreg invest mvalue kstock yr*,fe大部分時(shí)間虛擬變量顯著,說明隨著時(shí)間的變動(dòng),invest有不斷變動(dòng)的趨勢。,個(gè)體和時(shí)間固定效應(yīng)(雙向固定效應(yīng)模型),如果某些遺漏變量不隨時(shí)間變化但隨州變化(如對酒后駕車的文化接受度),而其他遺漏變量不隨州變化但隨時(shí)間變化(如國家安全標(biāo)準(zhǔn)),則在模型中同時(shí)加入個(gè)體(州)和時(shí)間效應(yīng)更為恰當(dāng),我們稱

16、為雙向固定效應(yīng)模型。固定效應(yīng)模型: Yit=ai+Xitß1+εit雙向固定效應(yīng)模型:Yit=ai+λt+Xitß1+εit,雙向固定效應(yīng)模型的估計(jì),雙向固定效應(yīng)模型可以通過加入n-1個(gè)個(gè)體二元變量和T-1個(gè)時(shí)間二元變量進(jìn)行OLS估計(jì),但這會使解釋變量的數(shù)目變得極為龐大!所以一般我們還是采用組內(nèi)離差法進(jìn)行估計(jì)。 方法一:可以通過先從Y和X中減去個(gè)體和時(shí)間平均值,然后估計(jì)被減后的Y關(guān)于被減后的X的多元回歸方程的

17、方法來估計(jì)X的系數(shù)。這種方法可以避免二元變量的出現(xiàn)。 方法二:從Y, X和時(shí)間指示變量中減去個(gè)體(不是時(shí)間)均值然后估計(jì),被減后的Y對被減后的X和被減后的時(shí)間指示變量的多元回歸中的k+T個(gè)系數(shù)。,在交通死亡人數(shù)中的應(yīng)用,上述形式中包含了啤灑稅,47個(gè)州二元變量(州固定效應(yīng)),6個(gè)年二元變量(時(shí)間固定效應(yīng))和截距項(xiàng),所以這個(gè)模型的解釋變量個(gè)數(shù)多達(dá)55個(gè),這將帶來大量的自由度的損失。因?yàn)闀r(shí)間和州二元變量和截距項(xiàng)的系數(shù)不是我們主要感興趣的,

18、所以我們在這里沒有列出。 比較參數(shù)發(fā)現(xiàn)加入時(shí)間效應(yīng)后啤酒稅的系數(shù)由-0.66變?yōu)?0.64,可見加入時(shí)間效應(yīng)對結(jié)果影響不大。,固定效應(yīng)回歸假設(shè)和固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差,本章給出的標(biāo)準(zhǔn)誤差是利用一般異方差穩(wěn)健公式計(jì)算得到的。當(dāng)T中等大小或較大時(shí),在稱為固定效應(yīng)回歸假設(shè)的五個(gè)假設(shè)條件下面板數(shù)據(jù)中的這些異方差穩(wěn)健標(biāo)準(zhǔn)誤差都是正確的。,固定效應(yīng)回歸假設(shè),固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差,如果重要概念10.3中的假設(shè)5成立,則給定回歸變量條

19、件下,誤差u在時(shí)間上不相關(guān),在這種情況下如果T中等大小或較大時(shí),則常用(異方差穩(wěn)健)標(biāo)準(zhǔn)誤差是正確的。 如果誤差自相關(guān),則常用標(biāo)準(zhǔn)誤差公式不正確。理解這一點(diǎn)的一種方法是同異方差做類比。在截面數(shù)據(jù)回歸中,如果誤差異方差,則由于同方差適用的標(biāo)準(zhǔn)誤差是在同方差的錯(cuò)誤假設(shè)下導(dǎo)出的,因此是不正確的。類似地,如果面板數(shù)據(jù)中的誤差自相關(guān),則由于常用標(biāo)準(zhǔn)誤差是在它們沒有自相關(guān)的錯(cuò)誤假設(shè)下導(dǎo)出的,因此也是不正確的。,由于面板數(shù)據(jù)具有潛在異方差

20、且在給定個(gè)休的不同時(shí)間上潛在相關(guān)時(shí),正確的標(biāo)準(zhǔn)誤差稱為異方差和自相關(guān)一致的標(biāo)準(zhǔn)誤差(HAC)。這種標(biāo)準(zhǔn)誤差由稱為群標(biāo)準(zhǔn)誤差。在時(shí)間序列中使用的命令是newey在面板數(shù)據(jù)中使用的命令是xtgls,有關(guān)酒后駕車的法律規(guī)定和交通事故死亡人數(shù),酒精稅只是抑制酒后駕車的一種方法,如果某州想要打擊酒后駕車,可以通過增加稅收和嚴(yán)酷的法律來做到這一點(diǎn)。因此,即使在包含州和時(shí)間固定效應(yīng)的模型中遺漏這些有關(guān)酒后駕車的法律也會導(dǎo)致啤酒稅對交通死亡事故

21、效應(yīng)的OLS估計(jì)量中存在遺漏變量偏差。此外,是否開車也部分取決于司機(jī)是否有工作,同時(shí),稅收變化也反映了經(jīng)濟(jì)狀況(如州預(yù)算赤字會增加稅收)。所以遺漏州的經(jīng)濟(jì)狀況也會導(dǎo)致遺漏變量偏差。,本節(jié)中我們將前面的分析推廣到保持經(jīng)濟(jì)狀況不變條件下有關(guān)酒后駕車的法律規(guī)定(包括啤酒稅)對交通死亡事故效應(yīng)的研究。為此,我們需要估計(jì)包含其他酒后駕車法律和州經(jīng)濟(jì)狀況的回歸變量的面板數(shù)據(jù)回歸。這些結(jié)果刻畫了一幅抑制酒后駕車和交通死亡事故措施引發(fā)爭議的畫面。這些

22、估計(jì)值表明嚴(yán)厲的處罰和提高最低法定喝酒年齡對死亡率都不會產(chǎn)生重要作用。相反,有證據(jù)表明提高類似啤酒稅這樣的酒精稅會減少交通死亡率。但這個(gè)效應(yīng)的估計(jì)仍是不精確的。,隨機(jī)效應(yīng)模型,對于面板數(shù)據(jù)而言,除了我們前面講的混合回歸和固定效應(yīng)模型以外,還存在另外一種模型形式:隨機(jī)效應(yīng)模型。為了區(qū)別固定效應(yīng)模型和隨機(jī)效應(yīng)模型,我們把兩個(gè)模型的方程分別寫成:,固定效應(yīng)模型,隨機(jī)效應(yīng)模型,兩個(gè)模型看似一樣,但模型形式截然不同:在固定效應(yīng)模型中:

23、 作為一個(gè)隨機(jī)變量(解釋變量),標(biāo)示模型的個(gè)體效應(yīng)。而在隨機(jī)效應(yīng)模型中:隨機(jī)誤差項(xiàng)分成兩部分,一部分是不隨時(shí)間變化的誤差項(xiàng) ,另一部分是隨時(shí)間變化的誤差項(xiàng) ,即其中,關(guān)于隨機(jī)效應(yīng)模型:1。隨機(jī)效應(yīng)模型將固定效應(yīng)模型的個(gè)體效應(yīng)歸入到隨機(jī)誤差項(xiàng)中,因此更加靈活。2。固定效應(yīng)模型通過組內(nèi)離差的方法消除掉不隨時(shí)間改變的變量,這一方面保證了模型的無偏性,另一方面模型無法估計(jì)不隨時(shí)間改變的變量之影響,這在隨機(jī)效

24、應(yīng)模型中可以實(shí)現(xiàn)。3。回歸的結(jié)果是隨機(jī)效應(yīng)模型的所有的個(gè)體具有相同的截距項(xiàng),個(gè)體的差異主要反應(yīng)在隨機(jī)干擾項(xiàng)的設(shè)定上。,4。由于上述特性,隨機(jī)效應(yīng)模型比固定效應(yīng)模型結(jié)果更加有效,同時(shí),條件更加苛刻。,隨機(jī)效應(yīng)模型必須滿足下列條件:,一般在固定效應(yīng)模型中,隨機(jī)效應(yīng)模型:xtreg invest mvalue kstock ,re回歸結(jié)果解讀。與固定效應(yīng)模型的結(jié)果比較。,模型的篩選,至此,對于面板數(shù)據(jù),我們至少學(xué)習(xí)了三種估計(jì)方法。

25、1?;旌匣貧w( pooled ols )。2。固定效應(yīng)回歸模型。3。隨機(jī)效應(yīng)回歸模型。 三種回歸的結(jié)果往往不一致。當(dāng)拿到一個(gè)面板數(shù)據(jù)集時(shí),究竟該用哪種方法?,三種回歸的命令:混合回歸:reg invest mvalue kstock固定效應(yīng):xtreg invest mvalue kstock ,fe隨機(jī)效應(yīng):xtreg invest mvalue kstock ,re1。混合回歸還是固定效應(yīng)?xtreg in

26、vest mvalue kstock ,fe然后在結(jié)果中直接觀測F值。,2?;旌匣貧w還是隨機(jī)效應(yīng)?xtreg invest mvalue kstock ,rexttest0(BP檢驗(yàn))原假設(shè): ai 沒有干擾,可以用混合回歸。備則假設(shè): ai 的方差不為0,有干擾性,必須使用隨機(jī)效應(yīng)。,3。固定效應(yīng)還是隨機(jī)效應(yīng)? Hausman檢驗(yàn)基本思想:如果 , Fe 和 Re 都是

27、一致的,但Re更有效。 如果 , Fe 仍然一致,但Re是有偏的。 因此 原假設(shè): 即應(yīng)該采用隨機(jī)效應(yīng)。 備則假設(shè) 應(yīng)該采用固定效應(yīng)。,xtreg invest mvalue kstock ,fe est store fixed xtreg inves

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論