醫(yī)學統(tǒng)計學-logistic回歸_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、衛(wèi)生統(tǒng)計學,第十五章 多因素對某定性指標 的影響分析,第一節(jié) Logistic回歸分析一、基本概念 應變量是分類變量 1 出現陽性結果(發(fā)病、有效、死亡等) Y = 0 出現陰性結果(未發(fā)病、無效、存活等),,,P:Y=1的率,P/(1-P)稱優(yōu)勢(比數),?0 :表示暴露劑量為0時個體發(fā)病與不 發(fā)病概率之比的自然對數?i : 表示在其它

2、自變量不變的條件下, Xi改變一個單位時logit P = 的改變量。,,,Logistic 回歸的特點,1、Logistic 回歸方程中,各自變量Xi變化范圍可以從 - ? 到 + ? ,Xi 可以是定量指標、等級指標或定性指標(需經數量化),而應變量P的變化范圍為0到1。 Z→∞時,P值漸近于1 Z→-∞時,P值漸近于02、Logistic 回歸系數和流行病學中反映各危險因素對疾病作用大小的

3、優(yōu)勢比有直接的聯系,并把單因素兩水平下的優(yōu)勢比的定義擴展到多因素任意取值。,,設在一組自變量取值X0 下,某病發(fā)病的概率為P0 ,而在另外一組取值X1 下,某病發(fā)病的概率為P1,,,,變量Xi 由 改變?yōu)?而固定其它自 變量取值時,有ORi = exp[? i( ─ )] OR

4、i >1,高水平(數據大)率大,特別當 ─ = 1 時,,(Xi =1為暴露, Xi =0為非暴露) ORi = exp ?i 3、對于流行病學兩類調查研究方法? 前瞻性的隊列研究和回顧性的病例對 照研究,所建立的Logistic 回歸方 程,除常數項不同外,其它各回歸系 數均相同。,二、Logistic 回歸模型的配合,1.應變量為二分類的Logistic 回歸模型參數

5、估計采用最大似然函數估計法(maximum likelihood estimate),即根據n例實際觀測數據建立一個樣本的似然函數:,,,,Pi:i例暴露條件下陽性率,Yi=1陽性,Yi=0 陰性。若某對象陽性,,用迭代方法使以下目標函數達極大值,估計出bj,(1)AIC檢驗法(Akaike Information Criterion) L是最大似然

6、函數,g為應變量分類變量的分類數,k為模型中包含的自變量個數。AIC值越小,模型擬合越好。用于同一組數據下的不同模型間的比較。,H0: H1: 不全為0(含全不為0),,,,(2)SC檢驗法(Schwarte Criterion),式中,L是最大似然函數,g為應變量分類變量的分類數,k為模型中包含的自變量個數,n是樣本例數。和AIC一樣,SC值越小,模型擬合越好。用于比較同一組數據下的不同模型間的比較。,,,(3)似然比檢驗法,

7、服從自由度為k-p的χ2分布,p和k是兩個模型中包含的自變量個數。P<α,則有統(tǒng)計學意義。(4)計分檢驗法(Score)公式很復雜,它服從χ2分布,用于檢驗模型中全部自變量對應變量的聯合作用。,,,(5)Wald檢驗法,H0: H1:Wald 似然比檢驗法最可靠。 Somers’ D、 Gamma、 Tau-a 和C,越接近于1 說明模型擬合得的越好。選項“LACKFIT”對模型進行擬合優(yōu)度檢驗(

8、Goodness of fit statistics),P越大則說明模型擬合的越好。,,,,,例15-1. 為研究病情x1(0表示不嚴重,1表示嚴重)、年齡x2(歲)及不同治療方法x3(0表示傳統(tǒng)療法,1表示新療法)對某病療效的影響,某研究者隨機抽取40名某病的患者,其中有20名患者采用傳統(tǒng)療法,另20名患者采用新療法,經過一段治療后記錄下康復的情況y(0表示未康復,1表示康復),作logistic回歸分析。,data ex15_1;

9、input y x1-x3 @@;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0 38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0 29 0 0 0 34 0 0 0

10、 30 0 0 0 38 0 0 0 37 00 1 24 0 0 1 25 0 0 1 29 0 0 1 32 0 0 1 34 0 0 1 37 0 0 1 40 0 0 1 40 00 0 33 1 0 0 36 1 0 1 24 1 0 1 34 1 0 1 32 1 0 1 36 1 0 1 38 1 0 0 39 1;proc logistic descending simple;model y=x1-x3 /

11、stb scale=none aggregate lackfit ; units x2=10;run;,Response Profile Ordered Total Value y Frequency 1 1 17 2 0 23,Devia

12、nce and Pearson Goodness-of-Fit StatisticsCriterion DF Value Value/DF Pr > ChiSqDeviance 31 33.9290 1.0945 0.3281Pearson 31 27.2708 0.8797 0.6585,Testing

13、Global Null Hypothesis: BETA=0Test Chi-Square DF Pr > ChiSqLikelihood Ratio 9.5290 3 0.0230Score 8.5958 3 0.0352Wald 6.

14、9431 3 0.0737,Analysis of Maximum Likelihood Estimates Standard StandardizedParameter DF Estimate Error Chi-Squar

15、e Pr > ChiSq EstimateIntercept 1 2.3789 2.0279 1.3762 0.2407x1 1 -0.7767 0.7497 1.0731 0.3002 -0.2168x2 1 -0.1068 0.0677

16、 2.4864 0.1148 -0.3517x3 1 1.9570 0.8036 5.9303 0.0149 0.5464,Odds Ratio Estimates Point 95% WaldEffect Estimate

17、 Confidence Limitsx1 0.460 0.106 1.999x2 0.899 0.787 1.026x3 7.078 1.465 34.198 Adjust

18、ed Odds Ratios Effect Unit Estimate x2 10.0000 0.344,data ex15_1;input y x1-x3 @@;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0

19、38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0 29 0 0 0 34 0 0 0 30 0 0 0 38 0 0 0 37 00 1 24 0 0 1 25 0 0 1 29 0 0 1 3

20、2 0 0 1 34 0 0 1 37 0 0 1 40 0 0 1 40 00 0 33 1 0 0 36 1 0 1 24 1 0 1 34 1 0 1 32 1 0 1 36 1 0 1 38 1 0 0 39 1;proc logistic descending simple;model y=x1-x3 /selection=stepwise sle=0.1 sls=0.1 stb scale=none agg

21、regate lackfit; units x2=5;run;,The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Stan

22、dardizedParameter DF Estimate Error Chi-Square Pr > ChiSq EstimateIntercept 1 2.2718 1.9771 1.3204 0.2505x2 1 -0.1135 0.0663 2.9302 0

23、.0869 -0.3739x3 1 1.8346 0.7744 5.6126 0.0178 0.5122,Odds Ratio Estimates Point 95% WaldEffect Estimate Confidence Limitsx2

24、 0.893 0.784 1.017x3 6.263 1.373 28.573Adjusted Odds RatiosEffect Unit Estimate x2 5.0000 0.567,平均康復率大1歲是小1歲的0.893倍,平均康復率新療法是舊療

25、法的6.263倍,平均康復率大5歲是小5歲的0.567倍,2.應變量為有序分類變量的logistic回歸模型,醫(yī)學研究中經常要用到的應變量為有序分類變量,例如治療效果分為“無效、好轉、有效、治愈”,疾病的嚴重程度分為“無、輕、中、重”與“I期、Ⅱ期、Ⅲ期”等,分析各種因素自變量對這種有序分類變量的應變量的影響時也可采用logistic回歸模型。SAS軟件中的logistic回歸過程是以累積概率函數的形式提供的。,設應變量y為k個等級的有

26、序分類變量,不妨設y的k個取值按等級順序為1、2、…、k。對y取值小于等于等級j(j=1、2、…、k)的概率即取前j個值的累積概率用來表示,則有:,,,,,當,j=1、2、…、k-1,例如對k=3時有:,,,因而應變量y取等級1、2、3的概率為:,例15-2. 某醫(yī)院外科采用兩種不同繃帶(x1=0為第一種繃帶,x1=1為第二種繃帶)和兩種不同的包扎方式(x2=0為第一種包扎方式,x2=1為第二種包扎方式)進行腿部潰瘍處理。治療效果分為三

27、個等級:不愈、有效、痊愈(y=0為不愈,y=1為有效、y=2為痊愈)。治療結果如表15-3 所示。試分析不同的治療方式對治療效果的影響。,data ex15_2;input y x1 x2 f@@;cards;00019 1 004200 2 0 109110 8 2 10600121 1 013201 2 0 11

28、 1011110 2 115;proc logistic descending ;model y=x1 x2 /stb scale=none aggregate lackfit ; freq f;run;,Analysis of Maximum Likelihood Estimates Standard

29、 StandardizedParameter DF Estimate Error Chi-Square Pr > ChiSq EstimateIntercept 1 -2.6678 0.4656 32.8253 <.0001Intercept2 1 -1.1709

30、 0.3929 8.8791 0.0029 x1 1 1.6430 0.4380 14.0708 0.0002 0.4550 x2 1 -0.1903 0.4189 0.2063 0.6496 -0.0527

31、 Odds Ratio Estimates Point 95% WaldEffect Estimate Confidence Limitsx1 5.171 2.191 12.201x2 0.827 0.364 1.879,,,Y取值2、痊愈:等級1;Y取值

32、1、有效:等級2;Y取值0、無效:等級3。,三種治療效果的概率估計為:,痊愈:,,有效:,,無效:,,但是回歸系數的假設檢驗結果只有繃帶種類x1有統(tǒng)計意義,包扎方式x2無統(tǒng)計意義。x1的OR=5.171,95%的可信區(qū)間為(2.191,12.201),區(qū)間不包含1,表示使用第二種繃帶約是使用第一種繃帶效果(痊愈的比例,痊愈及有效的比例)的5.171倍。,第二節(jié) 條件Logistic回歸,在研究設計階段,為控制混雜干擾因素常按干擾因

33、素的不同取值設置相匹配的配比組,病例與對照之比為1:1或n:m。 ,i=1,2,…,n,,例15-3 收集了63對有關子宮內膜癌的數據,Y=0為對照,Y=1為病例,自變量因素為膽囊有無病變(gall=0為無病變,gall=1為有

34、病變)和有無高血壓Hyper(hyper=0為無,hyper=1為有).試分析在控制血壓的條件下膽囊有無病變所引起的相對風險。,data li15_3; input i y x1-x2@@; t=2-y;cards;1 1 0 0 1 0 0 0 2 1 0 0 2 0 0 03 1 0 1 3 0 0 1 4 1 0 0 4 0 1 05 1 1 0 5 0 0

35、 1 6 1 0 1 6 0 0 07 1 1 0 7 0 0 0 8 1 1 1 8 0 0 19 1 0 0 9 0 0 0 10 1 0 0 10 0 0 0………………………………………………..;proc phreg; model t*y(0)=x1-x2/ ties=discrete; strata i; run;,The PHREG Proc

36、edure Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 4.5487

37、 2 0.1029 Score 4.3620 2 0.1129 Wald 4.0060 2 0.1349 A

38、nalysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Chi-Square Pr > ChiSq

39、 Ratio x1 1 0.97041 0.53073 3.3432 0.0675 2.639 x2 1 0.34807 0.37696 0.8526 0.3558 1.416,data li15_3; input i y x1-x2@@

40、; t=2-y; cards; 1 1 0 0 1 0 0 0 2 1 0 0 2 0 0 0 3 1 0 1 3 0 0 1 4 1 0 0 4 0 1 0 5 1 1 0 5 0 0 1 6 1 0 1 6 0 0 0 7 1 1 0 7 0 0 0 8 1 1 1 8 0 0 1

41、 9 1 0 0 9 0 0 0 10 1 0 0 10 0 0 0 11 1 1 0 11 0 0 0 12 1 0 0 12 0 0 1 ……………………………………………… ;proc phreg; model t*y(0)=x1-2/selection=stepwisesle=0.1 sls=0.1 ties=discrete; strata i; run;,An

42、alysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Chi-Square Pr > ChiSq Ratiox1

43、 1 0.95551 0.52623 3.2970 0.0694 2.600 Summary of Stepwise Selection Variable

44、 Number Score WaldStep Entered Removed In Chi-Square Chi-Square Pr > ChiSq1 x1 1 3.5556 .

45、 0.0593,子宮內膜癌發(fā)病率有膽囊病變平均是無膽囊病變的2.6倍,例15-4 為研究肥胖X1(X1=1為肥胖,X1=0為不肥胖)、口服避孕藥雌激素X2(X2=1為服用雌激素,X2=0 未服用雌激素)與子宮內膜癌的關系,隨機選取20名患者。對于每名患者,再隨機選取年齡相近的2名正常人作為對照。,data li15_4; input i x1-x2 y @@; t=2-y; cards; 1 1 1 1 1 0 0 0 1 0

46、 0 0 2 1 1 1 2 1 1 0 2 0 1 0 3 1 1 1 3 0 1 0 3 1 1 0 4 0 1 1 4 0 0 0 4 0 1 0 5 0 0 1 5 1 0 0 5 0 1 0 6 1 1 1 6 0 0 0 6 1 0 0 7 1 1 1 7 0 1 0 7 1 1 0 8 1 1 1 8 1 0 0 8 1 1 0 9 1 0 1 9 1 1 0

47、 9 1 1 0 10 0 1 1 10 0 1 0 10 0 0 0 11 0 1 1 11 0 1 0 11 1 0 0 12 0 1 1 12 0 1 0 12 0 1 0 13 1 1 1 13 0 0 0 13 1 1 0 14 1 1 1 14 0 0 0 14 1 0 0 15 1 1 1 15 0 0 0 15 0 1 0 16 0 1 1 16 0 1 0 16 0 1 0 17 0 1 1 17 0 0 0

48、17 1 0 0 18 1 1 1 18 1 0 0 18 0 1 0 19 1 0 1 19 0 1 0 19 0 1 0 20 1 1 1 20 0 1 0 20 0 0 0;proc phreg; model t*y(0)=x1-x2/selection=stepwise sle=0.1 sls=0.1 ties=discrete;strata i; run;,Testing Global Null Hypothesis:

49、 BETA=0Test Chi-Square DF Pr > ChiSqLikelihood Ratio 10.6377 2 0.0049Score 8.8725 2 0.0118Wald 5.9789

50、2 0.0503 Analysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Ch

51、i-Square Pr > ChiSq Ratiox1 1 1.82388 0.84948 4.6098 0.0318 6.196x2 1 1.58959 0.80897 3.8611 0.0494 4.902,第三節(jié) Logisti

52、c 回歸模型的醫(yī)學應用及其注意事項,一、Logistic 回歸模型在醫(yī)學中的應用 1、分析流行病學的研究中進行危險因子的篩選。2、校正混雜因子。把混雜因子當作自變量來對 待,利用Logistic 回歸對其進行調正和分析。3、Logistic 曲線擬合可用于分析藥物或毒物的 劑量反應。 4、判別分析與預測。,二、Logistic 回歸模型應用的注意事項,1.變量的取值形式Y: 兩分類,多分類有序,多分類無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論