卡方檢驗統(tǒng)計課件_第1頁
已閱讀1頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2024/3/18,馬金鳳 bluerui123456@sina.com.cn,page1,11 Chi-square test,卡方檢驗,2024/3/18,Chi-square Test,page2,引言,,2024/3/18,Chi-square Test,page3,引言,,統(tǒng)計分析Statistical analysis,統(tǒng)計描述Statistical description,統(tǒng)計推斷Statistical infer

2、ence,,,統(tǒng)計圖statistical graph,統(tǒng)計指標statistical target,參數估計estimation of parameters,假設檢驗Hypothesis test,,統(tǒng)計表statistical table,2024/3/18,Chi-square Test,page4,引言,2024/3/18,Chi-square Test,page5,引言,2024/3/18,Chi-square Te

3、st,page6,卡方檢驗Chi-square test,? 讀作 chi ?2 卡方?2檢驗(chi-square test) 是現代統(tǒng)計學的創(chuàng)始人 Karl Pearson( 1857-1936 )于1900年提出的一種具有廣泛用途的計數資料的統(tǒng)計推斷方法 。,2024/3/18,Chi-square Test,page7,卡方檢驗Chi-square test,用途:兩個樣本率或多個樣本率

4、的比較兩個構成比或多個構成比的比較關聯性檢驗擬合優(yōu)度檢驗等,2024/3/18,馬金鳳 bluerui123456@sina.com.cn,page8,?2分布和擬合優(yōu)度檢驗,,2024/3/18,Chi-square Test,page9,卡方檢驗Chi-square test,?2檢驗是一種具有廣泛用途的計數資料的統(tǒng)計推斷方法 。?2檢驗的理論依據?2分布chi square distribution擬合優(yōu)度檢驗goo

5、dness of fit test,2024/3/18,Chi-square Test,page10,?2分布chi square distribution,?2分布是一種連續(xù)型隨機變量的概率分布若有k 個相互獨立的標準正態(tài)分布隨機變量Z1、Z2、…、Zk,則其平方和(Z12+Z22+…+Zk2)的分布稱為服從自由度v = k的 ?2分布,記為:?2(v),2024/3/18,Chi-square Test,page11,若Z服從標準

6、正態(tài)分布,那么Z2服從自由度為1的?2分布記作?2(1) 圖形:從縱軸某個點開始單調下降,先凸后凹。,0.0,0.1,0.2,0.3,0.4,0.5,,,,,,,,,Rejection Area,,?2分布chi square distribution,v = 1,2024/3/18,Chi-square Test,page12,?2分布chi square distribution,2024/3/18,Chi-square Test

7、,page13,?2分布 chi square distribution,?2分布是一簇單峰正偏態(tài)分布曲線, ?2取值范圍為0~∞。?2分布的形狀依賴于自由度ν的大小。當自由度ν>2時,隨著ν的增加,曲線逐漸趨于對稱。當自由度ν趨于∞時,?2分布逼近正態(tài)分布。 ?2界值表(教材附表9),,2024/3/18,Chi-square Test,page14,擬合優(yōu)度檢驗 goodness of fit test,根據樣本的頻率分布,

8、檢驗其總體分布是否服從于某種分布(正態(tài)分布、Poisson分布等)基本思想是判斷實際頻數( actual frequency )和理論頻數( theoretical frequency )的差別是否由抽樣誤差所引起,2024/3/18,Chi-square Test,page15,擬合優(yōu)度檢驗 goodness of fit test,擬合優(yōu)度檢驗(goodness of fit test)實際頻數用 A 表示,根據H0確定的理論頻

9、數用 T 表示,則構造的 ?2 統(tǒng)計量為:,,2024/3/18,Chi-square Test,page16,擬合優(yōu)度檢驗 goodness of fit test,擬合優(yōu)度檢驗(goodness of fit test)?2值的大小反映了實際頻數與理論頻數的吻合程度。在H0成立的條件下,實際頻數與理論頻數相差不應該很大,即?2值不會太大;若一次抽樣得到的?2值超過的預先規(guī)定檢驗水準所對應的?2界值,則有理由懷疑H0的成立,

10、,2024/3/18,Chi-square Test,page17,擬合優(yōu)度檢驗 goodness of fit test,例1 判斷表1所示數據是否服從正態(tài)分布?,表1 136例體模骨密度測量值頻數分布,2024/3/18,Chi-square Test,page18,擬合優(yōu)度檢驗 goodness of fit test,例1 判斷表1所示數據是否服從正態(tài)分布? 對該數據作正態(tài)分布擬合優(yōu)度檢驗。 136例體模

11、骨密度測量值的均數=1.260 標準差=0.010 檢驗的假設:  H0:總體分布為均數為1.260,標準差為0.010的正態(tài)分布  H1:總體分布不服從該正態(tài)分布,2024/3/18,Chi-square Test,page19,表2 136例體模骨密度測量值頻數分布表及擬合優(yōu)度檢驗統(tǒng)計量的計算,擬合優(yōu)度檢驗 goodn

12、ess of fit test,2024/3/18,Chi-square Test,page20,計算統(tǒng)計量:推斷結論: 自由度=10-1-2=7,查附表8,得到 ,P>0.50,可以認為該樣本服從正態(tài)分布。,,計算T 時的參數有2個(均數和標準差),擬合優(yōu)度檢驗 goodness of fit test,2024/3/18,Chi-square Test,page21,擬合優(yōu)度

13、檢驗 goodness of fit test,判斷樣本觀察頻數是否與某一理論頻數相符,即了解樣本是否來自某理論分布,2024/3/18,Chi-square Test,page22,1、建立檢驗假設    H0:樣本對應的總體分布服從給定的理論分布    H1:樣本對應的總體分布不服從給定的理論分布 2、確定檢驗水準 a = 0.053、計算檢驗統(tǒng)計量         ?2值反映了樣本實際頻數

14、分布與理論總體分布的符合程度。如果原假設成立, ?2值不會太大;反之,A若與T 差距大, ?2值也大;當?2值超出一定范圍時,就有理由認為原假設不成立。 4、確定相應的概率 P5、作出推斷結論,擬合優(yōu)度檢驗 goodness of fit test,,2024/3/18,Chi-square Test,page23,練習,某醫(yī)學院校醫(yī)生隨機抽取100名一年級醫(yī)學生,測定空腹血糖值(mmol/L),其頻數分布如右表中第(1)欄和第(2

15、)欄所示,試用檢驗判斷該資料是否符合正態(tài)分布。,,,2024/3/18,馬金鳳 bluerui123456@sina.com.cn,page24,獨立樣本2×2列聯表資料的?2檢驗,,2024/3/18,Chi-square Test,page25,完全隨機化設計兩樣本率比較,例2 將病情相似的169名消化道潰瘍患者隨機分為兩組,分別用洛賽克與雷尼替丁兩種藥物治療,4周后療效見下表。問兩種藥物治療消化道潰瘍的愈合率有無差別

16、?,2024/3/18,Chi-square Test,page26,完全隨機化設計兩樣本率比較,例2 將病情相似的169名消化道潰瘍患者隨機分為兩組,分別用洛賽克與雷尼替丁兩種藥物治療,4周后療效見下表。問兩種藥物治療消化道潰瘍的愈合率有無差別?,2024/3/18,Chi-square Test,page27,完全隨機化設計兩樣本率比較,原始數據四格表(2×2表)數據普通四格表的基本形式,,,2024/3/18,Ch

17、i-square Test,page28,完全隨機化設計兩樣本率比較,基本思想:可通過卡方檢驗的基本公式來理解理論頻數的計算理論數T 的計算是在假設檢驗H0成立的條件下,用兩樣本合計率來估計的。,,,,2024/3/18,Chi-square Test,page29,完全隨機化設計兩樣本率比較,(1)建立檢驗假設   H0: 兩藥的有效概率相同   H1: 兩藥有效概率不同 (2)檢

18、驗水準? =0.05(3)計算檢驗統(tǒng)計量  ? = (2-1)(2-1) = 1,,,,,2024/3/18,Chi-square Test,page30,完全隨機化設計兩樣本率比較,(4)確定 P 值 查附表8,?2界值表,?2 0.05,1= 3.84,P < 0.05。(5)結論: 按? 檢驗水準,拒絕H0,接受H1 ,兩樣本頻率的差異有統(tǒng)計學意

19、義??烧J為洛賽克、雷尼替丁兩種藥物治療消化道潰瘍的效果有差別。 鑒于洛賽克的治愈率是75.29%,雷尼替丁的愈合率為60.71%,可以認為洛賽克的愈合率比雷尼替丁的愈合率高。,,2024/3/18,Chi-square Test,page31,完全隨機化設計兩樣本率比較,四格表資料?2檢驗專用公式,2024/3/18,Chi-square Test,page32,完全隨機設計兩樣本率比較,當n≥40時,如果有某

20、個格子出現1≤ T <5,一般需用校正公式,,,2024/3/18,Chi-square Test,page33,完全隨機設計兩樣本率比較,例3 將病情相似的淋巴系腫瘤患者隨機分成兩組,分別做單純化療與復合化療,兩組的緩解率見下表,問兩療法的總體緩解率是否不同?,,,2024/3/18,Chi-square Test,page34,完全隨機設計兩樣本率比較,建立檢驗假設 H0: 兩法總體緩解概率相同

21、 H1: 兩法總體緩解概率不同 檢驗水準? = 0.05 ? = (2-1)(2-1) = 1 確定 P 值:查附表8,?2界值表,?2 0.10,1=1.21,P > 0.10在? = 0.05水準上不拒絕H0,差別無統(tǒng)計學意義,尚不能認為兩種治療方案的總體緩解概率不同。,,,,2024/3/18,Chi-square Test,page35,完全隨機設計兩樣本率比較,特別注意:

22、 當四格表出現T <1或 n < 40時,校正?2值也不恰當,這時必須用四格表的確切概率計算法(見本章第6節(jié))。,2024/3/18,Chi-square Test,page36,圖1 四格表資料的條件和公式,2024/3/18,Chi-square Test,page37,當n≥40且Tmin≥ 5時,?2檢驗基本公式或四格表專用公式;當n≥40,1≤Tmin<5時,需對?2值進行校正;當n<40或Tmin<

23、1時,改用四格表確切概率計算法。(?2檢驗所得概率P≈α時),2024/3/18,Chi-square Test,page38,完全隨機化設計兩樣本率比較,兩樣本率比較時,z檢驗和四格表?2檢驗是等價的,即v =1的?2 = z2 ;兩個樣本率的比較 ----四格表 (兩行兩列)多個樣本率的比較?,2024/3/18,馬金鳳 bluerui123456@sina.com.cn,page39,獨立樣本的R×C列

24、聯表資料的?2檢驗,,2024/3/18,Chi-square Test,page40,完全隨機化設計多樣本率比較,多( R )個率的比較,其基本數據有 R 行2列,構成 R×2表,用以表述 R 個率的基本數據。R×2表的?2檢驗用于推斷R個樣本率各自所代表的總體率是否相等。,2024/3/18,Chi-square Test,page41,完全隨機化設計多樣本率比較,例4 用三種不同治療方法治療慢性支氣管炎的療

25、效見下表,是比較三種治療方法治療慢性支氣管炎的療效。,2024/3/18,Chi-square Test,page42,完全隨機設計多樣本率比較,建立檢驗假設 H0: 三種治療方法的療效相同 H1: 不全相等 檢驗水準? = 0.05計算檢驗統(tǒng)計量 ? = (3-1)(2-1) =

26、 2 確定 P 值: ?2 0.005,2=10.60,P <0.005在? = 0.05水平上拒絕H0,接受H1,可以認為三種藥物的治療效果不全相同。,,,,2024/3/18,Chi-square Test,page43,完全隨機化設計多樣本率的比較,例5 某地調查了1995~1998四個年度中小學女生的貧血狀況,見下表,問各年度間學生貧血率有無差別?,2024/3/18,Chi-square Test,page44,完

27、全隨機化設計多樣本率的比較,H0:四個年度學生的貧血檢出率相等;H1:四個年度學生的貧血檢出率不等或不全相等。? =0.05。ν =(4-1)×(2-1)=3。查附表3,?2界值表,得P<0.005。按? =0.05水準,拒絕H0,接受H1,差異有統(tǒng)計學意義。故可認為該地四個年份中小學女生貧血檢出率不相等,2024/3/18,Chi-square Test,page45,完全隨機化設計多樣本率的比較,例

28、為研究某鎮(zhèn)痛藥的不同劑量鎮(zhèn)痛效果是否有差別,研究人員在自愿的原則下,將條件相似的53名產婦隨機分成三組, 分別按三種不同劑量服用該藥,鎮(zhèn)痛效果見下表。,2024/3/18,Chi-square Test,page46,完全隨機化設計多樣本率的比較,H0:三種劑量鎮(zhèn)痛有效的概率相同;H1:不同劑量鎮(zhèn)痛有效的概率不全相同? =0.05。ν =(3-1)×(2-1)=2。查附表3,?2界值表,得P<0.05。按?

29、 =0.05水準,拒絕H0,接受H1,差異有統(tǒng)計學意義。故可認為三種劑量鎮(zhèn)痛有效的總體概率不全相同,2024/3/18,Chi-square Test,page47,多個樣本率的多重比較,當多個樣本率比較的?2檢驗,結論為拒絕H0時,只能認為各總體率之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進一步比較哪些率之間有差別,應進行多重比較卡方分割,2024/3/18,Chi-square Test,page4

30、8,兩組或多組構成比的比較,構成比表示某一事物內部各組成部分所占的比重或分布,常用百分數表示計算特點:各部分構成比的合計為1或100%事物內部某一部分的構成比發(fā)生變化時,其他部分也會相應發(fā)生變化,2024/3/18,Chi-square Test,page49,兩組或多組構成比的比較,2024/3/18,Chi-square Test,page50,兩組或多組構成比的比較,2024/3/18,Chi-square Test,

31、page51,完全隨機化設計兩組構成比的比較,例 試分析兒童急性白血病患者與成年人急性白血病患者的血型分布(如下表)有無差別?,2024/3/18,Chi-square Test,page52,完全隨機化設計兩組構成比的比較,H0:兩組的總體構成比相同H1:兩組的總體構成比不同? =0.05 ν =(2-1)×(4-1)=3確定P值:查附表3,?2界值表,?2 0.75,3=

32、1.21,P > 0.75按? =0.05水準,不拒絕H0,尚不能認為兒童急性白血病患者與成年急性白血病患者血型分布不同,,2024/3/18,Chi-square Test,page53,完全隨機化設計兩組構成比的比較,例 北京市1986年城市和農村20至40歲已婚婦女避孕方法情況如表7-5所示(據王紹賢等調查資料),試分析北京城市和農村采用不同避孕方法的總體分布是否有差別。,2024/3/18,Chi-square Test,p

33、age54,完全隨機化設計兩組構成比的比較,H0:兩組的總體構成比相同H1:兩組的總體構成比不同? =0.05 ν =(2-1)×(4-1)=3確定P值:查附表3,?2界值表,?2 0.005,3=12.84,P <0.005按? =0.05水準,拒絕H0,接受H1,差異有統(tǒng)計學意義。故可認為城市和農村已婚婦女避孕方法的總體概率分布不同,,2024/3/18,馬金鳳 b

34、luerui123456@sina.com.cn,page55,配對設計資料的?2檢驗,,2024/3/18,Chi-square Test,page56,配對設計兩樣本率的比較,配對四格表資料?2檢驗的目的是通過對單一樣本數據的分析,推斷兩種處理的結果有無差別配對設計是醫(yī)學研究中常用的設計方法之一。二分類結果資料的配對研究常用于比較兩種檢驗方法、兩種培養(yǎng)方法、兩種提取方法等的差別。,2024/3/18,Chi-square Tes

35、t,page57,配對設計兩樣本率的比較,例 現有132份食品標本,把每份標本一分為二,分別用兩種檢驗方法作沙門氏菌檢驗,檢驗結果如下表所示,試比較兩種檢驗方法的陽性結果是否有差別?,2024/3/18,Chi-square Test,page58,配對設計兩樣本率的比較,原始數據,2024/3/18,Chi-square Test,page59,配對設計兩樣本率的比較,a、b、c、d 含義?甲法的陽性率、乙法的陽性率、兩法一致陽性率

36、、兩法一致率,2024/3/18,Chi-square Test,page60,配對設計兩樣本率的比較,配對四格表?2檢驗條件b + c≥40時b + c <40時( 20<b+c≤40時:計算?2C;當b+c≤20時,計算確切概率),2024/3/18,Chi-square Test,page61,配對設計兩樣本率的比較,H0:兩種檢驗方法的結果相同,即總體B=C;H1:兩種檢驗方法的結果不同,即總體B?C。?=0.

37、05。 v = 1確定 P 值:按? =1查?2界值表,?2 0.005,1=7.88,P <0.005在? =0.05水準上拒絕H0 ,接受H1,差異有統(tǒng)計學意義。可認為兩種檢驗方法的陽性結果有差別,鑒于甲法陽性率為68.20%,乙法陽性率為84.09%,可以認為乙法的陽性率高于甲法。,2024/3/18,Chi-square Test,page62,配對設計兩組頻數分布的

38、比較,例 對150名冠心病患者用兩種方法檢查室壁收縮運動的情況,檢測結果見下表。試比較兩種方法測定結果的概率分布是否相同?,2024/3/18,Chi-square Test,page63,配對設計兩組頻數分布的比較,H0:兩種測定方法的概率分布相同H1:兩種測定方法的概率分布不相同?=0.05

39、 =1.60v = k-1=2 確定P值:按? =2查?2界值表,?2 0.05,2= 5.99,P >0.05在? =0.05水準上不拒絕H0 ,差異無統(tǒng)計學意義。故尚不能認為甲法測定結果的概率分布與乙法測定結果的概率分布不同。,2024/3/18,Chi-square Test,

40、page64,?2檢驗要注意的問題,?2檢驗的條件使用?2檢驗在任何情況下都要注意理論頻數 T不能太小。一般要求各格的理論頻數均應大于1,且T<5的格子數不宜多于格子總數R×C 的1/5 出現某些格子中理論頻數過小時怎么辦?增大樣本含量(最好?。﹦h去該格所在的行或列(丟失信息?。└鶕I(yè)知識將該格所在行或列與別的行或列合并。(丟失信息!甚至出假象),2024/3/18,Chi-square Test,page

41、65,?2檢驗要注意的問題,關于似然比 ?2 統(tǒng)計量作 ?2 檢驗,既可以計算Pearson ?2統(tǒng)計量,也可以計算似然比 ?2 (Likelihood ratio chi-square)統(tǒng)計量,2024/3/18,Chi-square Test,page66,?2檢驗要注意的問題,多組比較時,若效應有強弱的等級,如+,++,+++,最好采用后面的非參數檢驗方法。?2檢驗只能反映其構成比有無差異,不能比較效應的平均水平,2024/3/

42、18,馬金鳳 bluerui123456@sina.com.cn,page67,四格表資料的確切概率法,,2024/3/18,Chi-square Test,page68,普通四格表的確切概率法,該法是由R.A.Fisher (1934年)提出的, 其理論依據是超幾何分布,簡稱Fisher確切概率法。超幾何分布( hypergeometric distribution )此方法不屬于?2檢驗范疇,但可作為四格表?2檢驗應用上的補充

43、四格表資料,若有理論數小于1或n < 40或作?2檢驗后所得概率P 接近檢驗水準?,需用確切概率(exact probability) 法直接計算概率以作判斷。,2024/3/18,Chi-square Test,page69,普通四格表的確切概率法,該法基本思想:在四格表邊緣合計固定不變的條件下,利用下列公式直接計算表內四個格子數據的各種組合的概率然后計算單側或雙側累計概率,并與檢驗水準?比較,作出是否拒絕H0的結論

44、。,2024/3/18,Chi-square Test,page70,普通四格表的確切概率法,例 將23名精神抑郁癥患者隨機分到兩組,分別用兩種藥物治療,結果見下表,問兩種藥物的治療效果是否不同?,2024/3/18,Chi-square Test,page71,普通四格表的確切概率法,本例n < 40,只能選用四格表的確切概率法。其假設檢驗的步驟如下:建立檢驗假設H0 :?1 = ?2 兩種藥物治療效果相等H1 :

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論