預(yù)防醫(yī)學(xué)]04抽樣誤差與假設(shè)檢驗(yàn)_第1頁
已閱讀1頁,還剩45頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章 抽樣誤差與假設(shè)檢驗(yàn),Sampling error & Hypothesis test,本章結(jié)構(gòu),均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)的意義和步驟,均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,Standard error,統(tǒng)計(jì)推斷(statistical inference),inference,抽樣誤差的概念,定義:由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間、以及樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量之間的差別。原因:個(gè)體變異+隨機(jī)抽

2、樣表現(xiàn):樣本統(tǒng)計(jì)量與總體參數(shù)間的差別不同樣本統(tǒng)計(jì)量間的差別,假設(shè)一個(gè)已知總體,從該總體中抽樣,對每個(gè)樣本計(jì)算樣本統(tǒng)計(jì)量(均數(shù)、方差等),觀察樣本統(tǒng)計(jì)量的分布規(guī)律--抽樣分布規(guī)律。考察:不同的分布不同的樣本含量,抽樣試驗(yàn),從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對1000份樣本的均數(shù)作直方圖。

3、 按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。,抽樣試驗(yàn)(n=5),抽樣試驗(yàn)(n=10),抽樣試驗(yàn)(n=30),3個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示,,樣本均數(shù)的抽樣分布特點(diǎn),各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多、兩邊少,左右基本對稱,也服從正態(tài)分布;樣本均數(shù)的變異較原變量的變異大大縮小。隨著樣本含量的增加,樣本均數(shù)的變異范圍逐漸縮小。,標(biāo)準(zhǔn)誤的概念(s

4、tandard error),樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),用樣本方差代替,,標(biāo)準(zhǔn)誤的概念,抽樣的樣本量越大,標(biāo)準(zhǔn)誤就越小; 原來總體變異度小,標(biāo)準(zhǔn)誤就越小。 標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)之間的差異。當(dāng)標(biāo)準(zhǔn)誤大時(shí),用樣本均數(shù)對總體均數(shù)的估計(jì)的可靠程度就??;反之亦然。,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤,意義:標(biāo)準(zhǔn)差用于描述個(gè)體值之間的變異,即觀察值間的

5、離散度, 標(biāo)準(zhǔn)差小,表明觀察值圍繞均數(shù)的波動(dòng)??;標(biāo)準(zhǔn)誤描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度。標(biāo)準(zhǔn)誤小,表明抽樣誤差小,則統(tǒng)計(jì)量穩(wěn)定,與參數(shù)接近。用途:標(biāo)準(zhǔn)差表示觀察值間波動(dòng)的大小,用于醫(yī)學(xué)參考值范圍;標(biāo)準(zhǔn)誤表示抽樣誤差的大小,用于參數(shù)估計(jì)。關(guān)系:隨著樣本含量增加,都減小。聯(lián)系:都是表示變異度的指標(biāo),當(dāng)樣本量一定時(shí),兩者成正比。,中心極限定理(central limit theorem),中心極限定理(centr

6、al limit theorem),t-分布,t-distribution,t 分布的概念,用樣本方差代替總體方差,此時(shí)不再服從正態(tài)分布。而服從 t 分布。記為:,t分布曲線,t 分布有如下性質(zhì):①單峰分布,曲線在t=0 處最高,并以t=0為中心左右對稱②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見綠線)③ 隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。,t分布曲線下面積(附表2),雙側(cè)t0.05/2,9=

7、2.262 =單側(cè)t0.025,9單側(cè)t0.05,9=1.833雙側(cè)t0.01/2,9=3.250 =單側(cè)t0.005,9單側(cè)t0.01,9=2.821雙側(cè)t0.05/2,∞=1.96 =單側(cè)t0.025,∞單側(cè)t0.05,∞ =1.64,總體均數(shù)的估計(jì),Parameter estimation,總體均數(shù)估計(jì)方法,區(qū)間估計(jì)(interval estimation),也稱置信區(qū)間。利用樣本信

8、息給出一個(gè)區(qū)間,并同時(shí)給出按預(yù)先給定的概率估計(jì)該區(qū)間包含總體均數(shù)的可能范圍。,可信度:給定的概率稱為可信度。用 表示。通常取99%、95%。,t分布方法,應(yīng)用條件:總體方差未知,樣本量小,例4.2 某醫(yī)師側(cè)的40名老年性慢性支氣管炎病人尿中17-酮類固醇排出量均數(shù)為15.19umol/d,標(biāo)準(zhǔn)差為5.03umol/d,試估計(jì)該種病人尿17-酮類固醇排出量總體均數(shù)的95%可信區(qū)間。,分析條件:總體方差未知,樣本量小,正態(tài)分

9、布近似法,,應(yīng)用條件:當(dāng)總體標(biāo)準(zhǔn)差已知時(shí);或總體標(biāo)準(zhǔn)差未知,而樣本量較大時(shí)(n>50),例4.3 某市隨機(jī)抽查12歲男孩100人,得身高均數(shù)139.6cm,標(biāo)準(zhǔn)差6.85cm。計(jì)算該地12歲男孩身高均數(shù)的95%的可信區(qū)間。,分析條件:總體方差未知,但樣本量大,用正態(tài)分布法,95%可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括μ(估計(jì)正確),只有5個(gè)可信區(qū)間

10、不包括μ(估計(jì)錯(cuò)誤)。,可信區(qū)間的涵義,可信度實(shí)驗(yàn),可信區(qū)間的兩個(gè)基本要素,準(zhǔn)確度:可信區(qū)間包含總體均數(shù)的概率。精密度:反映區(qū)間的長度。,假設(shè)檢驗(yàn),Hypothesis test,讓我們先看一個(gè)例子.,例4.4 根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查30名健康男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?,對差別的可能原

11、因分析,山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等,差異是由抽樣誤差引起的——提示山區(qū)男子是一般男子總體的一部分(研究總體)。山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等,差異可能是由地域等因素引起的——提示山區(qū)男子與一般男子是兩個(gè)不同的總體。,假設(shè)檢驗(yàn)——通過對假設(shè)作出取舍抉擇來達(dá)到解決問題的目的A.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等 無差異假設(shè)、零假設(shè) H0(null hypo

12、thesis)B.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等 對立假設(shè)、備擇假設(shè)H1(alternative hypothesis),證明A還是證明B?在H0成立的條件下,均數(shù)之間的差異是由抽樣誤差引起的,有規(guī)律可循;在H1成立的條件下,均數(shù)間的不同包含種種未知情形,無規(guī)律可循。故從H0成立的角度出發(fā),尋求其成立的概率。,變量值(脈搏)X服從正態(tài)分布,且為小樣本,假定H0成立,樣本均數(shù)服從t-分布,則

13、 在H0成立的前提下,當(dāng)前t值出現(xiàn)的概率有多大???,如何給出這個(gè)量的界限?,小概率事件在一次試驗(yàn)中基本上不會發(fā)生 !,從附表2中查出在顯著性水平=0.05(雙側(cè)),自由度為29所對應(yīng)的t界值,即為拒絕域與接受域的界限。如果計(jì)算出的t統(tǒng)計(jì)量大于相應(yīng)的t界值,則落在拒絕域中,該統(tǒng)計(jì)量出現(xiàn)的概率小于5%,為小概率事件。,常取,的選擇要根據(jù)實(shí)際情況而定,通常取0.05,檢驗(yàn)水準(zhǔn)的概念,在假設(shè)檢驗(yàn)中,稱預(yù)先規(guī)定的小概率值為檢驗(yàn)水準(zhǔn),也稱為顯著

14、性水準(zhǔn),用 表示。,這里所依據(jù)的邏輯是:,如果H0 是成立的,那么衡量差異大小的某個(gè)統(tǒng)計(jì)量落入?yún)^(qū)域 拒絕域 是個(gè)小概率事件。如果該統(tǒng)計(jì)量的實(shí)測值落入拒絕域,也就是說, H0 成立下的小概率事件發(fā)生了,那么就認(rèn)為H0不可信而否定它。否則我們就不能否定H0 (只好接受它).,1. 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn); H0:零假設(shè)、無效假設(shè)。是與研究假設(shè)有關(guān)的、被推斷特征某種確定的關(guān)系; H1:備擇假設(shè)、對立假設(shè)。是被推斷總體特征的另

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論