置信區(qū)間與假設(shè)檢驗_第1頁
已閱讀1頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第八章 置信區(qū)間與假設(shè)檢驗,單變量的估計,§1 點估計(Point Estimate),1. 定義用來估計總體參數(shù)的樣本統(tǒng)計量,稱為點估計。適用于只有一個樣本的情況。2. 方法:一般地,用 估計 ,S估計 。(樣本均值估計總體均值,樣本方差估計總體方差,見第六章 )對于正態(tài)分布的總體均值,可以用從總體中隨機抽取的樣本的均值來估計;對于非正態(tài)總體,有時也采用隨機樣本的均值來估計總體均值。,3.

2、 具體實現(xiàn)UNIVARIATE、MEANS等過程步4.對點估計精度的影響因素:樣本容量:大樣本給出的點估計會比較接近未知的總體均值的真值;方差:方差較小的總體,給出的點估計也會比較接近未知的總體均值的真值。,§2 置信區(qū)間(Confidence interval),1. 定義用于估計總體參數(shù)的一個取值范圍。2.應(yīng)用均值的置信區(qū)間(CI)給出了總體均值的一個區(qū)間估計(Interval Estimate);估

3、計形式:在總體均值點估計兩邊分別加了一個上限和下限。基于中心極限定理和經(jīng)驗規(guī)則(見第六章),3.構(gòu)造一個95%的置信區(qū)間(CI)包含以總體均值為中心的樣本均值分布密度曲線下面積的95%;以95%的概率包含總體均值。所以,若樣本均值 落入樣本均值分布的鐘型區(qū)域內(nèi)(見圖),所構(gòu)造的置信區(qū)間包含總體的均值。 但在實際應(yīng)用中, 是未知的。,4. SAS計算均值置信區(qū)間的公式說明: 是樣本均值;

4、 S 是樣本標(biāo)準差;n 是樣本容量;t 是給定置信水平和樣本容量的一個t分布的值,確定因素:df:自由度=n-1 :置信水平=1-此公式適用于當(dāng)總體方差 未知時,此時用t分布來擬和正態(tài)分布。,5. 實現(xiàn)1)在MEANS過程步中實現(xiàn)(見第六章)在MEANS語句中通過選項ALPHA=value設(shè)置置信區(qū)間;在統(tǒng)計量列表中給出關(guān)鍵字:UCLM、LCLM或CLM。2)用程序計算

5、t值的計算t值可通過在數(shù)據(jù)步中調(diào)用函數(shù)來計算,一般形式: DATA CACULT; tvalue=TINV(p,df); RUN; 其中 df=n-1 、 p=,6. 決定置信區(qū)間大小的因素置信水平置信水平越高,置信區(qū)間越大數(shù)據(jù)的波動樣本方差越大,置信區(qū)間越大樣本容量

6、樣本容量越大,置信區(qū)間越小,§3 假設(shè)檢驗(Hypothesis testing),1.零假設(shè)和備選假設(shè)1) 零假設(shè)描述總體性質(zhì)的一種想法。一般表示形式:H0:參數(shù)=值e.g. H0: μ=1.982) 備選假設(shè)是零假設(shè)在邏輯上對立的假設(shè)。一般表示形式:H1:參數(shù)≠值e.g. H1: μ ≠ 1.98,6.3 假設(shè)檢驗的方法建立零假設(shè)和備選假設(shè)之后,通過計算一個統(tǒng)

7、計量來檢驗零假設(shè);然后把該統(tǒng)計量值同參考值(零假設(shè)為真的情況下所期望的值)進行比較,比較結(jié)果是一個概率值( p值)。p值在零假設(shè)為真的條件下,能夠取到所計算的統(tǒng)計量的值的概率。判斷:若p值表明統(tǒng)計量值不可能合理的偶然取到,應(yīng)拒絕零假設(shè);若p值表明統(tǒng)計量值在零假設(shè)為真的條件下可能偶然取到,不能拒絕零假設(shè)。,6.4 顯著水平α一個拒絕零假設(shè)所需要的概率值。通常使用3個水平值:0.10(中等顯著)、0.05 (中等顯著) 、0

8、.01 (高度顯著) 。6.5 假設(shè)檢驗的步驟1)根據(jù)問題確定零假設(shè)H0和備選假設(shè)H1。2)確定一個顯著水平α。3)計算p值。4)比較p和α,做出判斷:p<α,拒絕零假設(shè);p≥α,接受零假設(shè);,6.6 有關(guān)零假設(shè)的錯誤α錯誤(第一類錯誤) 零假設(shè)成立時拒絕零假設(shè)。β錯誤(第二類錯誤) 零假設(shè)不成立時接受零假設(shè)。6.7 在SAS中的實現(xiàn)見UNIVARIATE和MEANS過程步。,7。在In

9、sight中的實現(xiàn)例:在數(shù)據(jù)集sashelp.class中,計算Height的描述性統(tǒng)計量,求置信水平為95%的置信區(qū)間,檢驗Height的均值為60英寸是否有顯著差異。1)選擇菜單項Analyze→Distribution(Y),2)在對話框Distribution(Y)中選擇要分析的變量Height,并點擊按鈕Y。 Height會出現(xiàn)在Y下面的列表框中。,3)點擊Output按鈕,選擇輸出內(nèi)容,并按OK按鈕。,矩統(tǒng)計量,分位數(shù),

10、基本置信區(qū)間,,,,4)回到對話框Distribution(Y)中,按OK按鈕,得到以下結(jié)果:,5)均值檢驗:選擇菜單項:Tables →Test for Location,在隨后出現(xiàn)的Test for Location對話框中輸入60。得到如下結(jié)果:不能拒絕零假設(shè)。,6)檢驗分布情況先通過Analyze→Distribution菜單打開需要分析的變量的分布窗口;然后選擇Curves →Test for D Distribution

11、;在隨后彈出的對話框中輸入分布種類和參數(shù);在Distribution窗口中將會顯示結(jié)果。,,,8。在分析員應(yīng)用中實現(xiàn)例:在數(shù)據(jù)集sashelp.class中,計算Height的描述性統(tǒng)計量,求置信水平為95%的置信區(qū)間,檢驗Height的均值為60英寸是否有顯著差異。8.1 計算常用描述性統(tǒng)計量1)選擇菜單項:Statistics →Descriptive →Summary Statistics(與過程步Mean等價)

12、或者選擇菜單項:Statistics →Descriptive →Distribution(與過程步Univariate等價),2)在隨后出現(xiàn)的對話框Summary Statistics:class(或Distributions:class )中左邊的列表框中選擇要分析的變量,并點擊Analysis。,設(shè)置統(tǒng)計量,,設(shè)置輸出格式,,3)進行其它設(shè)置后,最后點擊OK按鈕確定。,,分布擬合,8.2 求置信區(qū)間和參數(shù)檢驗1)選擇菜單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論