2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、現(xiàn)實生活中的許多數(shù)據(jù)都是隨機產(chǎn)生的,如考試分數(shù)、月降雨量、燈泡壽命等。,從數(shù)理統(tǒng)計角度來看,這些數(shù)據(jù)其實都是符合某種分布的,這種規(guī)律就是統(tǒng)計規(guī)律。,本實驗主要通過對概率密度函數(shù)曲線的直觀認識和數(shù)據(jù)分布的形態(tài)猜測,以及密度函數(shù)的參數(shù)估計,進行簡單的正態(tài)假設檢驗,揭示日常生活中隨機數(shù)據(jù)的一些統(tǒng)計規(guī)律。,問題背景和實驗目的,Matlab相關命令介紹,pdf 概率密度函數(shù),y=pdf(name,x,A),y=pdf(name,x,A,B) 或

2、y=pdf(name,x,A,B,C),返回由 name 指定的單參數(shù)分布的概率密度,x為樣本數(shù)據(jù),name 用來指定分布類型,其取值可以是: 'beta'、'bino'、'chi2'、'exp'、'ev'、'f' 、 'gam'、'gev'、'gp'、'geo'、

3、9;hyge'、'logn'、 'nbin'、'ncf'、'nct'、'ncx2'、'norm'、 'poiss'、'rayl'、't'、'unif'、'unid'、'wbl'。,返回由 name 指定的雙參數(shù)或三參數(shù)分布的概率密度,M

4、atlab相關命令介紹,例:,x=-8:0.1:8;y=pdf('norm',x,0,1);y1=pdf('norm',x,1,2);plot(x,y,x,y1,':'),注:,y=pdf('norm',x,0,1),y=normpdf(x,0,1),,相類似地,,y=pdf('beta',x,A,B),y=betapdf(x,A,B),,y=pdf(

5、'bino,x,N,p),y=binopdf(x,N,p),,…… ……,Matlab相關命令介紹,normfit 正態(tài)分布中的參數(shù)估計,[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha),對樣本數(shù)據(jù) x 進行參數(shù)估計,并計算置信度為 1-alpha 的置信區(qū)間 alpha 可以省略,缺省值為 0.05,即置信度為 95%,load 從matlab數(shù)據(jù)文件中載入數(shù)據(jù),S=l

6、oad('數(shù)據(jù)文件名'),hist 繪制給定數(shù)據(jù)的直方圖,hist(x,m),Matlab相關命令介紹,table=tabulate(x),繪制頻數(shù)表,返回值 table 中,第一列為x的值,第二列為該值出現(xiàn)的次數(shù),最后一列包含每個值的百分比。,ttest(x,m,alpha),假設檢驗函數(shù)。此函數(shù)對樣本數(shù)據(jù) x 進行顯著性水平為 alpha 的 t 假設檢驗,以檢驗正態(tài)分布樣本 x(標準差未知)的均值是否為 m。,Ma

7、tlab相關命令介紹,normplot(x),統(tǒng)計繪圖函數(shù),進行正態(tài)分布檢驗。研究表明:如果數(shù)據(jù)是來自一個正態(tài)分布,則該線為一直線形態(tài);如果它是來自其他分布,則為曲線形態(tài)。,wblplot(x),統(tǒng)計繪圖函數(shù),進行 Weibull 分布檢驗。,Matlab相關命令介紹,其它函數(shù),cdf 系列函數(shù):累積分布函數(shù) inv 系列函數(shù):逆累積分布函數(shù) rnd 系列函數(shù):隨機數(shù)發(fā)生函數(shù) stat 系列函數(shù):均值與方差函數(shù),例:,p=norm

8、cdf(-2:2,0,1),x=norminv([0.025 0.975],0,1),n=normrnd(0,1,[1 5]),n=1:5; [m,v]=normstat(n'*n,n'*n),常見的概率分布,連續(xù)分布:正態(tài)分布,正態(tài)分布(連續(xù)分布),如果隨機變量 X 的密度函數(shù)為:,則稱 X 服從正態(tài)分布。記做:,標準正態(tài)分布:N (0, 1),正態(tài)分布也稱高斯分布,是概率論中最重要的一個分布。,如果一個變量是大量微小

9、、獨立的隨機因素的疊加,那么它一定滿足正態(tài)分布。如測量誤差、產(chǎn)品質(zhì)量、月降雨量等,正態(tài)分布舉例,x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,':'),例:標準正態(tài)分布和非標準正態(tài)分布密度函數(shù)圖形,連續(xù)分布:均勻分布,均勻分布(連續(xù)分布),如果隨機變量 X 的密度函數(shù)為:,則稱 X 服從均勻分布。記做:,均勻分布在實際中經(jīng)常使用,譬如一個半徑

10、為 r 的汽車輪胎,因為輪胎上的任一點接觸地面的可能性是相同的,所以輪胎圓周接觸地面的位置 X 是服從 [0,2?r] 上的均勻分布。,均勻分布舉例,x=-10:0.01:10;r=1;y=unifpdf(x,0,2*pi*r);plot(x,y);,連續(xù)分布:指數(shù)分布,指數(shù)分布(連續(xù)分布),如果隨機變量 X 的密度函數(shù)為:,則稱 X 服從參數(shù)為 ? 的指數(shù)分布。記做:,在實際應用問題中,等待某特定事物發(fā)生所需要的時間往往服從指數(shù)

11、分布。如某些元件的壽命;隨機服務系統(tǒng)中的服務時間;動物的壽命等都常常假定服從指數(shù)分布。,指數(shù)分布具有無記憶性:,指數(shù)分布舉例,x=0:0.1:30;y=exppdf(x,4);plot(x,y),例: ?=4 時的指數(shù)分布密度函數(shù)圖,離散分布:幾何分布,幾何分布是一種常見的離散分布,在貝努里實驗中,每次試驗成功的概率為 p,設試驗進行到第 ? 次才出現(xiàn)成功,則 ? 的分布滿足:,其右端項是幾何級數(shù)

12、 的一般項,于是人們稱它為幾何分布。,x=0:30; y=geopdf(x,0.5); plot(x,y),例: p=0.5 時的幾何分布密度函數(shù)圖,離散分布:二項式分布,二項式分布屬于離散分布,如果隨機變量 X 的分布列為:,則稱這種分布為二項式分布。記做:,x=0:50;y=binopdf(x,500,0.05);plot(x,y),例: n=500,p=0.05 時的二項式分布密度函數(shù)圖,離散分布: Poisson 分布,泊

13、松分布也屬于離散分布,是1837年由發(fā)個數(shù)學家 Poisson 首次提出,其概率分布列為:,記做:,泊松分布是一種常用的離散分布,它與單位時間(或單位面積、單位產(chǎn)品等)上的計數(shù)過程相聯(lián)系。如:單位時間內(nèi),電話總機接到用戶呼喚次數(shù);1 平方米內(nèi),玻璃上的氣泡數(shù)等。,Poisson 分布舉例,x=0:50;y=poisspdf(x,25);plot(x,y),例: ?=25 時的泊松分布密度函數(shù)圖,離散分布:均勻分布,如果隨機變量 X

14、的分布列為:,則稱這種分布為離散均勻分布。記做:,n=20;x=1:n;y=unidpdf(x,n);plot(x,y,'o-'),例: n=20 時的離散均勻分布密度函數(shù)圖,抽樣分布: ?2分布,設隨機變量 X1, X2, … , Xn 相互獨立,且同服從正態(tài)分布 N(0,1),則稱隨機變量 ?n2= X12+X22+ … +Xn2服從自由度為 n 的 ?2 分布,記作

15、 ,亦稱隨機變量 ?n2 為 ?2 變量。,x=0:0.1:20; y=chi2pdf(x,4); plot(x,y),例: n=4 和 n=10 時的 ?2 分布密度函數(shù)圖,x=0:0.1:20; y=chi2pdf(x,10); plot(x,y),抽樣分布: F 分布,設隨機變量 ,且 X 與 Y 相互獨立,則稱隨機變量,x=0.01

16、:0.1:8.01;y=fpdf(x,4,10);plot(x,y),例: F(4,10) 的分布密度函數(shù)圖,為服從自由度 (m, n) 的 F 分布。記做:,抽樣分布: t 分布,設隨機變量 ,且 X 與 Y 相互獨立,則稱隨機變量,x=-6:0.01:6;y=tpdf(x,4);plot(x,y),例: t (4) 的分布密度函數(shù)圖,為服從

17、自由度 n 的 t 分布。記做:,頻數(shù)直方圖或頻數(shù)表,對于給定的數(shù)據(jù)集,假設它們滿足以上十種分布之一,如何確定屬于哪種分布?,x=load('data1.txt'); x=x(:);hist(x),例 1:某次筆試的分數(shù)見 data1.txt,試畫出頻數(shù)直方圖,繪制頻數(shù)直方圖,或列出頻數(shù)表,從圖形上看,筆試成績較為接近正態(tài)分布,頻數(shù)直方圖或頻數(shù)表,x=load('data2.txt'); x=x(:);

18、hist(x),例 2:某次上機考試的分數(shù)見 data2.txt,試畫出頻數(shù)直方圖,從圖形上看,上機考試成績較為接近離散均勻分布,x=load('data3.txt'); x=x(:);hist(x),例 3:上海1998年來的月降雨量的數(shù)據(jù)見 data3.txt , 試畫出頻數(shù)直方圖,從圖形上看,月降雨量較為接近 ?2 分布,頻數(shù)直方圖或頻數(shù)表,在重復數(shù)據(jù)較多的情況下,我們也可以利用Mat

19、lab自帶的 tabulate 函數(shù)生成頻數(shù)表,并以頻數(shù)表的形式來發(fā)掘數(shù)據(jù)分布的規(guī)律。,x=load('data4.txt'); x=x(:);tabulate(x)hist(x),例 4:給出數(shù)據(jù) data4.txt,試畫出其直方圖,并生成頻數(shù)表,頻數(shù)直方圖或頻數(shù)表,x=load('data5.txt'); x=x(:);hist(x)fiugrehistfit(x) % 加入較接近的正態(tài)

20、分布密度曲線,例 5:現(xiàn)累積有100次刀具故障記錄,當故障出現(xiàn)時該批刀具完成的零件數(shù)見 data5.txt,試畫出其直方圖。,從圖形上看,較為接近正態(tài)分布,參數(shù)估計,當我們可以基本確定數(shù)據(jù)集 X 符合某種分布后,我們還需要確定這個分布的參數(shù)。,由于正態(tài)分布情況發(fā)生的比較多,故我們主要考慮正態(tài)分布的情形。,對于未知參數(shù)的估計,可分兩種情況:,點估計 區(qū)間估計,參數(shù)估計:點估計,構造樣本 X 與某個統(tǒng)計量有關的一個函數(shù),作為該統(tǒng)計量的一個

21、估計,稱為點估計。,Matlab 統(tǒng)計工具箱中,一般采用最大似然估計法給出參數(shù)的點估計。,泊松分布 P (?) 的 ? 最大似然估計是,指數(shù)分布 Exp (?) 的 ? 最大似然估計是,點估計舉例,正態(tài)分布 N (?, ?2) 中, ? 最大似然估計是 , ?2 的最大似然估計是,x=load('data1.txt');x=x(:);[mu,sigma]=normfit(x),例 6:已知例

22、 1 中的數(shù)據(jù)服從正態(tài)分布 N (?, ?2) ,試求其參數(shù) ? 和 ? 的值。,使用 normfit 函數(shù),參數(shù)估計:區(qū)間估計,構造樣本 X 與某個統(tǒng)計量有關的兩個函數(shù),作為該統(tǒng)計量的下限估計與上限估計,下限與上限構成一個區(qū)間,這個區(qū)間作為該統(tǒng)計量的估計,稱為區(qū)間估計。,Matlab 統(tǒng)計工具箱中,一般也采用最大似然估計法給出參數(shù)的區(qū)間估計。,區(qū)間估計舉例,x=load('data1.txt'); x=x(:);

23、[mu,sigma,muci,sigmaci]=normfit(x),例 7:已知例 1 中的數(shù)據(jù)服從正態(tài)分布 N (?, ?2) ,試求出 ? 和 ?2 的置信度為 95% 的區(qū)間估計。,x=load('data6.txt'); x=x(:);[mu,sigma,muci,sigmaci]=normfit(x,0.01),例 8:從自動機床加工的同類零件中抽取16件,測得長度值見 data6.txt,已知零件長度服

24、從正態(tài)分布 N (?, ?2) ,試求零件長度均值 ? 和標準差 ? 的置信度為 99% 的置信區(qū)間。,假設檢驗,對總體的分布律或分布參數(shù)作某種假設,根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設,這就是假設檢驗問題。,以正態(tài)假設檢驗為例,來說明假設檢驗的基本過程。,正態(tài)假設檢驗,正態(tài)假設檢驗的一般過程:,假設檢驗:利用 Matlab 統(tǒng)計工具箱給出的常用的假設檢驗方法的函數(shù) ttest,

25、進行顯著性水平為 alpha 的 t 假設檢驗,以檢驗正態(tài)分布樣本 x(標準差未知)的均值是否為 m。運行結果中,當 h=1 時,表示拒絕零假設;當 h=0 時,表示不能拒絕零假設。,對比正態(tài)分布的概率密度函數(shù)分布圖,判斷某統(tǒng)計量的分布可能服從正態(tài)分布,利用統(tǒng)計繪圖函數(shù) normplot 或 wblplot 進行正態(tài)分布檢驗,正態(tài)假設檢驗舉例,x=load('data5.txt'); x=x(:);normplot(

26、x),例 9:試說明例 5 中的刀具使用壽命服從正態(tài)分布,并且說明在方差未知的情況下其均值 m 取為 597 是否合理。,(1) 對比刀具使用壽命分布圖與正態(tài)分布的概率密度分布函數(shù)圖,得初步結論:該批刀具的使用壽命可能服從正態(tài)分布。,解:,(2) 利用統(tǒng)計繪圖函數(shù) normplot 進行分布的正態(tài)性檢驗,結果顯示:這 100 個離散點非??拷鼉A斜直線段,即圖形為線性的,因此可得結論:該批刀具的使用壽命近似服從正態(tài)分布。,正態(tài)假設檢驗舉例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論