版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、2024/3/8,1,第二章 概率分布,2024/3/8,2,引 言,由于存在個體差異,即使從同一總體中抽取的兩份樣本之間也會有所不同,因此需要對總體特征做出描述。隨機(jī)變量的分布常見的有三種類型:,正態(tài)分布(normal distribution)二項(xiàng)分布(binominal distribution)Poisson 分布( Poisson distribution),,,離散型變量,連續(xù)型變量,,,2024/3/8,3,了
2、解正態(tài)分布的密度函數(shù)二項(xiàng)分布的應(yīng)用 Poisson分布的應(yīng)用,掌握正態(tài)分布曲線的特征及應(yīng)用二項(xiàng)分布的概念與特征Poisson分布的概念與特征,【教學(xué)目的】,2024/3/8,4,概念頻率密度圖的繪制例:隨機(jī)調(diào)查某醫(yī)院1402例待分娩孕婦,測得她們的體重。體重在各組段的頻數(shù)分布見表1第2列,并求得體重落在各組段的頻率(表1的第3列)。現(xiàn)以體重測量值為橫軸,以頻率與組距的比值為縱軸作出直方圖。由于該直方圖的縱軸表示在每個組段
3、內(nèi)單位長所占有的頻率,相當(dāng)于頻率密度,因此我們將此圖稱為頻率密度圖(見圖1)。,一、正態(tài)分布,2024/3/8,5,表1 某醫(yī)院1402例分娩孕婦體重頻數(shù)分布,圖1 體重頻率密度圖,2024/3/8,7,若將各直條頂端的中點(diǎn)順次連接起來,得到一條折線。當(dāng)樣本量n越來越大時,組段越分越細(xì),此時直方漸進(jìn)直條,這條折線就越來越接近于一條光滑的曲線(見圖1、2),我們把這條呈中間高,兩邊低,左右基本對稱的“鐘型”曲線稱為正態(tài)分布曲線,近似于數(shù)
4、學(xué)上的正態(tài)分布(高斯分布; Gauss)。,2024/3/8,8,圖1 體重頻率密度圖,圖2 概率密度曲線示意圖,2024/3/8,9,正態(tài)分布的密度函數(shù),,式中,m為總體均數(shù),s為總體標(biāo)準(zhǔn)差,p為圓周率,e為自然對數(shù)的底,僅x為變量。 當(dāng)x確定后, f(x)為X相應(yīng)的縱坐標(biāo)高度,則X服從參數(shù)為μ和σ2的正態(tài)分布(normal distribution),記作X~N( m, s2)。,2024/3/8,10,一般地,若連
5、續(xù)型隨機(jī)變量,設(shè)其概率密度函數(shù)為 ,則X取值落在區(qū)間 內(nèi)的累積概率為概率密度曲線下位于 的圖形面積,等于其概率密度函數(shù) 在 到x上的積分,記作 。,,,,,稱 為正態(tài)分布 的概率密度函數(shù)。其值表示變量落在區(qū)間 的概率,對應(yīng)于從-∞到x概率密度曲線下的陰影的面積(常稱為左側(cè)
6、尾部面積),見圖3。,,2024/3/8,12,圖3 正態(tài)分布的概率密度函數(shù),2024/3/8,13,,于是,利用概率密度函數(shù) 可以計算正態(tài)分布變量取值在任意區(qū)間(a,b)的概率為,,P(a≤X<b)=,,2024/3/8,14,,,,,,2024/3/8,15,2.正態(tài)分布的特征,對稱性:正態(tài)分布為單峰、對稱分布,以均數(shù)為中心,左右對稱。正態(tài)分布的圖形由均數(shù)和標(biāo)準(zhǔn)差兩個參數(shù)決定。 位置參數(shù)m,即集中趨勢的位置;變異
7、度參數(shù)s,表示正態(tài)變量取值的離中程度。概率密度函數(shù)f(x)在x取均值時達(dá)到最大,峰值為隨機(jī)變量X的取值從-∞到+∞,相應(yīng)的概率密度函數(shù)對應(yīng)的曲線位于x軸上方,并與X軸永不相交;,2024/3/8,16,圖4 正態(tài)分布位置變換示意圖,2024/3/8,17,圖5 正態(tài)分布形態(tài)變換示意圖,2024/3/8,18,,正態(tài)分布曲線下的面積分布有一定規(guī)律:正態(tài)曲線與橫軸所夾的面積為1。 位于
8、 內(nèi)的面積為0.90; 位于 內(nèi)的面積為0.95; 位于 內(nèi)的面積為0.99。,2024/3/8,19,圖6 正態(tài)分布曲線下面積分布規(guī)律示意圖,2024/3/8,20,3. 標(biāo)準(zhǔn)正態(tài)分布,為了實(shí)際應(yīng)用的方便,設(shè)U=(x-m)/s或Z=(x-m)/s,即將原點(diǎn)移到m的位置,橫軸尺度以s
9、為單位,使m=0,s=1,則將原正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布N(0,1)。U為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差。,2024/3/8,21,,,正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布,2024/3/8,22,統(tǒng)計學(xué)家對不同的U值編制了標(biāo)準(zhǔn)正態(tài)分布曲線下面積表(見附表),這樣一般正態(tài)分布N(m, s2)的概率計算問題借助于標(biāo)準(zhǔn)化變換,并通過查附表就完全解決了。,2024/3/8,23,標(biāo)準(zhǔn)正態(tài)分布的概率密度曲線與分布函數(shù)示意圖,2024/3/8,24,標(biāo)準(zhǔn)正態(tài)分布
10、曲線下面積規(guī)律,1. 標(biāo)準(zhǔn)正態(tài)分布區(qū)間(-1,1)的面積占總面積的68.26% 。2. 標(biāo)準(zhǔn)正態(tài)分布區(qū)間(-1.96,1.96)的面積占總面積的95% 。3. 標(biāo)準(zhǔn)正態(tài)分布區(qū)間(-2.58,2.58)的面積占總面積的99% 。,2024/3/8,25,例:已知某地正常成年女子的血清總蛋白數(shù)服從正態(tài)分布,調(diào)查了該地110名正常成年女子,得樣本血清總蛋白均數(shù)為72.8(g/L),標(biāo)準(zhǔn)差為3.8(g/L),試估計該地正常成年女子血清總蛋白
11、介于66.0~75.0(g/L)之間的比例,以及110名正常成年女子中血清總蛋白介于66.0~75.0(g/L)之間的人數(shù)。,2024/3/8,26,解:本例由于是大樣本,可用樣本均數(shù)和樣本標(biāo)準(zhǔn)差作為總體m、s的估計值,即將該地正常成年女子的血清總蛋白數(shù)近似看作服從N(72.8,3.82)的正態(tài)分布。作如下標(biāo)準(zhǔn)化變換:,,,2024/3/8,27,查標(biāo)準(zhǔn)正態(tài)分布表得:,,,于是,,,2024/3/8,28,故估計該地區(qū)正常成年女子血清總
12、蛋白介于66.0~75.0 (g/L)之間的比例為68.23%。估計110名正常成年女子中血清總蛋白介于66.0~75.0 (g/L)之間的人數(shù)約為 人。,,2024/3/8,29,4.1 制定醫(yī)學(xué)參考值范圍 參考值范圍(reference range)是指所謂“正常人”的解剖、生理、生化等指標(biāo)的波動范圍。制定參考值范圍時,首先要確定一批樣本含量足
13、夠大的“正常人”。所謂“正常人”不是指“健康人”,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。其次需根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值,根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰?,常?5%。,4.正態(tài)分布的應(yīng)用,2024/3/8,30,制定觀察指標(biāo)參考值范圍的一般步驟:,依據(jù)觀察指標(biāo)的特點(diǎn)、背景和已知的影響因素,確定抽樣的入選標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn);根據(jù)指標(biāo)特點(diǎn)決定單側(cè)或雙側(cè);確定范圍:一般為95%;按資料特點(diǎn)選取不同方法計算
14、正常值范圍的上下限。,2024/3/8,31,雙側(cè)臨界值:標(biāo)準(zhǔn)正態(tài)分布雙側(cè)尾部面積之和等于α?xí)r所對應(yīng)的正側(cè)變量值稱為雙側(cè)臨界值,記作Za/2或 Ua/2。,單側(cè)臨界值:標(biāo)準(zhǔn)正態(tài)分布單側(cè)尾部面積等于α?xí)r所對應(yīng)的正側(cè)變量值稱為單側(cè)臨界值,記作Za或Ua。,2024/3/8,32,參考值范圍的制定方法:,(1)正態(tài)分布法 適用于正態(tài)或近似正態(tài)分布資料; 雙側(cè)界值 單側(cè)上界 單側(cè)下界,2024/3/8,33,參
15、考值范圍的制定方法:,(2)百分位數(shù)法:特別適用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。如95%參考值范圍: 雙側(cè)界值:P2.5和P97.5 單側(cè)上界:P95 單側(cè)下界:P5,2024/3/8,34,,例:調(diào)查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài)分布, 試估計該地健康女性血紅蛋白的95%參考值范圍。,2024/3/8,35,因
16、血紅蛋白過高、過低均為異常,所以按雙側(cè)估計95%醫(yī)學(xué)參考值范圍: 上限為: 下限為:,2024/3/8,36,注意:95%醫(yī)學(xué)參考值范圍僅告訴我們某特定人群中,95%的個體該指標(biāo)測定值在此范圍內(nèi),并不能說明在此范圍內(nèi)都“正常”;也不能說明凡不在此范圍內(nèi)都 “不正?!保虼酸t(yī)學(xué)參考值范圍在臨床上只能作為參考。,2024/3/8,37,表2 常用參考值范圍的制定,2024/3/8,38,,計算某地正常女子血清總蛋白的95%參考值
17、范圍。由于該地正常成年女子血清總蛋白近似服從正態(tài)分布,可用正態(tài)分步法計算,因血清總蛋白過多過少均屬異常,故計算95%參考值范圍的上下限為:,2024/3/8,39,例:某地調(diào)查120名健康成年男性的第一秒肺通氣量得均數(shù) =4.2(L), 標(biāo)準(zhǔn)差S =0.7(L),試據(jù)此估計該地健康成年男子第一秒肺通氣量的95%參考值范圍。,,2024/3/8,40,解:由于該地健康成年男子第一秒肺通氣量近似服從正態(tài)分布,可用正態(tài)分布法計算。
18、因第一秒肺通氣量僅過低屬異常,故只需求出下限。 即該地健康成年男子第一秒肺通氣量的95%參考值范圍為不低于3.05(L)。,,2024/3/8,41,,4.2 估計頻數(shù)分布,2024/3/8,42,為了控制實(shí)驗(yàn)中的檢測誤差,常以 作為上下警戒值,以 作為上下控制值。這里的2s和3s可視為1.96s和2.58s的約數(shù)。,4.3 進(jìn)行質(zhì)量控制,2024/3/8,43,2
19、024/3/8,44,(1) t分布、F分布、 分布都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的,u檢驗(yàn)也是以正態(tài)分布為基礎(chǔ)的。(2) t分布、二項(xiàng)分布、Poisson分布的極限為正態(tài)分布,在一定條件下,可以按正態(tài)分布原理來處理。,4.4 正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ):,2024/3/8,45,二、二項(xiàng)分布,1. 二項(xiàng)分布的含義 在醫(yī)學(xué)研究中,許多觀察或試驗(yàn)的可能結(jié)果可以歸結(jié)為二個相互排斥的結(jié)果。如檢查的結(jié)果為陽性或陰性,治療的
20、結(jié)果可以為有效或無效,也可以為治愈或未治愈等。,一個袋子里有5個乒乓球,其中2個為黃色,3 個為白色。每次摸1個球,然后放回再摸。先后摸100次,摸到黃球的次數(shù)X=0,1,2,3,……的概率有多大?,P (x=0)= ?P (x=1)= ?P (x=2)= ?……P (x=100)= ?,2024/3/8,47,該實(shí)驗(yàn)有三個特點(diǎn):,各次摸球彼此獨(dú)立;每次摸球只有兩種可能的結(jié)果(黃球或白球)每次摸到黃球的概率(0.4)是固定
21、的。,2024/3/8,48,若變量X在n此獨(dú)立實(shí)驗(yàn)中,具有:各觀察單位只能具有相互對立的兩種結(jié)果之一。已知發(fā)生某一結(jié)果(陽性)的概率為π,其對立結(jié)果的概率為1-π。 n次試驗(yàn)在相同條件下進(jìn)行,且各個觀察單位的觀察結(jié)果相互獨(dú)立。則稱變量X服從二項(xiàng)分布,記作:B(X;n,?),2024/3/8,49,例:假設(shè)注射某種免疫疫苗會有10%的人出現(xiàn)不適反應(yīng)。問3人接種后各種可能后果的概率是多少? 假定這3人接種后出現(xiàn)不適反映的可
22、能性相同,則概率均為10%,用X表示發(fā)生不適反應(yīng)的次數(shù),則X的取值為0,1,2和3,求隨機(jī)變量各個可能的取值所對應(yīng)的概率。,2024/3/8,50,2. 二項(xiàng)分布的概率函數(shù)和概率分布,n和?是二項(xiàng)分布的兩個參數(shù),n決定了X的取值范圍,n和?決定了X的概率分布。,2024/3/8,51,3. 二項(xiàng)分布的性質(zhì)與特征,⑴形態(tài)取決于π和n:當(dāng)π接近0.5時,分布對稱,π離0.5越遠(yuǎn),分布對稱性越差;但當(dāng)n增大時, 分布趨于對稱。⑵高峰在 ?=
23、n?處。⑶二項(xiàng)分布的總體均數(shù)?=n?,方差為 。⑷當(dāng)n?>5,且n(1-?)>5時,二項(xiàng)分布趨于正態(tài)分布。,,圖7 二項(xiàng)分布的概率分布示意圖,2024/3/8,53,4. 二項(xiàng)分布的應(yīng)用,4.1 應(yīng)用條件各觀察單位只具有相互對立的兩種結(jié)果;已知發(fā)生某一結(jié)果的概率為p,其對立結(jié)果的概率則為1-p; n個觀察單位的觀察結(jié)果相互獨(dú)立。4.2 應(yīng)用概率計算;,2024/3/
24、8,54,,例:據(jù)報道,有10%的人對某藥有腸道反應(yīng)。為考察此藥的質(zhì)量,現(xiàn)隨機(jī)選5人服用此藥,試求: (1)其中k個人(k=0,1,2,3,4,5)有反應(yīng)的概率;(2)不多于2人有反應(yīng)的概率;(3)有人有反應(yīng)的概率。,例:設(shè)在人群中感染某種疾病的概率為20%,現(xiàn)有兩種疫苗,用疫苗A注射了15人后無一感染,用疫苗B注射15人后有1人感染,設(shè)人群沒有相互傳染疾病的可能,問:應(yīng)該如何評價這兩種疫苗?解:假設(shè)疫苗A、B完全無效,那么注
25、射后感染的概率仍為20%,則15人中染病人數(shù)X~B(15,0.20)。X=0的概率為,X≤1的概率為,2024/3/8,56,Poisson分布是一個重要的離散型概率分布。一般地,Poisson分布應(yīng)用于觀察例數(shù)n很大、而p發(fā)生的概率很小的情況。如,交通事故發(fā)生數(shù),某些罕見疾病發(fā)生數(shù),單位容積中的細(xì)菌計數(shù)、細(xì)胞計數(shù),放射性物質(zhì)在單位時間內(nèi)放射的粒子數(shù),單位空間的粉塵個數(shù)等等。此時,隨機(jī)變量X(發(fā)生數(shù)等)所有可能的取值以及相應(yīng)的概率分布即
26、為Poisson分布。,三、Poisson分布,歷史上, Poisson分布是作為二項(xiàng)分布的近似,于1837年由法國數(shù)學(xué)家Poisson引入 。,近年來, Poisson分布日益顯示其重要性,成為概率論中最重要的幾個分布之一。,在實(shí)際生活中,許多隨機(jī)現(xiàn)象服從或近似服從泊松分布。,在生物學(xué)、醫(yī)學(xué)、工業(yè)統(tǒng)計、保險科學(xué)等問題中 , 泊松分布是常見的。如地震、火山爆發(fā)、特大洪水、交通事故次數(shù)等, 都服從泊松分布。,泊松分布的圖形,圖8 Po
27、isson分布的示意圖,2024/3/8,60,1. Poisson分布的概率函數(shù):,此處m>0,是某一常數(shù),e是自然對數(shù)的底數(shù),稱X服從參數(shù)為m的Poisson分布,記為X~P(m),,可見,Poisson分布可作為二項(xiàng)分布的極限而得到。換言之,如果X~B(n,p),當(dāng)p很小,而n很大時,可以認(rèn)為X近似服從m=np的Poisson分布P(m)。,2024/3/8,61,Poisson分布屬于離散型分布,?是Poisson分布的總
28、體參數(shù),也是唯一的參數(shù)。方差s2與均數(shù)?相等,即m=s2。這是Poisson分布的一個非常重要而且非常獨(dú)特的性質(zhì),經(jīng)常用于判斷某隨機(jī)事件是否服從Poisson分布。設(shè) 且 ,并且X1與X2相互獨(dú)立,則 服從總體均數(shù)為 的Poisson分布。當(dāng)λ>20時,poisson分布近似正態(tài)分布,2.
29、 Poisson分布的特性,,,,,2024/3/8,62,3. 應(yīng)用,應(yīng)用條件:由于Poisson分布可以看作二項(xiàng)分布的極限分布,二項(xiàng)分布的應(yīng)用條件也是Poisson分布的應(yīng)用條件。此外,Poisson分布還要求試驗(yàn)次數(shù)n很大,而所關(guān)心的事件發(fā)生的概率p很小。,2024/3/8,63,概率計算,例: 為監(jiān)測飲用水的污染情況,現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個,記錄如下表:,表5 某社區(qū)每毫升飲用水中細(xì)菌數(shù),試分析飲用水
30、中細(xì)菌數(shù)的分布是否服從Poisson分布。若服從,計算每毫升水中細(xì)菌數(shù)的概率及理論次數(shù),并將次數(shù)分布與Poisson分布做直觀比較,2024/3/8,64,,得:經(jīng)計算得每毫升水中平均細(xì)菌數(shù) =0.5,方差S2=0.496。兩者接近,近似服從Poisson分布。,,2024/3/8,65,例如某均勻的溶液中,每ml含有3個細(xì)菌,即X~P(3)?,F(xiàn)考慮5ml溶液中的細(xì)菌的分布情況。由于X i~P(3) i=1,2,3,4,5。據(jù)
31、Poisson分布的可加性可得: X1 + X2 + X3 + X4 + X5 ~P(15) 即5ml溶液中的細(xì)菌數(shù)仍然服從Poisson分布,均數(shù)為15。,2024/3/8,66,[選擇題],1. 理論上,二項(xiàng)分布是一種A 連續(xù)性分布 B 離散分布 C 均勻分布 D 標(biāo)準(zhǔn)正態(tài)分布
32、 2. 在樣本例數(shù)不變的情況下,下列何種情況時,二項(xiàng)分布越接近對稱分布。A 總體比例π越大 B 樣本比例P越大 C 總體比例π越接近0.5 D 總體比例π越小,2024/3/8,67,3.某種人群(如成年男子)的某個生理指標(biāo)(如收縮壓)或生化指標(biāo)(如血糖水平)的正常值范圍一般 A.該指標(biāo)在所有人中的波動范圍 B.該指標(biāo)在所有正常人中的波動范圍 C.該指標(biāo)在絕
33、大部分正常人中的波動范圍 D.該指標(biāo)在少部分正常人中的波動范圍 E.該指標(biāo)在一個人不同時間的波動范圍,2024/3/8,68,4. 正態(tài)分布的特點(diǎn)有A.算術(shù)均數(shù)=幾何均數(shù) B.算術(shù)均數(shù)=中位數(shù)C.幾何均數(shù)=中位數(shù) D.算術(shù)均數(shù)=幾何均數(shù)=中位數(shù)E.以上都沒有,2024/3/8,69,5. 正態(tài)分布曲線下右側(cè)5%對應(yīng)的分位點(diǎn)為A.μ+1.96σ B.μ-1.96σC.μ+2.58σ D.μ
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《概率論及數(shù)理統(tǒng)計》課程標(biāo)準(zhǔn)
- 概率論與數(shù)理統(tǒng)計
- 概率論數(shù)理統(tǒng)計試題
- 概率論與數(shù)理統(tǒng)計概率歷史介紹
- 概率論與數(shù)理統(tǒng)計[0001]
- 概率論與數(shù)理統(tǒng)計習(xí)題
- 概率論與數(shù)理統(tǒng)計教材
- 《概率論與數(shù)理統(tǒng)計》論文
- 概率論與數(shù)理統(tǒng)計試題
- 概率論與數(shù)理統(tǒng)計試題
- 概率論與數(shù)理統(tǒng)計答案
- 概率論與數(shù)理統(tǒng)計題庫
- 概率論與數(shù)理統(tǒng)計論文
- 概率論與數(shù)理統(tǒng)計試卷
- 概率論與數(shù)理統(tǒng)計答案
- 概率論與數(shù)理統(tǒng)計習(xí)題
- 概率論與數(shù)理統(tǒng)計1.6
- 概率論與數(shù)理統(tǒng)計[0002]
- 概率論與數(shù)理統(tǒng)計論文
- 概率論與數(shù)理統(tǒng)計教案
評論
0/150
提交評論