版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計學(xué)基礎(chǔ)知識,一.醫(yī)學(xué)統(tǒng)計學(xué)的意義,1.統(tǒng)計學(xué)(statistics):應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2.醫(yī)學(xué)統(tǒng)計學(xué)(statistics of medicine):應(yīng)用統(tǒng)計學(xué)的原理與方法進行醫(yī)學(xué)科研與實踐。,3.統(tǒng)計學(xué)方法的特點: (1)用數(shù)量反映質(zhì)量 1)體格檢查(量血壓、脈搏…)→個體健康質(zhì)量 2)考試分數(shù)→個體學(xué)習(xí)質(zhì)量 3)期望壽命→
2、反映人群健康狀況 4)嬰兒死亡率→反映衛(wèi)生服務(wù)質(zhì)量,(2)用群體歸納個體2011年長沙市7歲男孩有多高?7歲男孩身高有高有矮,平均身高=119.5cm95%的長沙市7歲男孩的身高在110.20cm~129.20cm之間,二、基本概念,1、研究單位(觀察單位、unit)、變量(variable)、變量值(value of variable) (1)研究單位(unit):研究中的個體。如:研究2011年長沙市7歲
3、男孩身高的正常值范圍 1個人 測得的身高值(120.2cm,118.6cm,121.8cm,…),2、同質(zhì)(homogeneity)和變異(variation)研究長沙市2011年7歲男孩身高的正常值范圍?同質(zhì):同長沙市、7歲、男孩、無影響身高的疾病。變異:長沙市2011年7歲男孩身高有高有矮,3、總體(population)和樣本(sample)(1)總體:是根據(jù)研究目的確定的
4、同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。例如:調(diào)查某地2011年正常成年男子的紅細胞數(shù)的正常值范圍。 總體:1)某地所有的正常成年男子 2)某地所有的正常成年男子的紅細胞數(shù),1)有限總體(finite population):研究單位數(shù)是有限的。例如:調(diào)查某地2011年正常成年男子的紅細胞數(shù)的正常值范圍。2)無限總體(infinite population):研究單位數(shù)是無限的。例如
5、:高血壓患者←無時間、空間限制。,(2)樣本(sample):是總體中抽取的有代表性的一部分。 注意:隨機抽樣(無主觀性) 樣本含量(sample size):樣本中包含的研究單位數(shù)。 例如:某藥治療高血壓患者30名 樣本含量(n)為30,4、參數(shù)(parameter)和統(tǒng)計量(statistic)(1)參數(shù):根據(jù)總體個體值統(tǒng)計計算出來的描述總體的特征量。一般用希臘字母表示(2
6、)統(tǒng)計量:根據(jù)樣本個體值統(tǒng)計計算出來的描述樣本的特征量。一般用拉丁字母表示,總體參數(shù)一般是不知道的統(tǒng)計學(xué)抽樣研究的目的就是: 樣本統(tǒng)計量→總體參數(shù)5、抽樣誤差由于抽樣原因所造成的樣本統(tǒng)計量與總體參數(shù)之間的差別。 特點:1)抽樣誤差是不可避免; 2)有統(tǒng)計規(guī)律性。 產(chǎn)生原因:個體差異(生物變異),6、頻率(frequency)、概率(probability)、小概率事件(1)頻
7、率: 一次隨機試驗出現(xiàn)各種可能結(jié)果的比例。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,在重復(fù)多次后,出現(xiàn)“正面” 或“反面”這個結(jié)果的比例稱之為頻率。,(2)概率(probability) 概率是度量隨機事件發(fā)生可能性大小的一個數(shù)值。 頻率是就樣本而言的,而概率從總體的意義上說的。,0< P(A) <1 隨機事件 P(A)=1 必然事件
8、 P(A)=0 不可能事件。,(3)小概率事件:統(tǒng)計分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將 稱為小概率事件。,湖南風(fēng)采:中獎概率大約為: 1/671萬交通事故:發(fā)生概率為:1/20萬,三、統(tǒng)計資料的類型,變量與統(tǒng)計資料的分類方法概述 數(shù)值變量…………..構(gòu)成計量資料 分類變量
9、 無序分類變量………構(gòu)成計數(shù)資料 有序分類變量………構(gòu)成等級資料,,,2. 數(shù)值變量與計量資料1) 數(shù)值變量(numerical variable) :變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如:身高(cm)、體重(kg)。 2) 計量資料(measurement data) :由一群個體的數(shù)值變量值構(gòu)成的資料,即一群變量值。 如:長沙市2011年7歲男孩身高值(118.6cm,121
10、.8cm…),3.無序分類變量與計數(shù)資料1)無序分類變量(unordered categories variable):變量值是定性的,有類別。 特點:類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上)不會錯判。 如:性別:男、女。 血型:O、A、B、AB。2)計數(shù)資料(enumeration data):一群個體按無序分類變量的類別清點每類有多少個個體
11、,即分類個體數(shù)。 如:某人群性別構(gòu)成:男:6, 女:7。 某人群血型構(gòu)成:O:20, A:35, B:30, AB:15,4.有序分類變量與等級資料1)有序分類變量(ordinal categories variable) :變量值是定性的、 分等級。 特點:等級是主觀劃分的,各級有秩序,從低到高或由高到低;級和級之間界限模糊,可能錯判。 如:療效:無效、好轉(zhuǎn)、顯效、治愈。
12、 血清反應(yīng):–、+、++2)等級資料(ranked data):一群個體按有序分類變量的級別清點每級有多少個個體,即分級個體數(shù)。 如:某地某人群EB病毒抗體反應(yīng): –:65, +:5, ++:6,1.專業(yè)設(shè)計:選題、建立假說、確定研究對象和技術(shù)方法等2.統(tǒng)計設(shè)計:圍繞專業(yè)設(shè)計確定統(tǒng)計設(shè)類型、樣本大小、分組方法、統(tǒng)計分析指標(biāo)及統(tǒng)計分析方法。,四、醫(yī)學(xué)統(tǒng)計工作的基本步驟,設(shè)計,統(tǒng)計設(shè)計
13、的內(nèi)容包括資料的搜集、整理和分析全過和的設(shè)想和安排。例如:研究目的和假說? 研究對象和研究單位? 研究因素(變量)? 搜集哪些原始資料? 用什么方式和方法取得這些原始資料? 怎樣整理匯總和計算統(tǒng)計指標(biāo)? 如何控制誤差? 預(yù)期會得到什么結(jié)果? 需要多少經(jīng)費?,統(tǒng),,(一)資料來源第一手資料 ① 經(jīng)常性:統(tǒng)
14、計報表(死亡登記、疫情報告等),工作記錄(病歷、化驗); ② 一時性:專題調(diào)查、實驗或臨床試驗。第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計資料。,收集資料,,分析資料 1.統(tǒng)計描述:用統(tǒng)計指標(biāo)、統(tǒng)計圖表對資料的數(shù)量特征及分布規(guī)律進行測定和描述。 2.統(tǒng)計推斷:用樣本信息推斷總體特征: ①參數(shù)估計 ②假設(shè)檢驗。 工具:1)foxbase數(shù)據(jù)庫 2)spss
15、 3)SAS,五、數(shù)值變量資料的統(tǒng)計描述,頻數(shù)分布表(frequency table) :例 從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇的測量結(jié)果如下,試編制頻數(shù)分布表。,,,,,頻數(shù)表,頻數(shù)分布圖,,統(tǒng)計圖:指利用點的位置、線段的升降、直條的長短和面積的大小等各種幾何圖形來表達統(tǒng)計資料。統(tǒng)計圖只能提供概略的情況,而不能獲得確切數(shù)值,因此不能完全代替統(tǒng)計表,常需要同時列出統(tǒng)計表作為統(tǒng)計圖的數(shù)值
16、依據(jù)。,統(tǒng)計圖,統(tǒng)計圖的結(jié)構(gòu),標(biāo)題:用于簡明扼要地說明資料的內(nèi)容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個統(tǒng)計圖的視覺中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。圖例:用于識別比較的統(tǒng)計圖中各種圖形所代表的含義。刻度:即縱軸和橫軸上的坐標(biāo)??潭葦?shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。,常用的統(tǒng)計圖,直條圖百分條圖圓圖線圖半對數(shù)線圖直方圖
17、散點圖,直條圖/條圖,圖12-1 某省1979年四個地區(qū)脊髓灰質(zhì)炎發(fā)病率,圖12-2 某地1952年與1972年三種疾病死亡率比較,圖12-4 復(fù)方豬膽囊治療單純型老年性氣管炎療效,圖12-5 20世紀(jì)70年代和80年代某地7常見惡性腫瘤發(fā)病構(gòu)成比較,圖12-6 某地1968-1974年結(jié)核病死亡率比較,圖12-7 某地1949-1958年白喉、傷寒、副傷寒死亡率比較(普通線圖),圖12-8 某地1949-
18、1958年白喉、傷寒、副傷寒死亡率比較(半對數(shù)線圖),請注意:在普通線圖中,白喉死亡率線條的坡度比傷寒、副傷寒死亡率線條下降的陡峭,只能說明兩種疾病的死亡率逐年變化幅度不同,不能錯認為白喉死亡率的下降速度比傷寒、副傷寒死亡率的下降速度快。在半對數(shù)線圖中就不會出現(xiàn)這種錯覺。,頻數(shù),,紅細胞數(shù)(×1012/L),圖12-9 140名正常男子紅細胞計數(shù)的直方圖,,圖12-10 1997年某地乙型病毒性腦膜炎病例的年齡分布,
19、1 2 3 4 5 6 7 8 9 10~ 15~ 2 0~ 25~ 30~ 35~,,年齡(歲),散點圖(scatter chart),散點圖:使用點的密集程度和趨勢來表示兩種指標(biāo)或變量間的相關(guān)關(guān)系。,圖10-12 12名女大學(xué)生身高與體重散點圖,(一)平
20、均指標(biāo),1.算術(shù)均數(shù)(mean):可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征。,適用范圍:對稱分布,尤其正態(tài)分布,計量資料的描述指標(biāo),計算方法,,例 :從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇( )的測量結(jié)果如下:,,2.中位數(shù)中位數(shù)(median):是將變量值從小到大按順序排列,位置(位次)居于中間的那個變量值。1,3,7,5,>100
21、中位數(shù)為多少?,n為奇數(shù)時 n為偶數(shù)時,例 7名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。,本例n=7,為奇數(shù) 例8名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其中位數(shù)。本例n=8,為偶數(shù),應(yīng)用,適用于:1、各種分布類型的資料 2、特別是偏態(tài)分布資料和開口資料(一端或兩端無確切數(shù)值的資料)。,3、幾何均數(shù),幾何均數(shù)(geometric mean):可用
22、于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。計算方法,例 某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。,適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。,(二)變異指標(biāo),例 三組同齡男孩的身高值(cm),1. 極差極差(R):即一組變量值最大值與最小值之差。,,2.方差(variance)也稱均方差,即將離均差平方和用樣本含量n
23、 取平均,可反映一組數(shù)據(jù)的平均離散水平。總體方差-- ,樣本方差-- 。,,樣本標(biāo)準(zhǔn)差用s 表示 公式:,3.標(biāo)準(zhǔn)差,計算三組資料的標(biāo)準(zhǔn)差,甲組:,4、百分位數(shù),百分位數(shù)(percentile)是一種位置指標(biāo)。一個百分位數(shù) 將全部變量值分為兩部分,在不包含的全部變量值中有 的變量值比它小, 變量值比它大。,變異系數(shù)(coefficient of variation,CV),多用于觀察指標(biāo)單位不同時,
24、如身高與體重的變異程度的比較;或均數(shù)相差較大時,如兒童身高與成人身高變異程度的比較。,5. 變異系數(shù),例:某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg, 比較其變異度?,第五章 計數(shù)資料的統(tǒng)計描述,常用的相對數(shù):一、率。二、構(gòu)成比三、相對比,第一節(jié) 常用相對數(shù),一、率率:說明某現(xiàn)象發(fā)生的頻率或強度。 常以百分率(%)、千分率(‰)、萬分率
25、(1/萬)、十萬分率(1/10萬)等表示,計算公式為:,例5-1 某醫(yī)院1998年在某城區(qū)隨機調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例。高血壓患病率為:2823 / 8589 ? 100% = 32.87% 。,,2、構(gòu)成比構(gòu)成比:表示事物內(nèi)部某一部分的個體數(shù)與該事物各部分個體數(shù)的總和之比,用來說明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計算公式為,例7-22某正常人的白細胞分類
26、計數(shù),三、相對比相對比簡稱比(ratio),是兩個有關(guān)指標(biāo)之比,說明兩指標(biāo)間的比例關(guān)系。兩個指標(biāo)可以是性質(zhì)相同,如不同時期發(fā)病數(shù)之比;也可以性質(zhì)不同,如醫(yī)院的門診人次與病床數(shù)之比。通常以倍數(shù)或百分數(shù)(%)表示。,,例5-3 某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100 = 103,說明該醫(yī)院該年每出生100名女嬰兒,就有103名男性嬰兒出生,它反映了男性嬰兒與女
27、性嬰兒出生的對比水平。,,第二節(jié) 應(yīng)用相對數(shù)的注意事項,1、計算相對數(shù)應(yīng)有足夠數(shù)量即分母不宜太小。 如果例數(shù)較少會使相對數(shù)波動較大。如某種療法治療5例病人5例全部治愈,則計算治愈率為5/5×100% =100%,若4例治愈,則治愈率為4/5×100% =80%,由100%至80%波動幅度較大,但實際上只有1例的變化。在臨床試驗或流行病調(diào)查中,各種偶然因素都可能導(dǎo)致計算結(jié)果的較大變化,因此例數(shù)很少的情況下最好用絕對數(shù)
28、直接表示。,2、不能以構(gòu)成比代替率構(gòu)成比是用以說明事物內(nèi)部某種構(gòu)成所占比重或分布,并不說明某現(xiàn)象發(fā)生的頻率或強度,在實際工作中經(jīng)常會出現(xiàn)將構(gòu)成比指標(biāo)按率的概念去解釋的錯誤例如表5-2研究已婚育齡婦女在不同情況下放置避孕環(huán)與失敗率的關(guān)系。,,,3.正確計算合計率對分組資料計算合計率或稱平均率時,不能簡單地由各組率相加或平均而得,而應(yīng)用合計的有關(guān)實際數(shù)字進行計算。例如用某療法治療肝炎,甲醫(yī)院治療150人,治愈30人,治愈率為20%;乙醫(yī)
29、院治療100人,治愈30人,治愈率為30%。兩個醫(yī)院合計治愈率應(yīng)該是[(30+30)/(150+100)]×100%=24%。若算為20%+30%=50%或(20% +30%)/2=25%,則是錯的。,,4.注意資料的可比性 在比較相對數(shù)時,除了要對比的因素(如不同的藥物),其余的影響因素應(yīng)盡可能相同或相近。在臨床研究和動物實驗時,應(yīng)遵循隨機抽樣原則進行分組。,,5.對比不同時期資料應(yīng)注意客觀條件是否相同 例如, 疾病
30、報告制度完善和資料完整的地區(qū)或年份,發(fā)病率可以“升高”;居民因醫(yī)療普及,就診機會增加,或診斷技術(shù)提高,也會引起發(fā)病率“升高”。因此在分析討論時,應(yīng)根據(jù)各方面情形全面考慮,慎重對待。6.樣本率(或構(gòu)成比)的比較應(yīng)做樣本率(或構(gòu)成比)假設(shè)檢驗。,,假設(shè)檢驗過去稱顯著性檢驗。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。,七、統(tǒng)計推斷,例3
31、-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?130.83g/L ≠140g/L原因: 1.可能是總體均數(shù)不同 2.是抽樣造成的,假設(shè)檢驗應(yīng)注意的問題(1)要有嚴(yán)密的研究設(shè)計 這是假設(shè)檢驗的前提。組間應(yīng)均衡,具有可比性,也就是除對比的主要因素(如臨床試驗用新藥和對照藥)
32、外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應(yīng)相同或相近。保證均衡性的方法主要是從同質(zhì)總體中隨機抽取樣本,或隨機分配樣本。,(2)變量變換,常用的變量變換有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等。,(3)合理選用檢驗方法 應(yīng)根據(jù)分析目的、資料類型以及分布、設(shè)計方案的種類、樣本含量大小等選用適當(dāng)?shù)臋z驗方法。,(4)正確理解“顯著性”一詞的含義 差別有或無統(tǒng)計學(xué)意義,過去稱差別有或無“顯著性
33、”,是對樣本統(tǒng)計量與總體參數(shù)或樣本統(tǒng)計量之間的比較而言,相應(yīng)推斷為:可以認為或還不能認為兩個或多個總體參數(shù)有差別。,(5)結(jié)論不能絕對化 因統(tǒng)計結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。在報告結(jié)論時,最好列出檢驗統(tǒng)計量的值,盡量寫出具體的P值或P值的確切范圍,如寫成P=0.040或0.02<P<0.05,而不簡單寫成P<0.05,以便讀者與同類研究進行比較或進行循證醫(yī)學(xué)時采用Meta分析。,(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《統(tǒng)計學(xué)基礎(chǔ)知識》
- 統(tǒng)計學(xué)基礎(chǔ)知識及其概念
- 初級統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試卷
- 2016年統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識
- 統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試卷2010
- 2017初級統(tǒng)計學(xué)及統(tǒng)計法基礎(chǔ)知識試題
- 2013初級統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試題
- 2017初級統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試卷及答案
- 統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識(2012)2014-08-28
- 2016年初級統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試卷
- 統(tǒng)計學(xué)基礎(chǔ)知識金融統(tǒng)計分析及案例試題大全
- 統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識試卷及參考答案
- 統(tǒng)計學(xué)基礎(chǔ)
- 初級統(tǒng)計師《統(tǒng)計學(xué)和統(tǒng)計法基礎(chǔ)知識》真題及答案
- 統(tǒng)計學(xué)知識
- 統(tǒng)計學(xué)基礎(chǔ) 統(tǒng)計概述
- 統(tǒng)計學(xué)知識簡介
- 統(tǒng)計基礎(chǔ)知識
- 統(tǒng)計學(xué)基礎(chǔ)1
- [經(jīng)濟學(xué)]統(tǒng)計學(xué)基礎(chǔ)
評論
0/150
提交評論