人群健康研究的統(tǒng)計學方法_第1頁
已閱讀1頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2024/3/23,1,第七章,人群健康研究的統(tǒng)計學方法,2024/3/23,2,“統(tǒng)計”一詞,對一般人來說并不陌生。在報刊上常見用來說明我們工作、事業(yè)成績的數字、表、圖,稱為統(tǒng)計數字、統(tǒng)計表和統(tǒng)計圖。 在西方,統(tǒng)計學(statistics)一詞,源出于state(國家、情況),專指有關“國情”的學問,最初多用于文字記敘,后發(fā)展為數量比較,隨著概率論思想與方法的引入,逐漸形成今天在理論與應用方面都已相當完備的獨立學

2、科。,,,1. 某年級甲班、乙班各有男生50人。從兩個班各抽取10人測量身高,如果甲班的平均身高大于乙班,能否推論甲班所有同學的平均身高也大于乙班?為什么? 2.用A,B兩種藥物分別治療同病患者各50人,如果A藥的治愈率(60%)高于B藥(50%),證明A藥的療效優(yōu)于B藥。這種說法對嗎?為什么?,思考題,2024/3/23,4,醫(yī)學統(tǒng)計學的主要研究內容,1、統(tǒng)計學設計(1)內容:臨床試驗設計、實驗室研究設計、調查研究設計

3、等。(2)目的:①控制和縮小隨機誤差,消除系統(tǒng)誤差;②節(jié)約樣本含量;③盡可能多地獲取有關信息,達到高效低耗的目的。2、統(tǒng)計分布 事物所表現的數量特征是千差萬別的,其所呈現的分布規(guī)律是進行統(tǒng)計學推斷的基礎和根據。3、各種統(tǒng)計量(或稱統(tǒng)計指標)的性質、特點及其分布規(guī)律4、統(tǒng)計分析方法(包括各種數學模型)尤其是隨著計算機的普及和發(fā)展,多因素分析方法發(fā)展很快。,2024/3/23,5,如何學習醫(yī)學統(tǒng)計學,1、掌握基本概念、基本原理和基本

4、方法。培養(yǎng)統(tǒng)計思維能力。2、掌握常用統(tǒng)計分析方法。對統(tǒng)計公式,要求了解其用途、適用條件和注意事項。切忌死記硬背,關鍵是靈活運用。3、重視習題課。聯系實際,緊密結合專業(yè)知識,多做練習題。,2024/3/23,6,例:治療某病的新療法新法:(100例) 有效20例,有效率20%;舊法:(100例) 有效15例,有效率15%; 這兩個百分數就是統(tǒng)計描述指標,現在的問題是,這兩種療法的有效率會穩(wěn)定不變嗎?如果說不會,是什

5、么原因?那么,兩種療法的真實有效率會是多少?我們能根據統(tǒng)計描述( 20%與15%)就去正式采用還有較大副作用的新療法?對這樣的差異問題,你能再憑直覺去作“否定”?在作任何回答之前,必須判斷20%與15%之間的差別是真實的差異,或是僅僅由于“機遇”所致。這里,統(tǒng)計推斷可提供幫助。學過統(tǒng)計學,將會了解不僅可判斷新療法是否較好?而且,如果判斷它是較好,還能估計判斷是錯誤的可能性有多大。,2024/3/23,7,統(tǒng)計分析是科研工作中的一種有力工

6、具。它從科研的總體設計、資料采集、資料整理、資料分析直到最后作出結論都有密切關系。掌握了這個工具可以使用較少的人力、物力和時間獲得比較可靠的結果。需要運用統(tǒng)計方法的場合而不去運用它可能造成不應有的缺陷或得出錯誤的結論。,2024/3/23,8,例: 北京某醫(yī)院某大夫使用“烏貝散”(烏賊骨3錢,白芨3錢,川貝3錢, 甘草3錢,共研細末過120目篩,沖服)治療胃潰瘍病出血107例,有效101例,有效率為94.4%。那么如果別的

7、醫(yī)院,其它大夫使用“烏貝散”來治療胃潰瘍病出血,其有效率也一定是94.4%嗎?顯然,不一定恰為94.4%,那么是多少呢?比它高還是比它低?這就是一個求可信區(qū)間的問題。,2024/3/23,9,例:某雜志中一篇文章報導,用某種中草藥治療玫瑰糠疹,有效率為78%,平均療程為三周左右。問此藥治療玫瑰糠疹的確有效嗎?由于玫瑰糠疹具有自然治愈的情況,一般不服藥,多喝水,到三周左右有些患者也會自愈。所以,此藥的78%療效有待探討。這就要求設立具有

8、可比性的對照組。,2024/3/23,10,再譬如,用某藥治某病,治一例有效,能說100%有效嗎?治療二例有效,能說明100%有效嗎?治十例,其中九例有效,能說90%有效嗎?顯然,觀察的例數將是個重要因素,例數太少不足以說明問題。觀察例數太多,將費時,加重科研經濟負擔。那么觀察多少例能說明問題?這是一個樣本可靠性問題。,2024/3/23,11,一些現象既有規(guī)律性又有隨機性,肺癌患者中(主動或被動)吸煙的比例較大,這體現了規(guī)律性,

9、而絕非每個吸煙的人都會患肺癌,這體現了隨機性; 再如,一般來說,白種人身材比黃種人要高些,這就是規(guī)律性,但對于具體的一個白人和一個黃種人,就很難說誰高誰矮了,這體現隨機性。,2024/3/23,12,第一節(jié) 統(tǒng)計學方法概述,一、統(tǒng)計學的意義統(tǒng)計學是運用數理統(tǒng)計的原理和方法,研究數據資料的搜集、整理、分析與推斷的科學,是認識社會和自然現象客觀規(guī)律的數量特征的重要工具。醫(yī)學統(tǒng)計學 是認識醫(yī)學現象數量特征的重要工具,是

10、運用數理統(tǒng)計的原理和方法,結合醫(yī)學實際,來研究醫(yī)學科研的實驗設計和數據處理的一門科學。 “醫(yī)學統(tǒng)計學是處理醫(yī)學資料中的同質性(homogeneity)和變異性(variation)的科學與藝術”,2024/3/23,13,二、統(tǒng)計學中的幾個基本概念,(一) 同質與變異(二) 總體與樣本(三) 參數與統(tǒng)計量(四) 誤差(五) 概率,2024/3/23,14,(一)同質與變異 homogeneity and va

11、riation,同質:指觀察單位(研究個體)間被研究指標的影響因素相同。個體:即觀察單位,是統(tǒng)計研究中的最基本單位。變量:觀察單位的研究特征變量值:變量的觀察結果變異:指同質的個體之間的差異 。,2024/3/23,15,同質與變異的例子,例1 調查2008年淄博市7歲男童的身高和體重同質:2008年、淄博市、7歲男童變異:身高和體重各不相同例2 研究某降壓藥的療效同質:高血壓患者、用某藥治療變異:療效各不相同

12、,2024/3/23,16,120名正常成年男子紅細胞計數值(1012/L),最大值=6.18, 最小值=3.29, 極差=2.89 算術均數=4.72,標準差=0.57,2024/3/23,17,2024/3/23,18,(二) 總體與樣本 population and sample,總體:根據研究目的所確定的同質觀察單位某項變量值的集合(全體)。分有限總體與無限總體,樣本:從總體中隨機

13、抽取的部分觀察單位變量值的集合。,2024/3/23,19,隨機抽樣 random sampling,為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。,2024/3/23,20,(三) 參數與統(tǒng)計量 parameter and statistic,參數:總體的統(tǒng)計指標,如總體均數、標準差,采用希臘字母分別記為μ、σ。固定的常數,推斷inference,統(tǒng)計量:樣本

14、的統(tǒng)計指標,如樣本均數、標準差,采用拉丁字母分別記為 。 參數附近波動的隨機變量 。,2024/3/23,21,(四) 誤差 error,誤差:泛指實驗數據的實測值與真實值之差,1 系統(tǒng)誤差2 隨機測量誤差3抽樣誤差,2024/3/23,22,系統(tǒng)誤差 systematic error,在實際觀測過程中,由受試對象、研究者、儀器設備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。

15、流行病學稱之為偏倚(bias)。 特點:觀察值系統(tǒng)性、方向性、周期性的偏離真值。 可以通過嚴格的實驗設計和技術措施消除。,2024/3/23,23,2隨機測量誤差  (random error of measurement )或稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機地變化。隨機測量誤差服從正態(tài)分布,可以用概率統(tǒng)計方法處理。,2024/3/23,24,3抽樣誤

16、差 ( sampling error) 我們從同一總體中隨機抽取若干個例數相同的樣本,其樣本統(tǒng)計量之間會有所不同。這種由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數之間的差異以及各樣本統(tǒng)計量之間的差異,統(tǒng)計上稱為抽樣誤差。 抽樣誤差在醫(yī)學生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規(guī)律的。,2024/3/23,25,(五) 概率probability,確定性現象:在

17、一定條件下,一定會發(fā)生或一定不會發(fā)生的現象。其表現結果為兩種事件:肯定發(fā)生某種結果的叫必然事件;肯定不發(fā)生某種結果的叫不可能事件。,隨機現象:在同樣條件下可能會出現兩種或多種結果,究竟會發(fā)生哪種結果,事先不能確定。其表現結果稱為隨機事件。 隨機事件的特征:①隨機性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。,概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1]。,2024/3/23,26,必然事件 P = 1

18、 不可能事件 P = 0 隨機事件 0 < P < 1 P ≤ 0.05(5%)或P ≤ 0.01(1%)稱為小概率事件(習慣),統(tǒng)計學上認為不大可能發(fā)生。,,小概率事件,2024/3/23,27,樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進

19、行N次試驗,事件A出現n次,則事件A出現的頻率為f=n /N。 頻率與概率間的關系:概率是參數,頻率是統(tǒng)計量; 頻率總是圍繞概率上下波動;樣本含量n越大,波動幅度越小,頻率越接近概率。,,頻率 frequency,2024/3/23,28,三 統(tǒng)計資料的類型,(一) 數值變量資料(二) 分類變量資料(三) 變量間轉化,2024/3/23,29,觀察單位observations個體individua

20、ls,,,變量variables,,numerical variable data 數值變量資料,,Categorical variable data 分類變量資料,,Units;elements,2024/3/23,30,(一)數值變量資料 numerical variable data,用定量 方法測定觀察單位(個體)某項指標數值的大小,所得的資料,稱數值變量資料。也叫定量資料Quantitative data或計量資料,特

21、點:有計量單位,如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細胞計數(1012/L);資料之間具連續(xù)性。,2024/3/23,31,(二)分類變量資料categorical variable data,將觀察單位按某種屬性或類別分組,然后清點各組的觀察單位數,所得的資料稱分類變量資料也叫定性資料(Qualitative data),特點:無固有計量單位,如膚色(黑、白)、血型(ABO)、職業(yè)(工農兵)、性別

22、(男女),2024/3/23,32,1、無序分類(unordered categories),各類別之間有性質上的不同,而無程度上的差別。①二項分類 如臨床某些檢驗結果用陽性或陰性反應表示,對一批某病患者檢驗完畢后,清點呈陽性或陰性反應的各有若干例。 ②多項分類 調查某人群的血型分布,按照A、B、AB、O四型分組。清點所得該人群的各血型組的人數是計數資料;,2024/3/23,33,2、有序分類資料(ordin

23、al category data),各類別之間有性質上的差別,且排列有序,給人以“半定量”的概念,所以也叫等級資料 Rank data。 ①癌癥分期:早、中、晚。 ②藥物療效:治愈、好轉、無效、死亡。 ③尿蛋白: ?,?,?,++,+++,2024/3/23,34,實例數據1,2024/3/23,35,實例數據2,2024/3/23,36,(三) 變量間的轉化,例:一組20?40歲成年人的血壓,以

24、12kPa為界分為正常與異常兩組,統(tǒng)計每組例數,<8 低血壓 8? 正常血壓 12? 輕度高血壓 15? 中度高血壓 17? 重度高血壓,數值變量資料,,,等級資料,,分類變量資料,2024/3/23,37,又如在計量診斷中,將某些陽性體征根據確診病人的概率賦予分數,分數的多少代表量的大小,這樣原來的計數資料就轉化為計量資料?!∮捎谟嬃抠Y料可以得到較多

25、的信息,所以凡能計量的,盡量采用計量資料。,2024/3/23,38,,統(tǒng)計資料的幾種類型:,2024/3/23,39,四、統(tǒng)計工作的基本步驟,(一) 統(tǒng)計設計:包括調查、實驗設計。(二) 收集資料:取得準確可靠的原始資料(三) 整理資料:對資料進行核查、改錯,系統(tǒng)化、條理化(四) 分析資料:統(tǒng)計描述、統(tǒng)計推斷,2024/3/23,40,(一) 統(tǒng)計設計 statistical design,統(tǒng)計設計是影響研究能否成功的最關鍵環(huán)節(jié)

26、,是提高觀察或實驗質量的重要保證。,1.調查設計:survey design客觀描述研究總體,不對研究總體施加任何干預,目的在于摸清某一事物的水平和分布狀態(tài)。,2024/3/23,41,(1)實驗研究設計:以動物或生物材料為研究對象,在研究過程中對研究對象施加干預。(2)臨床試驗設計:以人為研究對象,在研究過程中施加干預。,2.實驗設計:experiment design,2024/3/23,42,統(tǒng)計設計的內容:,1.研究目的和假

27、說。2.研究總體、研究對象、觀察單位。3.是否施加干預,如何施加干預?4.需搜集那些資料,如何搜集?5.設置觀察指標。6.資料的整理和匯總,計算有關統(tǒng)計量。7.控制誤差。8.預期結果。9.時間和經費的安排等。,2024/3/23,43,研究設計的幾個關鍵問題:,1.如何進行抽樣?如何安排干預措施? 隨機化原則:隨機抽樣和隨機分配。,2.要達到研究目的應抽取多少觀察單位? 重復原則:確定樣本含量。,2024/3

28、/23,44,3.如何在諸多影響因素中,分離出研 究因素對實驗結果的效應?對照原則:在對比組中,除研究因素外,其它影響實驗結果的非研究因素都盡可能相同。,實驗設計,2024/3/23,49,(二)搜集資料(collection of data),根據設計的要求,獲取準確可靠的原始資料,是統(tǒng)計分析結果可靠的重要保證。,醫(yī)療衛(wèi)生工作中的統(tǒng)計資料主要來自:,1.統(tǒng)計報表。2.醫(yī)療衛(wèi)生工作記錄。3.專題調查或實驗研究。,2024/

29、3/23,50,1、統(tǒng)計報表 如出生死亡報告、疫情報告、醫(yī)院工作報表等都是國家規(guī)定的,由醫(yī)療衛(wèi)生機構定期逐級上報,提供居民健康和醫(yī)療衛(wèi)生機構的各種數字,這些報表為各級衛(wèi)生機構制定衛(wèi)生工作計劃、評價衛(wèi)生工作和預測今后的工作提供重要依據,也為衛(wèi)生管理研究提供了大量的原始資料;2、醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學檢查記錄等,這些資料都是進行醫(yī)學研究的寶貴原始資料,必需很好開發(fā)利用,但許多醫(yī)療衛(wèi)生機構忽視它,不認真填寫,漏填、誤填

30、嚴重,以致不能很好利用,因此加強這方面的資料管理工作是很重要的;3、專題調查或實驗 這是開展醫(yī)學科研的主要資料來源,比上述2種經常性資料容易控制,可以得到較好的原始資料。如糖尿病、高血壓的調查。,2024/3/23,51,統(tǒng)計資料的要求,1、資料完整、準確和及時2、資料有足夠的數量3、資料的代表性及可比性代表性:是指在抽樣研究中樣本對總體的代表性 隨機化原則:總體中每個對象都有同等機會被抽取??杀刃裕菏侵冈谶M行統(tǒng)計比

31、較時,對比的各組之間,除觀察問題或實驗因素不同外,其它一切條件都要求盡量一致。,2024/3/23,52,(三)整理資料sorting of data,將原始數據凈化、系統(tǒng)化和條理化,為下一步的計算和分析打好基礎的過程。,1. 審核:對原始數據的檢查、核對和糾正錯誤等。,2. 分組:根據研究目的將原始數據合理分組①質量分組 即按事物的性質或類型分組,適用于計數及等級資料。如按性別、職業(yè)分組②數量分組 即按變量值的大小來分組,

32、適用于計量資料。,3.匯總 整理成統(tǒng)計表,可用計算機匯總,2024/3/23,53,(四)分析資料(analysis of data),是根據設計的要求,對整理后的數據進行統(tǒng)計學分析,結合專業(yè)知識,做出科學合理的解釋。,目的是在描述數據特征的基礎上,闡明事物的內在聯系和規(guī)律性。,2024/3/23,54,1.統(tǒng)計描述:statistical description選用恰當的統(tǒng)計指標,合適的統(tǒng)計表和統(tǒng)計圖,對資料的數量特征及其分

33、布規(guī)律進行測定和描述。,2024/3/23,55,(1)參數估計:estimation of parameters 如何由樣本統(tǒng)計量推斷總體參數。,(2) 假設檢驗:test of hypothesis 如何由樣本差異來推斷總體之間是否存在差異。,2. 統(tǒng)計推斷:statistical inference 如何在一定的可信程度下由樣本信息 推斷總體特征。,2024/3/23,56,如何學習統(tǒng)計學,循序漸進認

34、真完成各部分習題,2024/3/23,57,復習思考題,總體誤差分類概率統(tǒng)計資料的類型統(tǒng)計工作的基本步驟,,2024/3/23,58,統(tǒng)計中所說的樣本是指:A.隨意從總體中抽取出的部分個體B.依照研究者要求從總體中抽取出有意義的部分個體C.按照隨機原則抽取總體中有代表性的部分個體D.依照研究者要求從總體中抽取的部分個體E.按分布的順序抽取部分個體統(tǒng)計中所說的總體是指:A.隨意想象的研究對象的全體B.根據研究目的

35、確定的研究對象某項觀察值的的全體C.根據時間來劃分的研究對象的全體D.根據地區(qū)來劃分的研究對象的全體E.根據人群來劃分的研究對象的全體,C,B,2024/3/23,59,總體的要求是:A.大量的 B.同質的 C.隨機的 D.固定的 E.對稱的樣本指標值與總體指標值之差主要是指:A.隨機測量誤差 B.關系誤差 C.容許誤差

36、 D.抽樣誤差 E.系統(tǒng)誤差由于各種偶然的因素影響,造成同一對象多次測定的結果不完全一致,往往是有的稍高,有的稍低,這種差異是:A.系統(tǒng)誤差 B.隨機測量誤差 C.抽樣誤差 D.偏倚誤差 E.標準誤差,B,D,B,2024/3/23,60,抽樣誤差是指:A.個體值和總體參數值之差B.個體值和樣本統(tǒng)計量值之差C.樣本統(tǒng)計量值和總體參數以及各樣本統(tǒng)計量

37、之差D.樣本統(tǒng)計量值和樣本統(tǒng)計量值之差E.總體參數值和總體參數值之差統(tǒng)計學上說的系統(tǒng)誤差、測量誤差和抽樣誤差三種誤差,在實際工作中有:A.三種誤差都不可避免B.系統(tǒng)誤差和抽樣誤差不可避免C.系統(tǒng)誤差和測量誤差不可避免D.測量誤差和抽樣誤差不可避免E.三種誤差都可避免,C,D,2024/3/23,61,抽樣誤差是由:A.計算引起 B.測量引起 C.抽樣引起D.采樣結果不準確引起E.試劑,儀器未

38、經校正引起某事件發(fā)生的概率為1,即意味著:A.某事件發(fā)生的可能性為1%B.某事件可能發(fā)生C.某事件可能不發(fā)生D.某事件必然不發(fā)生E.某事件必然發(fā)生,C,E,2024/3/23,62,某事件發(fā)生概率為0,即意味著:A.某事件發(fā)生的可能性為100%B.某事件可能發(fā)生C.某事件可能不發(fā)生D.某事件必然不發(fā)生E.某事件必然發(fā)生隨機事件概率P值應是:A.1 B.0 C.0-1

39、 D.0.5 E.1-10,D,C,2024/3/23,63,A.儀器不準確 B.觀測條件的影響 C.操作方法不規(guī)范 D.標準不統(tǒng)一 E.觀察對象個體差異[1]可導致隨機測量誤差是: [2]引起抽樣誤差是:A.概率,其符號為P B.標準差,其符號為SC.P值在0-1之間

40、 D.P值在0-0.01之間E.P值在0.05-1.00之間[1]某事件發(fā)生可能性大小的數值稱為: [2]隨機事件出現的概率都在:,B,E,A,C,2024/3/23,64,A.由于儀器未校準,試劑未經校正等造成B.樣本含量過大C.由于個體差異造成D.由于各種影響測量和讀數的偶然因素造成E.由于樣本含量太少造成[1]系統(tǒng)誤差是: [2]抽樣誤差是: [3]隨機測量誤差是:,A,C,D

41、,2024/3/23,65,統(tǒng)計工作的前提與基礎是:A.計劃與設計 B.收集資料 C.整理資料 D.校對資料 E.分析資料統(tǒng)計工作四個基本步驟是:A.統(tǒng)計設計,收集資料,整理資料和分析資料B.收集日常生活資料,報告卡片,分析資料,總結C.收集統(tǒng)計報表,日常醫(yī)療工作資料,分析資料,描述資料D.收集專門內容報告卡片,進行整理,分析資料,核對資料E.收集病歷,日常醫(yī)療工作資料,分析資料,歸組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論