醫(yī)學(xué)科研數(shù)據(jù)的提取與管理_第1頁
已閱讀1頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二講 醫(yī)學(xué)科研數(shù)據(jù)的提取與管理,陸軍軍醫(yī)大學(xué)軍隊衛(wèi)生統(tǒng)計學(xué)教研室Department of Health statistics ,AMU,68752313 劉 嶺,數(shù)據(jù)的質(zhì)量控制數(shù)據(jù)管理中的幾個常見問題統(tǒng)計分析結(jié)果與表達,主 要 內(nèi) 容,三、醫(yī)學(xué)統(tǒng)計工作的步驟,,,,,,,(一)統(tǒng)計設(shè)計,(三)整理資料,(二)收集資料,(四)分析資料,完整、準(zhǔn)確,核查、清洗,數(shù)據(jù)的質(zhì)量控制,(一)數(shù)據(jù)的來源與數(shù)據(jù)集,,,觀察性數(shù)據(jù),

2、實驗性數(shù)據(jù),科研數(shù)據(jù),觀察性數(shù)據(jù)(觀察性研究):衛(wèi)生工作報表,病歷資料觀察性研究:客觀地觀察、記錄和描述事物規(guī)律或現(xiàn)象的認識活動。,實驗性數(shù)據(jù)(實驗性研究):臨床病例資料,動物實驗記錄實驗性研究:人為控制實驗條件或?qū)ρ芯繉ο笫┘右欢ǜ深A(yù)措施所做的研究。,多中心臨床實驗或大型調(diào)查研究:樣本量大,變量數(shù)多,某地2002年735例65歲以上老年人健康檢查記錄,數(shù)據(jù)矩陣,某地2002年735例65歲以上老年人健康檢查記錄,某地2002年73

3、5例65歲以上老年人健康檢查記錄,,解釋變量:指示變量、分組變量、因素、協(xié)變量、預(yù)測變量等,反應(yīng)變量:表示試驗效應(yīng)或觀測結(jié)果的指標(biāo)。,注意:變量名:英文、不超過8個字符,分類變量適當(dāng)數(shù)量化處理。,(二)數(shù)據(jù)錄入,數(shù)據(jù)錄入是將研究收集到的各種信息轉(zhuǎn)換為數(shù)據(jù)形式,輸入到計算機進行保存、管理的過程。,數(shù)據(jù)審核:對收集到的原始資料進行審查與核實的過程。 真實、準(zhǔn)確、完整、標(biāo)準(zhǔn)制定數(shù)據(jù)編碼表:使研究得到的信

4、息數(shù)字化和標(biāo)準(zhǔn)化。 封閉性、開放性、缺失數(shù)據(jù)建立數(shù)據(jù)庫:運用專業(yè)的數(shù)據(jù)庫管理軟件。 數(shù)據(jù)管理、查詢、修改功能,原始數(shù)據(jù)錄入格式,數(shù)據(jù)錄入的原則,1、方便錄入:將字符變量轉(zhuǎn)換成數(shù)值變量;2、便于核查:一定要有標(biāo)識變量,以方便數(shù)據(jù)的核對;3、易于轉(zhuǎn)換:錄入數(shù)據(jù)時要考慮不同軟件的要求;4、利于分析:同一研究課題的結(jié)果最好錄成一個數(shù)據(jù)庫文件。,同一資料進行雙人重復(fù)錄

5、入方法,應(yīng)用程序?qū)蓚€數(shù)據(jù)庫進行比對,核查錯誤。,EpiData 特點,簡單易學(xué)、實用性強對計算機硬件要求不高調(diào)查表設(shè)計便捷與調(diào)查表形式一致的可視數(shù)據(jù)錄入界面數(shù)據(jù)核查功能強大且實現(xiàn)簡便 EpiData Analysis可用于一般的統(tǒng)計分析與制圖 數(shù)據(jù)轉(zhuǎn)換功能強大,建立調(diào)查表文件,,創(chuàng)建數(shù)據(jù)庫,建立核查文件,,,錄入數(shù)據(jù),數(shù)據(jù)庫管理,輸出數(shù)據(jù),,,EpiData的基本流程,數(shù)據(jù)庫的導(dǎo)出(Data in),SPSS文件,SAS文

6、件,DBF文件,Stata文件,REC文件,二. 數(shù)據(jù)管理中的幾個常見問題,(一)數(shù)據(jù)的質(zhì)量控制,1、輸入信息的有效性,即幅度檢查;2、輸入信息相互之間的一致性,即邏輯檢查;3、查漏:原始數(shù)據(jù)的編號與數(shù)據(jù)庫的編號核對;4、運用統(tǒng)計軟件觀察頻數(shù)分布是否異常;5、進行描述性統(tǒng)計,有無離群值和缺失值。,(二)變量的設(shè)置,1、連續(xù)型變量的輸入:直接錄入;2、離散型變量的輸入:數(shù)值化處理。,變量的設(shè)置方式:資料類型、研究目的、變量的

7、分布形式、統(tǒng)計方法的應(yīng)用條件。,(三)缺失值處理,缺失值主要來自資料收集中的漏報和漏填; 缺失值應(yīng)控制在數(shù)據(jù)記錄總量的10%以內(nèi); 注意將缺失值與“0”區(qū)分開來,缺失值一般用“.”表示; 缺失比例很小時,可舍棄;缺失比例較大時,可進行插補(不得已,慎用)。,(四)離群數(shù)據(jù)的處理,有無離群值? 頻數(shù)表、箱式圖或直方圖可初步判斷; 線性回歸方法判斷。,離群值(outlier)是指超出數(shù)據(jù)通常變化范圍的特大值或特小值的觀測值。,出

8、現(xiàn)離群值的處理 在離群值附近多次抽樣,了解數(shù)據(jù)的真實結(jié)構(gòu); 專業(yè)知識與統(tǒng)計方法結(jié)合。,(五)統(tǒng)計學(xué)方法的應(yīng)用條件,正態(tài)性檢驗 方差齊性檢驗 多重共線性判斷,統(tǒng)計方法的正確選擇,三. 統(tǒng)計分析結(jié)果與表達,,醫(yī)學(xué)論著的基本結(jié)構(gòu),摘 要,引 言,1. 材料與方法,2. 結(jié) 果,3. 討 論,Abstract,Introduction,Materials and Methods,Res

9、ults,Discussion,目的,方法,結(jié)果,結(jié)論,4,1,2,3,引言,材料與方法,結(jié)果,討論,,,,,,摘要,正文,,,,,,,,,,,,,,,,,統(tǒng)計表,統(tǒng)計圖,摘 要,目的,方法,結(jié)果,結(jié)論,4,1,2,3,與專業(yè)有關(guān),用簡介的話表達文章的目的。,交代受試對象的選取、樣本量、分組方式,給出重要指標(biāo)的指標(biāo)值、統(tǒng)計分析結(jié)果,結(jié)合結(jié)果與專業(yè)目的,下專業(yè)結(jié)論,,對摘要中的主要統(tǒng)計結(jié)果進行概述: 均數(shù)(中位數(shù)、率),標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)

10、誤), P 值; 兩組均數(shù)(率)之差或者OR值,95%可信區(qū)間(CI), P 值; 多個觀察指標(biāo)的相關(guān)系數(shù)及其P 值等。,,,,,,,,,,,,,,,,1、目的表達不清、寫法累贅;2、方法中: 未交待受試對象的選取方式、樣本量、分組方式; 實驗設(shè)計缺陷,無對照組; 樣本量太少,抽樣誤差大,結(jié)果不可靠;3、結(jié)果中: 未給出重要指標(biāo)的指標(biāo)值和具體的統(tǒng)計分析結(jié)果;4、結(jié)論中: 結(jié)果、結(jié)論混寫; 結(jié)

11、果不足以說明結(jié)論;,摘要表達的常見問題,未交待受試對象的選取方式、樣本量;無重要指標(biāo)的指標(biāo)值,以及具體的統(tǒng)計分析結(jié)果,,,,無重要指標(biāo)的指標(biāo)值,以及具體的統(tǒng)計分析結(jié)果,無重要指標(biāo)的指標(biāo)值,以及具體的統(tǒng)計分析結(jié)果,,不像結(jié)論,是結(jié)果的內(nèi)容,實驗設(shè)計缺陷:無對照組;作者的結(jié)果不足以說明此結(jié)論。,簡要說明研究背景和研究目的。 給出文獻分析的綜合復(fù)習(xí)結(jié)果: 如組間差別(Difference Among Groups);

12、P 值(P-value)等。 采用循證醫(yī)學(xué)的方法。,一. 引 言,統(tǒng)計表達,研究設(shè)計方案(Design of Research Methods),統(tǒng)計分析方法及軟件(Analysis Methods and Software),,目的:以使讀者確認論文中所有統(tǒng)計分析結(jié)果的 可靠性、研究結(jié)論的合理性和實驗過程的重現(xiàn)性。,二. 材料與方法,研究設(shè)計方案 (Design of Research Methods),研究

13、對象的來源和選擇方法,包括觀察對象的基本情況 需要說明診斷標(biāo)準(zhǔn)病例入選標(biāo)準(zhǔn)、病例排除標(biāo)準(zhǔn)、病例剔除標(biāo)準(zhǔn)、療效評價標(biāo)準(zhǔn)。有無失訪(失訪比例,不可超過20%)、有無“知情同意”評價療效有無遮蔽(“單盲Single Blind”、“雙盲Double Blind”或“多盲Multiple Blind”)等均衡性分析結(jié)果:影響因素(如年齡、性別、病情)樣本量估計的依據(jù)(Sample Size),,,,研究對象的來源,,,,,,,,病例

14、入選標(biāo)準(zhǔn)、病例排除標(biāo)準(zhǔn)、病例剔除標(biāo)準(zhǔn)、療效評價標(biāo)準(zhǔn),,,,,均衡性分析結(jié)果,,,樣本量估計的依據(jù),常用統(tǒng)計方法簡單說明: 如 檢驗、t 檢驗、單因素方差分析(ANOVA)等;特殊的統(tǒng)計方法給出相應(yīng)的參考文獻 一般統(tǒng)計計算軟件給出名稱 如SPSS、SAS、STATA等,EXCEL不能作為處理軟件特殊的計算軟件要給出軟件的過程名,統(tǒng)計分析方法及軟件(Analysis Methods and Software),,,,

15、,,,研究設(shè)計方案中的問題,“材料與方法”統(tǒng)計表達的常見問題,對隨機化分組方法不做任何說明。,觀察對比的研究未給出反映均衡性的統(tǒng)計指標(biāo),試驗的樣本量非常小,但不說明任何理由,組間例數(shù)相差很大,均衡性差,但不做任何說明,,,,,,對隨機化分組方法不做任何說明。,試驗的樣本量非常小,試驗的樣本量非常小,分組說明欠合理,,計算相對數(shù)的分母太小,計算的相對數(shù)不穩(wěn)定,不能反映客觀事實。,實驗設(shè)計有缺陷:無對照組,組間例數(shù)相差過于懸殊,組間例數(shù)相差

16、過于懸殊,觀察對比的研究未給出反映均衡性的統(tǒng)計指標(biāo),沒有采用的統(tǒng)計學(xué)方法,卻在方法中進行了描述,統(tǒng)計分析方法中的問題,太過籠統(tǒng),未寫明采用的具體的統(tǒng)計學(xué)方法,沒有統(tǒng)計學(xué)方法的介紹,無統(tǒng)計推斷,太過籠統(tǒng),未寫明數(shù)據(jù)描述形式以及采用的具體的統(tǒng)計學(xué)方法,太過籠統(tǒng),未寫明數(shù)據(jù)描述形式以及采用的具體的統(tǒng)計學(xué)方法,無統(tǒng)計軟件名稱及版本,且不應(yīng)該有參考文獻,采用了的統(tǒng)計學(xué)方法,卻沒有在資料與方法中進行了描述。,,,沒有采用的統(tǒng)計學(xué)方法,卻在資料與方法

17、中進行了描述。,,無統(tǒng)計推斷(通過樣本對總體下結(jié)論,存在抽樣誤差),統(tǒng)計表達,統(tǒng)計圖表(Statistical Graphs & Tables),,P 值的表達(Suitable Expression of P),統(tǒng)計指標(biāo)(Statistical Indexes),數(shù)據(jù)精度(Numerical Precision),三. 結(jié) 果,統(tǒng)計表的應(yīng)用: ▲三線表 ▲自明性,統(tǒng)計圖表,統(tǒng)計圖的應(yīng)用: ▲根據(jù)資料類型和

18、目的選擇正確的統(tǒng)計圖,統(tǒng)計表的內(nèi)容要豐富:制表的目的是為了對統(tǒng)計結(jié)果進行對比分析,若指標(biāo)過少,則不易湊統(tǒng)計表。,1,統(tǒng)計表要重點突出:一般一張統(tǒng)計表只表達一個中心內(nèi)容,若包含內(nèi)容過多,可分制成若干張統(tǒng)計表。,2,統(tǒng)計表要有“自明性” :即主謂分明,層次清楚。為此,標(biāo)目的處理是決定統(tǒng)計表質(zhì)量的關(guān)鍵。橫標(biāo)目常為第一主辭,縱標(biāo)目為第二主辭,切忌位置混亂,互相混雜,使讀者難以識別。,3,,制表注意事項,,統(tǒng)計圖的選擇,表的內(nèi)容過少,在文章中描述

19、清楚即可。,,表的邏輯性與自明性較差,統(tǒng)計表的自明性,統(tǒng)計圖錯誤:隨時間變化應(yīng)該采用線圖,傳統(tǒng)表達P >0.05 記為“NS”, P≤0.05 記為“*”, P≤0.01 記為“**”,提倡表達 提倡報告精確 P 值,,P 值的表達,P 值大小只能說明統(tǒng)計學(xué)意義的“顯著”,不說明實際效果的“顯著”。對于P值的解釋一定要結(jié)合專業(yè)知識。,P>0.05,就不能說“T1期表達率比T2-3期高”,,,,P<0.001,不表示

20、差異很大!只表示“有差異”這個結(jié)果很可靠。,相關(guān)系數(shù)保留3位小數(shù);檢驗統(tǒng)計量,如Chi-square值、t值保留3位小數(shù)即可;,數(shù)據(jù)精確度,計量資料的統(tǒng)計指標(biāo)(均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤、中位數(shù)、百分位數(shù)等)的保留小數(shù)位數(shù),應(yīng)該與原始數(shù)據(jù)的保留小數(shù)位數(shù)相同,小數(shù)位數(shù)一致;,計數(shù)資料的百分比保留1位小數(shù),一般不超過2位小數(shù);病死率、發(fā)病率按慣例選擇比例基數(shù),如1000‰,10000/萬,10萬/10萬等,或自行選擇合適的比例基數(shù),使率的表達至

21、少有1位整數(shù)。,原則:選擇最恰當(dāng)?shù)慕y(tǒng)計指標(biāo)準(zhǔn)確描述資料的特征。,非正態(tài)分布(Non-normal Distribution),計量資料(Measurement Data),,正態(tài)分布(Normal Distribution),計數(shù)資料(Count Data),率或比(Rate or Ratio),,統(tǒng)計指標(biāo),計量資料,用“ ”描述,,非參數(shù)檢驗,誤用t檢驗、ANOVA或卡方檢驗處理,統(tǒng)計分析方法中常見

22、的問題,將重復(fù)測量數(shù)據(jù)處理,誤用t檢驗或ANOVA處理,配對設(shè)計處理,誤用完全隨機設(shè)計處理,將多個組比較的ANOVA,誤用t檢驗處理,統(tǒng)計學(xué)方法錯誤!多組均數(shù)比較不能兩兩采用t檢驗,會導(dǎo)致假陽性錯誤概率增大,應(yīng)該采用方差分析,兩兩比較采用LSD法。,,,,,,,方差分析誤用成t檢驗,,,,方差不齊,應(yīng)該采用非參數(shù)檢驗,既然用中位數(shù)進行描述,統(tǒng)計學(xué)方法就應(yīng)該采用非參數(shù)統(tǒng)計,而非t檢驗,此為等級資料,應(yīng)該采用非參數(shù)檢驗,,將重復(fù)測量數(shù)據(jù)處理

23、,誤用t檢驗或ANOVA處理,將重復(fù)測量數(shù)據(jù)處理,誤用t檢驗或ANOVA處理,,完全隨機設(shè)計,,配對設(shè)計,,配對設(shè)計處理,誤用完全隨機設(shè)計處理,,配對設(shè)計處理,誤用完全隨機設(shè)計處理,,分組有誤:正常黏膜組織30例與結(jié)腸癌組織76例中的30例,屬于配對數(shù)據(jù),而非獨立樣本數(shù)據(jù)。,兩兩比較,檢驗水準(zhǔn)要調(diào)低,為0.05/10=0.005。luminalB型(HER2-)與HER2過表達型比較 =7.253,P=0.007>0.005

24、,差異無統(tǒng)計學(xué)意義。,統(tǒng)計解釋,,P 值的解釋(Interpretation of P),關(guān)聯(lián)的解釋(Interpretation of Association),因果的解釋(Interpretation of Causation),r 值的解釋(Interpretation of r),四. 討 論,P 值大小只能說明統(tǒng)計學(xué)意義的“顯著”,不說明實際效果的“顯著”。對于P值的解釋一定要結(jié)合專業(yè)知識。臨床療效“顯著”的處理:

25、當(dāng)觀察例數(shù)很少時,P值可能很大(統(tǒng)計“不顯著”)。臨床療效“不顯著”的處理(如新藥比對照藥有效率僅提高了0.1%),當(dāng)觀察例數(shù)很大時,P值可能很?。ńy(tǒng)計“顯著”)。,P 值的解釋,P<0.001,不表示差異很大!只表示“有差異”這個結(jié)果很可靠。,2024/3/24,99,某部隊在進行防化演練時考查新、舊防護服對化學(xué)戰(zhàn)劑的防護效果。隨機抽取15名戰(zhàn)士穿上新防護服,其余28名戰(zhàn)士仍穿舊防護服,演練后檢查兩組戰(zhàn)士戰(zhàn)劑反應(yīng)的發(fā)生率,資料

26、見下表,問兩組戰(zhàn)士戰(zhàn)劑反應(yīng)的發(fā)生率有無差別?,全國調(diào)查的調(diào)查結(jié)果,學(xué)齡前兒童營養(yǎng)性貧血患病率為23.5%。某醫(yī)院為了解當(dāng)?shù)貙W(xué)齡前兒童營養(yǎng)性貧血情況,對當(dāng)?shù)?396例學(xué)齡前兒童進行了抽樣調(diào)查 ,查出營養(yǎng)性貧血患兒363例,患病率為26.0%。問該地學(xué)齡前兒童營養(yǎng)性貧血患病率是否高于全國平均水平?,,r 值的大小表示相關(guān)的密切程度; P 值的大小表示r 值的可靠程度;,r 值的解釋,1、相關(guān)系數(shù)沒有單位,其值為-1≤r≤1。2、r值為正

27、表示正相關(guān),r值為負表示負相關(guān)。3、r絕對值大小代表相關(guān)關(guān)系的密切程度。4、P值表示r值是否有統(tǒng)計學(xué)意義。,研究相關(guān),論文中卻報告了回歸方程。,線性相關(guān)與回歸分析的常見問題,只關(guān)心相關(guān)系數(shù)的假設(shè)檢驗有無顯著性,而不關(guān)心相關(guān)系數(shù)有無實際意義。,不對相關(guān)系數(shù)作假設(shè)檢驗。,,,,,,,,,,,,r 值并不大,即使相關(guān)系數(shù)的假設(shè)檢驗有顯著性,但并無實際意義。,r=0.276,P =0.003,相關(guān)性程度不高!,,,研究相關(guān),論文中卻報告了回

28、歸方程,可以認為工作單調(diào)、工作危險、工作控制與工作滿意感有關(guān),并且呈線性回歸關(guān)系。其中工作單調(diào)、工作危險呈負影響,工作控制呈正影響。 比較可見,對工作滿意感的影響程度由大到小依次為:工作單調(diào)、工作危險、工作控制,因果的解釋(Interpretation of Causation),關(guān)聯(lián)的解釋(Interpretation of Association),,,作回歸與相關(guān)分析要有實際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象作回歸或相關(guān)分

29、析,有回歸關(guān)系或相關(guān)關(guān)系不一定是因果關(guān)系,必須對兩種現(xiàn)象間的內(nèi)在聯(lián)系有所認識,即能從專業(yè)理論上作出合理解釋或有所依據(jù)。,與專業(yè)知識結(jié)合在一起,完整地給出結(jié)論。,醫(yī)學(xué)專業(yè)知識醫(yī)學(xué)統(tǒng)計學(xué)知識計算機統(tǒng)計軟件技術(shù),基本根據(jù),,統(tǒng)計方法選擇的基本思路,2024/3/24,110,研究目的設(shè)計類型:配對設(shè)計、完全隨機、隨機區(qū)組、 拉丁方、交叉、析因、正交、嵌套、裂區(qū)設(shè)計處理因素:單因素、雙因素、多因素反應(yīng)變量:單變量、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論