醫(yī)學(xué)雜志論文中常見(jiàn)統(tǒng)計(jì)學(xué)錯(cuò)誤分析及對(duì)策_(dá)第1頁(yè)
已閱讀1頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)雜志論文中常見(jiàn)的統(tǒng)計(jì)學(xué)錯(cuò)誤及對(duì)策,同濟(jì)大學(xué)醫(yī)學(xué)院 醫(yī)學(xué)統(tǒng)計(jì)學(xué)教研室 艾自勝2014-9-28,內(nèi)容,(1)描述性分析中的常見(jiàn)錯(cuò)誤(2)假設(shè)檢驗(yàn)中常見(jiàn)的統(tǒng)計(jì)學(xué)方法選擇錯(cuò)誤(3)研究設(shè)計(jì)中的常見(jiàn)錯(cuò)誤(4)糾正錯(cuò)誤的對(duì)策,描述性分析中的常見(jiàn)錯(cuò)誤,在醫(yī)學(xué)論文中,對(duì)不同類型的研究資料需要用不同的統(tǒng)計(jì)指標(biāo)進(jìn)行描述。實(shí)際工作中統(tǒng)計(jì)指標(biāo)選擇常見(jiàn)的問(wèn)題有: 計(jì)量資料無(wú)論是否服從正態(tài)分布,統(tǒng)統(tǒng)用均數(shù)±標(biāo)準(zhǔn)差描述研究

2、結(jié)果的數(shù)據(jù)特征; 計(jì)數(shù)資料混淆率和構(gòu)成比(百分比)的概念,常將構(gòu)成比誤用為率來(lái)說(shuō)明事物發(fā)生的強(qiáng)度;率和構(gòu)成比的分母太小,卻計(jì)算相對(duì)數(shù)來(lái)進(jìn)行描述和比較。,計(jì)量資料描述常見(jiàn)錯(cuò)誤分析,(1)誤用正態(tài)分布的描述性統(tǒng)計(jì)指標(biāo)描述呈偏態(tài)分布的資料(標(biāo)準(zhǔn)差>均數(shù) )仍采用“ 均數(shù)±標(biāo)準(zhǔn)差”表示,特別當(dāng)表中采用標(biāo)準(zhǔn)誤 取代標(biāo)準(zhǔn)差s時(shí),前述的錯(cuò)誤很難被察覺(jué)出來(lái) ; (2)統(tǒng)計(jì)圖方面的主要錯(cuò)誤有兩個(gè),其一,橫坐標(biāo)軸上的刻度值不準(zhǔn)

3、確,等長(zhǎng)的間隔代表的數(shù)量不等;在直角坐標(biāo)系中,從任何一個(gè)數(shù)值開始作為橫軸或縱軸上的第一個(gè)刻度值。其二,用條圖或復(fù)式條圖表達(dá)連續(xù)性變量的變化趨勢(shì);,,(3)統(tǒng)計(jì)表中數(shù)據(jù)的含義未表達(dá)清楚,令人費(fèi)解; (4)運(yùn)用相對(duì)數(shù)時(shí),混淆“百分比”與“百分率”;,計(jì)量資料的案例一,,計(jì)量資料的案例一的分析與對(duì)策,各項(xiàng)指標(biāo)的均數(shù)均大于2倍標(biāo)準(zhǔn)差, 說(shuō)明資料為偏態(tài)分布, 用均數(shù)、標(biāo)準(zhǔn)差描述資料的集中趨勢(shì)和離散程度顯然是不妥當(dāng)?shù)? 案例一中只列

4、出P 值, 也未說(shuō)明具體的統(tǒng)計(jì)學(xué)方法。 正確的做法應(yīng)用中位數(shù)描述集中趨勢(shì), 用四分位數(shù)間距表示離散程度?;蛘呤菍⒃紨?shù)值經(jīng)對(duì)數(shù)等轉(zhuǎn)換后, 再計(jì)算轉(zhuǎn)換值的平均數(shù)和標(biāo)準(zhǔn)差, 同時(shí)在表格中應(yīng)該列出具體的統(tǒng)計(jì)量及P 值。,計(jì)數(shù)資料描述性分析中的常見(jiàn)錯(cuò)誤,(1)錯(cuò)誤地將構(gòu)成比當(dāng)作率使用(2)錯(cuò)誤地計(jì)算平均率(3)計(jì)算相對(duì)數(shù)時(shí)分母過(guò)小,計(jì)數(shù)資料的案例一,計(jì)數(shù)資料的案例一的分析與對(duì)策,研究者對(duì)計(jì)數(shù)資料的案例一資料進(jìn)行分析, 認(rèn)為“輪

5、狀病毒腹瀉的發(fā)病率最高為43.1%,痢疾次之28. 8%, 傷寒最低為13. 1%” 。這是將構(gòu)成比當(dāng)作發(fā)病率使用的典型錯(cuò)誤, 是臨床科研中最常見(jiàn)的錯(cuò)誤之一。,,實(shí)際上表中所提供的信息, 只能用來(lái)說(shuō)明在該腹瀉門診就診的521例病人中, 各種腹瀉病人所占的比重, 并不能反映出各自發(fā)病率的高低, 而且計(jì)數(shù)資料的案例一所列的% 號(hào)也未指明是構(gòu)成比還是發(fā)病率, 容易引起歧義。正確的描述應(yīng)該是在腹瀉門診病人中, 輪狀病毒引起的腹瀉所占的比例最高,

6、 傷寒最低。,計(jì)數(shù)資料的案例二,計(jì)數(shù)資料的案例二的分析與對(duì)策,某研究者為了研究三種不同值班情況孕婦的早產(chǎn)發(fā)生情況, 作者在計(jì)算平均率時(shí), 錯(cuò)誤地將幾個(gè)率相加后取其平均值, 這種類型的錯(cuò)誤也是臨床科研論文中常見(jiàn)的錯(cuò)誤之一。 如計(jì)算計(jì)數(shù)資料的案例二中三種值班女工的早產(chǎn)的合計(jì)發(fā)生率( 即平均率)時(shí), 以( 2. 7+ 4. 8+ 10. 3) /3= 5. 9, 即平均發(fā)生率為5. 9%。正確的算法是: ( 94 /1547)

7、× 100% = 6. 1%。,假設(shè)檢驗(yàn)中常見(jiàn)的統(tǒng)計(jì)學(xué)方法選擇錯(cuò)誤,定量資料進(jìn)行假設(shè)檢驗(yàn)的方法很多, 其常見(jiàn)錯(cuò)誤是: (1)忽視t 檢驗(yàn)和F (方差分析) 檢驗(yàn)的前提條件;(2)誤用t檢驗(yàn)代替F 檢驗(yàn);(3)誤用參數(shù)檢驗(yàn)代替非參數(shù)檢驗(yàn);(4)各種方差分析混用。,假設(shè)檢驗(yàn)中常見(jiàn)的統(tǒng)計(jì)學(xué)方法選擇錯(cuò)誤,計(jì)數(shù)資料統(tǒng)計(jì)分析的常見(jiàn)錯(cuò)誤是:(1)錯(cuò)誤選擇了四格表卡方檢驗(yàn)方法, 未選用Fisher精確檢驗(yàn);(2)等級(jí)變量資料一律地

8、使用卡方檢驗(yàn)。,計(jì)量資料統(tǒng)計(jì)分析的常見(jiàn)錯(cuò)誤,(1)忽視了t檢驗(yàn)的使用條件;(2)多個(gè)樣本均數(shù)比較錯(cuò)誤地用多個(gè)t 檢驗(yàn)代替方差分析;(3)誤用t檢驗(yàn)分析重復(fù)測(cè)量設(shè)計(jì)資料,t檢驗(yàn)的使用條件,單樣本t檢驗(yàn)的應(yīng)用條件:樣本服從正態(tài)分布; 成組t檢驗(yàn)的應(yīng)用條件:樣本服從正態(tài)分布;兩樣本的總體方差相等即方差齊性。 配對(duì)t檢驗(yàn)的應(yīng)用條件:差值服從正態(tài)分布。,假設(shè)檢驗(yàn)的案例一,假設(shè)檢驗(yàn)的案例一的分析與對(duì)策,這類錯(cuò)誤是臨床醫(yī)學(xué)

9、科研論文中定量資料分析中最常見(jiàn)的錯(cuò)誤, 而且是原則性錯(cuò)誤, 會(huì)增加犯第一類錯(cuò)誤的概率。假設(shè)檢驗(yàn)的案例一資料為不同年齡組不同性別基礎(chǔ)能耗情況, 原作者用t檢驗(yàn)分別對(duì)各組均數(shù)逐一進(jìn)行比較, 得出在男女研究對(duì)象青年組與中年、老年組的基礎(chǔ)能耗差異有顯著性。,假設(shè)檢驗(yàn)的案例一的分析與對(duì)策,這種檢驗(yàn)方法有誤, 因?yàn)樵撡Y料為多組基本均數(shù)間的比較, 正確的方法是用單因素方差分析, 只有在方差分析有顯著性的基礎(chǔ)上有必要再作均數(shù)間的兩兩比較, 用q檢驗(yàn),

10、而不是t檢驗(yàn), 同時(shí)假設(shè)檢驗(yàn)的案例一中應(yīng)該列出方差分析的統(tǒng)計(jì)量F值及具體的P值。,假設(shè)檢驗(yàn)的案例二,假設(shè)檢驗(yàn)的案例二的分析與對(duì)策,重復(fù)測(cè)量數(shù)據(jù)是指同一受試對(duì)象的同一指標(biāo)在不同時(shí)間點(diǎn)上進(jìn)行多次測(cè)量所獲得的資料, 常用來(lái)分析某項(xiàng)觀察指標(biāo)在不同時(shí)間點(diǎn)上的變化特點(diǎn), 這類資料在臨床試驗(yàn)中較為常見(jiàn)。本案例是兩種不同處理方案對(duì)病人血漿ET 濃度( pg /m l)變化比較, 分別在麻醉前、術(shù)畢、術(shù)后24 h、術(shù)后48 h測(cè)量病人血漿ET濃度, 觀察

11、兩種處理方案對(duì)病人血漿ET濃度的影響及變化趨勢(shì)。,假設(shè)檢驗(yàn)的案例二的分析與對(duì)策,原文作者用配對(duì)比較t檢驗(yàn)對(duì)不同時(shí)間兩個(gè)處理方式血漿ET濃度的差異進(jìn)行檢驗(yàn), 發(fā)現(xiàn)有統(tǒng)計(jì)學(xué)差異, 并認(rèn)為A 組術(shù)后ET濃度相對(duì)穩(wěn)定, 術(shù)后無(wú)明顯升高。我們認(rèn)為資料的統(tǒng)計(jì)處理不恰當(dāng), 因?yàn)檫@時(shí)一個(gè)典型的重復(fù)測(cè)量的多個(gè)樣本均數(shù)的比較, 故應(yīng)該采用重復(fù)測(cè)量方差分析檢驗(yàn)不同處理組間和時(shí)間因素及處理因素與時(shí)間的交互效應(yīng)是否具有統(tǒng)計(jì)學(xué)意義, 如果差異有顯著性, 然后再作兩

12、均數(shù)間的兩兩比較。,假設(shè)檢驗(yàn)的案例三,假設(shè)檢驗(yàn)的案例三的分析與對(duì)策,本案例反映不同分娩方式重癥肝炎孕婦結(jié)局的比較。 原作者使用一般四格表卡方檢驗(yàn), 得: 卡方值= 7. 24, P = 0. 007; 但觀察了22例, 總例數(shù)小于40, 不適合使用一般卡方檢驗(yàn)。應(yīng)用Fisher精確概率檢驗(yàn)法。,假設(shè)檢驗(yàn)的案例三的分析與對(duì)策,本例正確的計(jì)算結(jié)果為P = 0. 011(雙側(cè)概率)。很多分析人員認(rèn)為兩種方法分析的結(jié)果都是認(rèn)為不同分娩

13、方式重癥肝炎孕婦結(jié)局有差別, 但統(tǒng)計(jì)學(xué)意義是不一樣的, 因?yàn)镻 值大小不一樣, 拒絕和不拒絕無(wú)效假設(shè)的概率是不一樣的。,假設(shè)檢驗(yàn)的案例四,假設(shè)檢驗(yàn)的案例四的分析與對(duì)策,本文作者將資料中三個(gè)等級(jí)中的“有效”和“顯效”合并, 使之成為二分變量。然后, 用四格表卡方檢驗(yàn), 得卡方值 =3.302, P=0.069, 作出兩組治療總有效率差異無(wú)統(tǒng)計(jì)學(xué)的結(jié)論。原統(tǒng)計(jì)分析中將三個(gè)等級(jí)合并為兩個(gè)等級(jí), 導(dǎo)致信息丟失, 結(jié)果得出兩處理組總療效無(wú)顯著性差

14、異的結(jié)論。,假設(shè)檢驗(yàn)的案例四的分析與對(duì)策,從本案例中可見(jiàn)到對(duì)照組“有效”的構(gòu)成比為28.57%,高于治療組的“ 有效”構(gòu)成比17.64%, 而治療組“ 顯效”構(gòu)成比76.47% 高于對(duì)照組“顯效”構(gòu)成比50.00%, 另外顯效與有效在臨床上都是表示治療的有利效果, 盲目合并會(huì)導(dǎo)致錯(cuò)誤的結(jié)果。,假設(shè)檢驗(yàn)的案例四的分析與對(duì)策,正確顯著性檢驗(yàn)方法應(yīng)該 用Ridit分析 或者非參數(shù)檢驗(yàn)(秩和檢驗(yàn)) 或者CMH檢驗(yàn) 或者Logi

15、stic回歸分析 本案例采用秩和檢驗(yàn)分析, z= 2.27, P = 0.023, 差異有統(tǒng)計(jì)學(xué)意義, 說(shuō)明治療組的療效優(yōu)于對(duì)照組。,研究設(shè)計(jì)中的常見(jiàn)錯(cuò)誤,(1)隨機(jī)分組與隨機(jī)抽樣沒(méi)有真正遵循隨機(jī)化原則;(2)無(wú)對(duì)照或?qū)φ赵O(shè)計(jì)不合理;(3)樣本含量太少。,隨機(jī)分組與隨機(jī)抽樣的錯(cuò)誤,無(wú)論是隨機(jī)抽樣還是隨機(jī)分組都要有足夠的樣本作前提,要在文章中描述清楚隨機(jī)抽樣的抽樣總體、樣本含量、抽樣方法,隨機(jī)分組的隨機(jī)方法、各組的樣本含量與基本特

16、征等。醫(yī)學(xué)科研論文中最普遍的問(wèn)題是濫用“隨機(jī)”,只要是抽樣或分組,不管實(shí)際是否采用了隨機(jī)的方法,在論文中均不談采用了什么樣的隨機(jī)方法,就將“隨機(jī)”寫上,將隨機(jī)誤解為隨意、隨便、不采用隨機(jī)化處理方法,導(dǎo)致結(jié)果缺乏可靠性。,隨機(jī)分組與隨機(jī)抽樣的錯(cuò)誤的對(duì)策,隨機(jī)化原則是由Fisher在創(chuàng)建實(shí)驗(yàn)設(shè)計(jì)理論的過(guò)程中首先提出的,隨機(jī)化原則是實(shí)驗(yàn)研究中保證取得無(wú)偏估計(jì)的重要措施。隨機(jī)化方法由最初的抽簽、擲硬幣和抓鬮等方法發(fā)展到隨機(jī)數(shù)字表、隨機(jī)排列表和用

17、計(jì)算機(jī)軟件或計(jì)算器產(chǎn)生的偽隨機(jī)數(shù)。,對(duì)照的錯(cuò)誤與對(duì)策,醫(yī)學(xué)研究,尤其是實(shí)驗(yàn)設(shè)計(jì)的研究,需要設(shè)立合適的對(duì)照組,只有設(shè)立了對(duì)照,才能消除非處理因素對(duì)實(shí)驗(yàn)結(jié)果的影響,從而將所關(guān)心的處理因素的效應(yīng)分離出來(lái)。在論文中應(yīng)說(shuō)明對(duì)照取自的總體,如何得來(lái)的,樣本含量多大? 是否與實(shí)驗(yàn)匹配或配伍,與試驗(yàn)組的均衡性如何?,對(duì)照的錯(cuò)誤與對(duì)策,有些文章雖然設(shè)立了對(duì)照組,卻使用非同期對(duì)照或歷史對(duì)照,組間的基礎(chǔ)狀況如性別、年齡、病情等不一致,缺乏可比性。還有些作者雖

18、然設(shè)立了正常對(duì)照組,在分析的時(shí)候卻未考慮,使該設(shè)計(jì)失去了原有的意義。,樣本量問(wèn)題與對(duì)策,研究的實(shí)驗(yàn)單位要達(dá)到一定的數(shù)量,才能避免將個(gè)別情況誤認(rèn)為普遍情況,將偶然性或巧合的現(xiàn)象當(dāng)成必然的規(guī)律,以致將實(shí)驗(yàn)結(jié)果錯(cuò)誤地推廣到群體。在醫(yī)學(xué)論文中,有些P>0.05的“陰性結(jié)果”,樣本含量不夠致檢驗(yàn)效能不足是一個(gè)主要的原因。實(shí)驗(yàn)之前不進(jìn)行樣本含量估計(jì)會(huì)帶來(lái)兩個(gè)問(wèn)題:一是雜志上論文的發(fā)表偏倚,即當(dāng)實(shí)驗(yàn)結(jié)果出現(xiàn)P0.05的陰性結(jié)論,則鎖進(jìn)抽屜,以至

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論