醫(yī)學論文中常見的統(tǒng)計學問題及其_第1頁
已閱讀1頁,還剩96頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1,,醫(yī) 學 論 文中常見的統(tǒng)計學問題及其評述,新疆醫(yī)科大學 徐 秦,2,前 言 醫(yī)學統(tǒng)計學在科研工作中日益發(fā)揮著重要和必要的作用。廣大醫(yī)務(wù)工作者一般都能正確地運用科研設(shè)計的基本原理和統(tǒng)計學方法進行科研工作,并把實踐經(jīng)驗上升到理論、撰寫出較好的醫(yī)學論文。但是,必須清醒地看到有少數(shù)作者的論文中誤用、錯用和濫用統(tǒng)計學的問題十分嚴重,其直接不良后果是導致醫(yī)學論文質(zhì)量不高或者結(jié)論錯誤而發(fā)生誤

2、導。,3,為此,近20年來,針對“醫(yī)學論文中的統(tǒng)計學問題”這一主題,引發(fā)了許多學者紛紛揚揚的撰文。英國Clant A報道“生物醫(yī)學文獻評論者發(fā)現(xiàn)約半數(shù)的文章所用的統(tǒng)計學方法是不正確的;《英國醫(yī)學雜志》1976年三個月內(nèi)的42%的文章至少有一處統(tǒng)計學的問題。”(Clantz A(張志慈譯). 怎樣發(fā)現(xiàn)、糾正和防止醫(yī)學文獻中的錯誤[J].國外醫(yī)學心血管病分冊,1981,1:38)北京醫(yī)科大學王紹賢教授對中華醫(yī)學會1984年編輯出版的醫(yī)學、內(nèi)

3、科、外科、婦產(chǎn)科和兒科等五種雜志中刊出的595篇論著,逐篇閱讀后指出“統(tǒng)計學的問題為11.2~15.9%…?!?4,北京醫(yī)科大學凌瑞珠教授撰文指出“《中華醫(yī)學檢驗雜志》50~70%的論著中有統(tǒng)計學的問題。”(凌瑞珠. 臨床科研中常見的統(tǒng)計誤用問題[J].中國衛(wèi)生統(tǒng)計, 19 85, 2(2): 57)撰寫同類評述文章的教授學者還有:石河子醫(yī)學院龐樹桂,新疆醫(yī)科大學趙福祥、姜明、徐秦,北京軍事醫(yī)學科學院胡良平,上海醫(yī)科大學詹紹康,第四軍醫(yī)

4、大學徐勇勇,中山醫(yī)科大學方積乾等。,5,,醫(yī)學論文中的統(tǒng)計學問題形形色色、五花八門,粗略羅列出來的有40~50種,合并之后為科研設(shè)計,統(tǒng)計學方法,相對數(shù)和統(tǒng)計圖表這四大類問題。以下通過實例進行分析和評述。,6,一、科研設(shè)計,例1 《不同量鋅補充對缺鋅運動小鼠體內(nèi)自由基生成與清除的影響》(中國運動醫(yī)學雜志,1992,1:11)一文“采用離乳小鼠64只,按性別、體重隨機分成缺鋅、缺鋅后補鋅5ppm、缺鋅后補鋅50ppm及缺鋅后補鋅

5、500ppm 4大組。每大組又分成運動和不運動兩組,各組均有小鼠8只。開始時所有小鼠均進食缺鋅飼料,6周后繼續(xù)缺鋅組小鼠繼續(xù)進食缺鋅飼料,其余各組分別進食5、50、500ppm的補鋅飼料。又3周后,把所有小鼠均處死并測定血、肝的鋅、銅、MDA、SOD、GSH—Px。結(jié)果揭示:補鋅50ppm對運動及不運動缺鋅小鼠各項指標的恢復有良好作用,補鋅5ppm對運動小鼠非最佳劑量,補鋅500ppm無論對運動小鼠還是不運動小鼠均有害”。,7,,評述1

6、: 主要缺陷是對照不足,應(yīng)增設(shè)正常鋅飼料組。鋅的劑量從5~500ppm,跨度太大,應(yīng)通過文獻確定合適的鋅劑量。最好選擇配伍組設(shè)計,表頭設(shè)計如下:,8,例2 《剖腹產(chǎn)同時放置宮內(nèi)節(jié)育器735例初步觀察》(中華婦產(chǎn)科雜志,1985.20;49) 原文提要:作者將施行剖腹產(chǎn)手術(shù)1562例中的735例作為實驗組,在剖腹產(chǎn)的同時放置節(jié)育器,規(guī)定其適應(yīng)癥是:破膜和總產(chǎn)程都不超過24小時,無感染(無陽性體征、血常規(guī)正常)以及

7、第—胎產(chǎn)后本人同意者;另將篩選剩下的827例作為對照組,單純作剖腹產(chǎn)。實驗后比較兩組對象的術(shù)后出血、惡露干凈時間和術(shù)后副反應(yīng)等指標,其中除一項指標外,其它的差異均無顯著性(P>0.05)。作者據(jù)此肯定了本實驗作為產(chǎn)后避孕方法的價值。,9,,評述2: 兩組除了是否放置節(jié)育器不同外,受試對象的其他諸多條件并不齊同,實驗組條件較好而對照組較差,即組間干擾因素不均衡,在此基礎(chǔ)上觀察放置節(jié)育器的效應(yīng)缺乏可比性。因為無法排除干擾因素對實

8、驗效應(yīng)的影響,所以本結(jié)果難以說明放置節(jié)育器對產(chǎn)后出血等指標有無影響。應(yīng)該把適合放置節(jié)育器者按照隨機化的原則分為實驗組和對照組后再觀察放置節(jié)育器后的效應(yīng)。,10,例3 《缺鐵性貧血防治方法研究》(中華兒科雜志1985年送審稿) 原文提要:作者選擇七個工廠托兒所6個月至7歲的1174名兒童,按托幼單位分為四組:①鐵劑組524人;②維生素C組237人;③維生素C+鐵劑組360人;④單用加鐵食鹽組33人。經(jīng)不同處理后,2~3個月后復

9、查血色素,結(jié)果發(fā)現(xiàn)維生素C+鐵劑組比其他三個組要好。,11,,評述3: ①缺鐵性貧血與飲食營養(yǎng)有極大的關(guān)系。6個月的嬰兒以吃奶為主,7歲的兒童以吃飯為主,半托還是全托、星期天接回家與否都會影響實驗結(jié)果。飲食營養(yǎng)不同,其防治貧血的效果必有差異,這是不言自明的道理。②兒童生長發(fā)育時期,血象的生理變化隨年齡的增長而異,2個月后與3個月后測定血色素,就可能不同。文中只說2~3個月后測定,最遲幾個月后測定沒有交待清楚。由于觀察效果

10、的時間不一致,未做到標準化,所以組間的可比性就差。③較好的設(shè)計是把每個托幼單位的兒童分層隨機分組進行比較。,12,例4 《聯(lián)合抗凝治療晚期狼瘡腎炎的療效觀察》(北京醫(yī)學院學報,1984,16: 31) 原文提要:把26例晚期狼瘡腎炎的患者分為激素組、環(huán)磷酰胺組和聯(lián)合抗凝三個組。作者在討論中說:“聯(lián)合抗凝組的療效優(yōu)于其他兩種療法”。,13,,評述4: 聯(lián)合抗凝組在用新抗凝片以前采用了預(yù)備療法(血清鋅低者口服1%硫酸

11、鋅),而其它兩組未介紹作預(yù)備治療。紅斑狼瘡是一種自身免疫性疾病,而鋅與機體免疫力密切相關(guān)。因此,組間缺乏均衡可比性。,14,例5 《中藥肺炎合劑治療小兒肺炎400例臨床觀察》(軍墾科技,1973,11:19) 原文提要:用肺炎合劑治療小兒肺炎400例,平均住院天數(shù)為5.2天。與同期單用西藥治療的平均住院天數(shù)9.4天相比,縮短了4~5天,與往年同期肺炎平均住院天11.68天相比,縮短了6天。結(jié)論是服用中藥的同時可根據(jù)病情適當

12、選用1~2種抗菌素配合治療,其療效比單用西藥好。,15,,評述5: 文中未介紹單用西藥的兩組治療的例數(shù)和患兒一般情況,也未交待實驗組與對照組中使用西藥的種類、劑型、劑量和使用天數(shù)是否齊同可比。文中所舉兩個典型病例,在入院前都曾使用了多種抗菌素。入院后除用中藥外,一例加用了青霉素,一例加用了四環(huán)素。由于設(shè)計與實驗方法都存在問題,就不僅使實驗組與對照組的非處理因素不均衡,而且兩組的處理因素也混淆不清。因此無法得出明確的結(jié)論。為保

13、證組間均衡一致,觀察組與對照組在時間上應(yīng)同時平行進行。因為在時間上的差異,可導致受試對象的條件和實驗條件的失控。,16,例6 《小兒腹部術(shù)后并發(fā)癥中西醫(yī)結(jié)合治療的探討》(中華小兒外科雜志,1980,4:22) 原文摘要:小兒腹部術(shù)后并發(fā)癥147例。作者將1974~1977年的69例用中西醫(yī)結(jié)合治療,1970~1973年的78例用西藥治療,兩組相比,結(jié)論是前者取得較好的效果。,17,,評述6: 術(shù)后并發(fā)癥的治療

14、效果與術(shù)后感染程度、醫(yī)療質(zhì)量、醫(yī)護人員的服務(wù)態(tài)度以及患兒的體質(zhì)等都有關(guān)系。時間的不同,上述各項因素是很難加以控制的,從而使組間比較失去了均衡性。一般說 歷史對照或回顧對照,是一種非均衡對照。除少數(shù)非處理因素影響不大的疾病外,一般不宜采用。,18,例7 硫酸鎂不同劑量、途徑對重度妊娠中毒癥治療的初步觀察》(新醫(yī)學,1984,2:64) 原文提要:采用兩組相互對照的實驗設(shè)計:1975年6月至1979年12月,甲組91例,使用硫

15、酸鎂5克與冬眠靈一號合劑半量交替肌注;1980年1月至1982年6月,乙組66例,改用硫酸鎂靜脈滴注加肌注。經(jīng)顯著性檢驗后,得出乙組療效高于甲組的結(jié)論。,19,評述7: 這也是回顧對照的案例,因此組間的均衡性差,結(jié)論的可靠性值得懷疑。,20,,例8 《新疆北疆墾區(qū)白血病臨床發(fā)病統(tǒng)計報告》(石醫(yī)資料,1976,4:57) 原文提要:石河子醫(yī)學院附屬醫(yī)院1965~1974年10年內(nèi)共收治白血病141例,約占同期內(nèi)

16、、兒科住院總數(shù)的0.42%,和1963年烏魯木齊統(tǒng)計的0.075%相比有明顯增高。,21,,評述8: 也屬于歷史對照或文獻對照。同時錯誤地把石河子一所醫(yī)院10年的資料與烏市的所有醫(yī)院1年資料相比較,這是事先無設(shè)計,事后亂比較的典型案例。,22,例9 《酒精擦浴和非冰袋物理降溫效果探討》(實用護理雜志,1985,10:27)一文指出“對39℃以上的高熱病人,不論性別、年齡、病因,入院后無選擇性采用四種方法進行降溫”

17、有效率分別為82.1%、92.0%、57.1%、53.5%,……以第2組效果為最好。當降溫處理120分鐘時,又以第l組為最好。這可能與降溫前的體溫和應(yīng)用降溫解熱劑有關(guān)……”。,23,,評述9: ①實驗前4個組的條件不一致,缺乏可比性,這一點作者自己已察覺。因此結(jié)論可能有誤。最好能對實驗前的年齡、用藥情況、疾病種類等因素進行一致性檢驗后再進行實驗。 ②作者首先肯定第2組降溫效果好,繼而又肯定第1組降溫效果好。這樣的

18、結(jié)論使讀者不得要領(lǐng)。應(yīng)當事先確定一個時間界限,或按時間動態(tài)觀察。 ③體溫是容易獲得計量資料的指標,而作者用的是有效率.這樣就損失了不少信息,而且何謂“有效”呢?更主要的是沒有進行“假設(shè)檢驗”就得出優(yōu)劣順序是不妥的。,24,,例10 《乳癌根治術(shù)后皮瓣加壓包扎與負壓引流的療效觀察》(實用護理雜志,1986,2(10):20)一文,作者為了比較兩種方法的療效,從1979年1月至1981年12月乳癌根治術(shù)后采用加壓包扎

19、的病例中隨意抽取100例,與從1982年1月至1984年12月術(shù)后用負壓引流病例中隨意抽取的100例,分別就其皮瓣成活率、傷口感染率以及肺部并發(fā)癥的發(fā)生率等進行對比。,25,評述10: ①未能遵循隨機化抽樣原則,隨意不等于隨機。 ②文中對比屬于非同時期進行的一種非均衡對照。因為不同時期的醫(yī)療、護理條件很難齊同,故可比性差。,26,,例11 《潑尼松、環(huán)磷酰胺治療腎病綜合癥》(中華內(nèi)科雜志,1973

20、,15:101) 原文提要:把患者分為兩組,一組(1965~1970年)用潑尼松治療(P組);另一組(1971~1975年)用潑尼松與環(huán)磷酰胺治療(P+C組)。兩組各取資料完整者15例進行比較,詳見表2。結(jié)論是P+C組比P組療效高。,27,評述11: 可看出,兩組在性別、病程、腎功損害等因素上均衡性差,尤其是病程,P組比P+C組長,病程長或短顯然會影響療效。因此,在兩組缺乏均衡可比的情況下,得出P+C組的療效高的結(jié)論就欠妥

21、。,28,例12 《長效避孕藥治療銀屑病的初步報告》(中華皮膚科雜志,1980,13:67) 原文摘要:患者分為三組,第一組40例,用復方炔雌醚治療,其中6例女性患者為已婚婦女,要求避孕,無急、慢性腎疾病等,另有男性患者34例;第二組32例,用長效避孕藥三合一片治療,其中男性患者19例,女性患者13例,未交待病人條件;第三組共22例,其中女性患者15例,均為絕經(jīng)后婦女,用氯地孕酮治療。作者對三個組的顯效率作了卡方檢驗,

22、差異有統(tǒng)計學意義,得出一組療效最佳、三組次之、二組較差的結(jié)論。,29,,評述12: 三個組男女患者的條件不相同.第三組女性患者為絕經(jīng)后的婦女,男性患者是否齊同也未交待。同時病期長短差別很大(7月~40多年)未交待是否已控制病期這個因素。因此,三組間的療效可比性很差,其療效的差異不能肯定是否因藥物不同所致。,30,例13 在《腫瘤患者體外淋巴細胞轉(zhuǎn)化率檢查及其評價》(山東醫(yī)藥,1980,10:12)一文中,研究對象

23、為67例惡性腫瘤病人,均是臨床上已明確診斷的住院及門診病人,其中44例為腫瘤患者(消化道癌23例,肺癌19例,其它癌腫8例),男39例,女5例,年齡36~73歲;23例為白血病患者(急淋7例,急粒8例,慢粒8例),男18例,女5例,年齡16~54歲。正常對照:33例正常人,均為健康獻血員,年齡21~33歲,男20例,女3例。通過觀察作者得出腫瘤組和白血病組平均淋轉(zhuǎn)率與正常組相比有顯著差異(P<0.001)的結(jié)論。說明腫瘤與白血病病人細胞

24、免疫功能均有明顯降低。,31,評述13: 假設(shè)檢驗中,特別強調(diào)組間的均衡性和資料的可比性。本資料實驗組和對照組年齡相差較大,而年齡與細胞免疫功能有關(guān)。即年齡較大的細胞免疫功能低下;反之,年齡較輕的細胞免疫功能高,本資料年齡是混雜因素。作者所認為的腫瘤與白血病病人細胞免疫功能均有明顯降低,不能排除與年齡有關(guān)。因此,兩組之間缺乏可比性,所作出的推斷結(jié)論理由不充分。對照組若能從該院住院或門診非腫瘤病人中選擇年齡、性別等條件與實驗組

25、相似者,所作出的推斷結(jié)論就比較有說服力。,32,,例14 某作者在研究大網(wǎng)膜蒂瓣小腸延長后氨基酸吸收功能影響時,選用幼犬4只,雌雄各2只,分為實驗組和對照組,每組2只,據(jù)每組這么少的數(shù)據(jù)進行統(tǒng)計學處理后便得出結(jié)論,顯然結(jié)論值得考慮。(施利國,張安年,趙桂華. 醫(yī)學論文常見統(tǒng)計問題分析. 濱州醫(yī)學院學報,2000 ,23(1):88.),33,例15 某醫(yī)師共檢測18例正常人的抑制性細胞活性,其平均抑制率為42

26、.25%,標準差為10.3%,制訂抑制率的正常范圍為22% ~ 63%(42.25±2×10.3%)。測得急性肝炎22例,平均抑制率為30.9%,在正常范圍內(nèi)。,34,,評述15: 確定正常值范圍時,要求樣本含量足夠大,即通過對多個實驗單位的觀察,使總體內(nèi)部的變異規(guī)律充分顯示出來,縮小樣本抽樣誤差;足夠數(shù)量的重復,還可以抵消非實驗因素所造成的干擾。對于制訂臨床生化指標的正常值范圍,樣本含量不少于300例。

27、而該樣本含量僅為18 例,遠遠小于要求的數(shù)量,不能充分顯示事物的本質(zhì)規(guī)律。,35,例16 某醫(yī)師為研究食管癌與吃雜糧的關(guān)系,調(diào)查了200例食管癌病人,其中有199例(99.5%)常吃雜糧,因此認為吃雜糧與食管癌的發(fā)生有關(guān)。,36,例17 某醫(yī)師為研究宮頸癌與職業(yè)的關(guān)系,調(diào)查了100例宮頸癌病人,發(fā)現(xiàn)其中95%的病人是體力勞動者,因此認為體力勞動與宮頸癌的發(fā)生有關(guān)。,37,,評述17: 這2個例子都缺

28、少對照組,并有“以比當率的問題”。例16也許當?shù)鼐用穸家噪s糧為主,99.5%的食管癌病人常吃雜糧就很平常。如果在同一地區(qū)以同年齡同性別的健康人和不患食管癌者作為對照,也是基本上吃雜糧的占99.5%左右,這樣就不能說明吃雜糧與食管癌的發(fā)生有關(guān)。而例17,可能這是一個農(nóng)村地區(qū),病人又都是老年婦女,因此95%的病人是體力勞動者也很平常。如果在同一地區(qū)以同年齡同性別的健康人或者是不患宮頸癌者作為對照組,若體力勞動為主的也占95%左右,就不能說明

29、體力勞動與宮頸癌的發(fā)生有關(guān)。,38,,例18 消炎通脈沖劑治療血栓靜脈炎39例,經(jīng)治療后,治愈22例(57.2%),顯效10例(25.8%),好轉(zhuǎn)7例(17%)。該藥用于此病是比較合適的,實踐證明效果較好。,39,,評述18: 在不設(shè)對照組的情況下所得到的結(jié)果,難以說明該藥的療效如何。因為除藥物的作用外,還有其它非治療因素如自愈傾向、心理、環(huán)境等因素的影響。更重要的是,沒有作該藥與其它治療此病藥物之間療

30、效的比較,就不能輕易做出該藥用于此病治療是合適的結(jié)論。,40,例19 (1)400名畸胎兒的父親,有95%在新婚時喝酒; (2)100名90歲的長壽老人,20歲以前每個月吃肉不超過0.25 kg; (3)某省調(diào)查200名長壽老人,有80% 長期居住生活在山區(qū)和農(nóng)村; (4)300例高血壓病人每周吃肉3次以上。(詹紹康. 合理設(shè)立對照. 中國實用外科雜志,1999,19(9):563),41,,評述19:

31、 上述4個數(shù)據(jù)都不能說明所述的原因與結(jié)果有什么聯(lián)系,都未設(shè)立合理的對照。正確的做法是:(1)調(diào)查400名(也可以不是400名,以下類同)正常兒的父親,有百分之幾在新婚時喝酒;(2)同時出生的100名短壽的人,與多少20歲以前每個月吃肉不超過0.25 kg,這個調(diào)查難以進行,因為同時出生的100名短壽的人早已死亡,幾乎無法調(diào)查;(3)200名短壽者,有多少長期居住生活在山區(qū)和農(nóng)村;(4)300例非高血壓病人,有多少每周吃肉3次以上

32、。,42,例20 有5件標本Ⅰ,Ⅱ,Ⅲ,Ⅳ和Ⅴ,每一件均勻分成4份后隨機分配給4種處理A、B、C和D,試比較4種處理間的差別,詳見表3。,43,評述20: (1)不恰當做法:視縱向4列為4組數(shù)據(jù),進行4組間比較。①多次t檢驗:分別對A與B,A與C,A與D,B與C,B與D,C與D作兩組比較的t檢驗,得P值依次為0.02,0.03,0.01,0.37,0.63和0.19,據(jù)此認為B,C,D與A之間的差異具有統(tǒng)計學意義,但

33、B與C,B與D,C與D的差異均無統(tǒng)計學意義。②單因素方差分析:同時比較A,B,C,D4個處理組均數(shù)間的差異,得F=0.55,P=0.59;據(jù)此認為4個處理組均數(shù)的差異無統(tǒng)計學意義。 (2)理由:①此資料為隨機區(qū)組設(shè)計,同一件標本為一個區(qū)組,同一區(qū)組內(nèi)4種處理有較好的可比性;無視區(qū)組的存在,則組內(nèi)誤差較大,識別組間差異的能力降低;②不能翻來覆去比較:如果規(guī)定每次t檢驗犯第一燈錯誤的概率為0.05,則粗略估計,6次t檢驗犯第一類錯誤

34、的概率=1-(1-0.05)6=0.27。 (3)正確作法:隨機區(qū)組資料的方差分析:將處理組間的差別與扣除區(qū)組間變異后的隨機誤差進行比較,則識別組間差異的能力提高。本例,處理組間的F=8.23,P=0.003,組間差別有統(tǒng)計學意義;區(qū)組間,F(xiàn)=1.21,P=0.36,區(qū)組間差別無統(tǒng)計學意義。,44,例21 有人欲分析蛇毒因子(CVF)劑量對血液白細胞噬菌率的影響,得表4的數(shù)據(jù)。,45,評述21: (1)不恰當做法:①用單

35、因素方差分析:F=0.701,P>0.5,認為不同劑量間差別無統(tǒng)計學意義;②作各組均數(shù)lg(劑量)的回歸分析.回歸方程為Y(噬菌率)=61.784-6.885lg(劑量+1),決定系數(shù)為R2=0.914. (2)理由:①多個劑量組比較答非所問:由多個劑量組的比較只能得知得知均數(shù)間是否有差異,有差異不等于有劑量反應(yīng)關(guān)系,也未必能概括出是否有趨勢和有什么樣的趨勢;②以均數(shù)回歸易出假象:回歸方程是否有統(tǒng)計學意義與反應(yīng)的變異狀況有關(guān)

36、,以諸個體反應(yīng)值的均數(shù)作回歸計算掩蓋了反應(yīng)的變異性。 (3)正確作法:①利用個體資料作回歸分析:回歸方程為Y(噬菌率)=61.784-6.885lg(劑量+1),決定系數(shù)為R2=0.095;②適當變換:若反應(yīng)和劑量間散點圖呈曲線狀,可對原數(shù)據(jù)作適當變換后作回歸分析(圖略),46,二、統(tǒng)計學方法 例22 《巨細胞包涵體病的臨床觀察—附26例尿病毒分離》(新疆醫(yī)學,1987,2:72)一文中:根據(jù)“男性15例,OWV

37、分離陽性數(shù)10例;女性9例,OWV分離陽性數(shù)4例,經(jīng)卡方檢驗得χ2=0.313,P>0.05”。,47,評述22: 該資料合計數(shù)不足40例,不能進行卡方檢驗,應(yīng)使用直接概率法計算,現(xiàn)經(jīng)10個四格表的概率相加得P=2.035×10-5,P<0.01,性別的差異有統(tǒng)計學意義。作者錯誤選擇了統(tǒng)計學方法而得出相反的結(jié)論。另外要指出的是:即使可以使用卡方檢驗公式,也不應(yīng)選擇10、4、15、9這四個數(shù)字,而應(yīng)取10、4、5、5

38、這四個數(shù)字計算。,48,例23 《中草藥保留灌腸治療嬰兒腹瀉》(實用護理雜志,1985,l:10)一文中報導“采用中草藥保留灌腸法治療70例,有效67例;采用抗生素治療50例,有效42例。經(jīng)統(tǒng)計學處理得P<0.01,兩種方法療效差異有極顯著性意義”。,49,,評述23: 任何假設(shè)檢驗的公式都有適用條件的,本例理論數(shù)中有小于5的:(50×11)/120=4.58,應(yīng)當用四格表的校正卡方檢驗公式,經(jīng)計

39、算得χ2=3.523,P>0.05,結(jié)論應(yīng)當是兩種療效差別無統(tǒng)計學意義。由于作者沒有注意適用公式的前提條件錯用公式并得出完全相反的結(jié)論。,50,,例24 《628例坐式分娩助產(chǎn)方法及體會》(中華護理雜志,1989,5:281)一文,作者對初產(chǎn)婦單胎枕先露自然分娩,臥式與坐式各隨機抽樣628例進行觀察,結(jié)果見表5。作者認為坐式分娩第二產(chǎn)程時間顯著縮短…。第二產(chǎn)程的縮短減少了胎兒在產(chǎn)道內(nèi)的擠壓時間,故坐式分娩(系采用坐式綜合產(chǎn)床分

40、娩)胎兒窒息率比臥式分娩為低。,51,評述24: 首先,作者遵循隨機化原則是應(yīng)當肯定的。但是抽樣研究不可避免地會產(chǎn)生抽樣誤差,兩個樣本窒息率不同,作者不進行任何統(tǒng)計檢驗僅根據(jù)表面數(shù)據(jù)就下結(jié)論是不妥的。所以必須進行假設(shè)檢驗才能作出推斷結(jié)論。本例χ2=1.698, P>0.05,與原作者結(jié)論相反。本資料不支持作者的觀點。,52,例25 《關(guān)于血壓正常值的探討》(實用護理雜志,1985,3:封四)一文,作者通過50例18

41、~22歲女性學生左右臂血壓對比(資料見表6),提出了與全國中等衛(wèi)生學校試用教材《基礎(chǔ)護理學》中提到的血壓生理性變化“一般右上肢高于左上肢”相反的結(jié)論。,53,評述25: ①沒有進行假設(shè)檢驗就下結(jié)論,研究者應(yīng)根據(jù)資料的性質(zhì),選用合理的統(tǒng)計分析方法,才能獲得正確的結(jié)論; ②例數(shù)偏少,總數(shù)才50例,分組后更少了,對于血壓這種變異大的指標來講是不妥當?shù)模?③“高”的界限是什么?均值高不高?表6難以提供這種信息

42、。,54,例26 《烏恰縣柯爾克孜等民族心臟病人群患病率調(diào)查報告》(新疆醫(yī)學,1986, 16(2):97)一文見表7,55,評述26: 從表7可知,原作者在比較柯爾克孜族、維吾爾族、漢族等三個民族的患病率時,采用的是四格表資料的χ2檢驗。而本文實屬三個樣本率的比較,故應(yīng)選用R×C表的χ2檢驗,查χ2界值表,確定P值,本資料得P>0.05,沒必要作“兩兩比較”。另外,表7的繪制也存在著不少問題。

43、,56,例27 在《七年來苯酚膠漿劑閉塞輸卵管絕育臨床觀察》(中華婦產(chǎn)科雜志,1979;14(2):79)一文中,經(jīng)復查者共431例,其中哺乳期者156例,成功者142例,成功率為91.03%;非哺乳期者275例,成功者261例,成功率為94.91%。據(jù)此,作者得出“哺乳期婦女閉塞成功率較低”的結(jié)論。,57,評述27: 哺乳期和非哺乳期婦女閉塞輸卵管成功率從表面數(shù)字上看不相等,但兩個總體率是否也不相等須通過假設(shè)檢驗才能作出判

44、斷,而該文作者未經(jīng)假設(shè)檢驗就得出“哺乳期婦女閉塞成功率較低”的結(jié)論,顯然是不妥當?shù)?。?jīng)統(tǒng)計學處理χ2=2.47,P>0.05,所得結(jié)論恰好與作者相反。,58,例28 在《針刺麻醉對細胞免疫功能和皮質(zhì)醇的影響》(上海針灸雜志,1984; (3):26)一文中,作者選擇了瘍病胃大部切除的患者,用同位素技術(shù)——外周血氚化胸腺嘧啶核苷(3H—TdR)參入法,觀察針刺麻醉、針藥復合麻醉及硬膜外麻醉的術(shù)后機體細胞免疫功能的變化(詳見表8

45、)。,59,表8 三種不同麻醉方法不同時間外周血SH—TdR參入率(原表),60,作者認為:針麻、硬膜外麻醉和針藥復合麻醉三組病員手術(shù)后第一天的H--TdR參入率的淋巴細胞數(shù)均顯著低于手術(shù)前,表示術(shù)后第一天病員的細胞免疫功能降低。但值得提出的是針麻與硬膜外麻醉的降低P<0.01,比針藥復合麻醉P<0.05,更顯著。,61,評述28: 醫(yī)學論文中涉及統(tǒng)計學結(jié)論的問題為數(shù)不少,本例就很典型。對于假設(shè)檢驗而言,P值越小越有理

46、由認為有差別,換句話說,在P<0.01時所下有差別的結(jié)論,比在P<0.05時更為可靠,而并不表示前者的差別加大。統(tǒng)計上的 “P<0.01”與“P<0.05”,說明不了實際差別的大小。因此,針麻與硬膜外麻醉的降低(P<0.01),比針藥復合麻醉(P<0.05)更顯著的提法不妥。,62,例29 某醫(yī)師對36例心衰患兒治療前后血漿內(nèi)皮素濃度進行了比較,見表9。(李舒梅,敖慧斌. 吳劍波.醫(yī)學研究論文應(yīng)注意的統(tǒng)計學問題.贛南醫(yī)學院學

47、報,1999,19(3):241),表9 36例心衰患兒治療前后血漿內(nèi)皮素濃度比較(x±s),63,評述29: 本文目的是推斷治療前后患者血漿內(nèi)皮素有無變化,屬自身對照設(shè)計的資料,其實驗數(shù)據(jù)是一一對應(yīng)的,統(tǒng)計分析時應(yīng)將治療前后的每一對數(shù)據(jù)按統(tǒng)一方向相減,用所得差值作為變量值,然后計算均數(shù)、t值等,即采用配對t檢驗作統(tǒng)計分析。而作者卻將上述配對設(shè)計資料分為2個獨立的組,分別計算2組各自的均數(shù)、標準差,并按完全隨機設(shè)計(

48、成組設(shè)計)資料作t檢驗,這樣把原來只有差值之間的差異擴大為兩個樣本之間的差異,增大了實驗誤差,降低了實驗精確度。如采用配對設(shè)計,各對子間常存在明顯的正相關(guān)關(guān)系,檢驗效能優(yōu)于成組t檢驗。,64,例30 某文報道了不同生長時間肝內(nèi)腫瘤直徑的比較,見表10。(陳捷. 醫(yī)學論文中常見數(shù)理統(tǒng)計應(yīng)用錯誤剖析. 中國衛(wèi)生統(tǒng)計,1997,14(4):53-55),表10 不同生長時間肝內(nèi)腫瘤直徑的比較(x±s),注:與l周

49、比較, * P < 0.001,65,評述30: 本例實際上是檢驗3個相互獨立樣本均數(shù)間有無顯著性差異的問題,屬于單因素試驗的方差分析資料,而作者采用了t 檢驗對該資料進行了1周與2周、1周與3周的腫瘤直徑有無差別的假設(shè)性檢驗,漏掉了2周與3周的比較,本資料應(yīng)采用方差分析,得出F=20.82,P < 0.01,再進行組間兩兩比較,例如q檢驗。,66,例31 某文中報道了急性腦卒中患者血漿DD的含量,見

50、表11,表11 急性腦卒中患者血漿DD含量(x±s),注:各患者組與對照組比較,P < 0.001,67,評述31: 本例是一個檢驗4個相互獨立的樣本均數(shù)間差異有無統(tǒng)計學意義的問題,屬完全隨機設(shè)計的方差分析資料。研究者卻將腔隙性腦梗塞組、大面積腦梗塞組、高血壓腦出血組分別與正常對照組作t檢驗進行比較。這樣就和原來的多組整體設(shè)計分裂、與原設(shè)計思想不符、同時損失了一部分信息(各試驗組之間未進行比較)。應(yīng)選用單因素

51、完全隨機設(shè)計的方差分析,先進行F檢驗,在有差異的基礎(chǔ)上再對各均數(shù)作兩兩比較。,68,例32 用某藥治療腦梗塞患者70例,觀察治療前后構(gòu)音障礙。治療前42例有構(gòu)音障礙,治療后減少到32例,問治療前后的差別有無統(tǒng)計學意義。本例把它當成一般的四格表資料把觀測結(jié)果整理成表12。按四格表χ2檢驗公式計算χ2 =2。87,得P > 0.05,得出在 a = 0.05 的檢驗水準上治療前后構(gòu)音障礙無明顯改變。,69,表12 某藥治

52、療腦梗塞患者構(gòu)音障礙改變情況(原表),70,評述32: 本例為治療前后自身配對設(shè)計,應(yīng)把觀測結(jié)果整理成表13。按配對χ2檢驗方法計算χ2值,χ2 = 4.50,得P<0.05,因此正確的結(jié)論是在α= 0.05的檢驗水準上,治療前后構(gòu)音障礙的改變有統(tǒng)計學意義。,表13 用某藥治療腦梗塞患者構(gòu)音障礙改變情況,71,例33 方積乾; 凌莉; 張敏瑞.近期醫(yī)學論文中常見統(tǒng)計錯誤及其糾正.中山醫(yī)科大學學報,1999;

53、20(4): 314~318一文中:收集甲狀腺術(shù)中正常甲狀腺組織作成16份標本,隨機分為4個處理組。將處理后的標本分別行免疫組織化學染色,作單位面積HLA-Ⅱ抗原陽性細胞計數(shù)。得數(shù)據(jù)如下(詳見表14):第一組(經(jīng)體積分數(shù)為95%空氣和5%CO2 培養(yǎng)7d):2.5,2.4,2.6,2.5。第2組(經(jīng)體積分數(shù)為95%空氣和5%CO2 培養(yǎng)14 d):1.8,1.9,1.7,1.8。第3組(經(jīng)體積分數(shù)為95% O2和5%CO2 培養(yǎng)7

54、d):2.2,2.3,2.1,2.2。第4組(經(jīng)體積分數(shù)為95% O2和5%CO2 培養(yǎng)14 d):1.9,1.8,1.7,1.9。作者采用單因素方差分析方法,直接比較4組資料間的差別,得F = 60。00,P = 0。00,因此認為4組間差別有統(tǒng)計學意義。,72,表14 析因設(shè)計下的實驗結(jié)果,73,評述33: 這是典型的 2 因素 2 水平的析因設(shè)計,將數(shù)據(jù)整理,其中縱向和橫向2列均有可比性,如用單因素方差分析,不

55、能扣除各因素的效應(yīng)而得到單純有誤差引起的變異,4組間比較不敏感。應(yīng)采用2 因素 2 水平析因設(shè)計的方差分析,除討論4組資料間的差別外,還可進一步分析處理主效應(yīng)和交互效應(yīng)。主效應(yīng):指某一因素各水平間的平均差別。本例A因素的主效應(yīng)=(2.2+1.9)/2 -(2.5+1.8)/2= - 0.1;B 因素的主效應(yīng)=(1.8+1.9)/2-(2.5+2.2)/2 = - 0.5。交互效應(yīng):若某因素的單獨效應(yīng)隨另一因素水平的變化而有較大變化,則稱

56、這2個因素存在交互效應(yīng)。本例AB的交互效應(yīng)=[(1.9-1.8)-(2.2-2.5)]/2=0.2。經(jīng)檢驗:A因素的主效應(yīng),F(xiàn) = 1.37, P = 0.26;B因素的主效應(yīng),F(xiàn) = 47.13, P<0.01;A與B交互效應(yīng):F = 0.03, P = 0.87??梢姡挥蠦因素的效應(yīng)具有統(tǒng)計學意義。,74,例34 有人用已確診的患者和非患者各93名的資料來考核一種新診斷方法,結(jié)果如表15(方積乾; 凌莉; 張敏瑞

57、.近期醫(yī)學論文中常見統(tǒng)計錯誤及其糾正.中山醫(yī)科大學學報,1999; 20(4): 314-318)。,表15 診斷效果考核資料,75,評述34: (1)不恰當做法:①用靈敏度和特異度評價診斷效果,靈敏度=P(T+ / D+)=92/93 =0.989,特異度= P(T_/D_)=29/93=0.312,因靈敏度較高而認為該方法可用于發(fā)現(xiàn)病人;②計算陽性預(yù)測價值和陰性預(yù)測價值:陽性預(yù)測價值=92/156=0.590,陰性預(yù)測價值=

58、29/30=0.967,因陰性預(yù)測價值較高而認為該方法可用于排除非病人。,76,(2)理由:①靈敏度和特異度不反映診斷效果:靈敏度是已肯定為患者的前提下該方法呈現(xiàn)陽性的概率,特異度是已肯定為非患者的該方法呈現(xiàn)陰性的概率。二者不能直接說明該方法可否用于診斷實踐;②欲反映診斷效果需采用陽性預(yù)測價值和陰性預(yù)測價值:陽性預(yù)測價值是某方法呈現(xiàn)陽性的前提下確系患者的概率,陰性預(yù)測價值是某方法呈現(xiàn)陰性的前提下確系非患者的概率。二者可直接說明該方法可否

59、用于診斷實踐;③本例資料不能用來計算陽性預(yù)測價值和陰性預(yù)測價值:本例中156名診斷結(jié)論為陽性者,30名診斷結(jié)論為陰性者均不是相應(yīng)總體中的隨機樣本。欲評價診斷效果,最好分別從診斷結(jié)論為陽性和陰性的總體中抽取隨機樣本,據(jù)此計算陽性預(yù)測價值和陰性預(yù)測價值;④靈敏度、特異度和患病率三結(jié)合:若上述隨機樣本不易獲得,而只能從病人和非病人2個總體中抽樣,則必須了解目標人群中所論疾病的患病率(P0),將3者結(jié)合才能算出陽性預(yù)測價值和陰性預(yù)測價值。,77

60、,三、相對數(shù)的應(yīng)用,例35 《體外循環(huán)術(shù)后消化道出血的觀察及護理》(實用護理雜志,1992,5:25)一文中的臨床資料敘述:“消化道出血共13例,男性9例,女性4例....死亡3例,死亡率23%....”,評述35: 文中所說的死亡率,實際上是病死率。原作者在分析資料時,將死亡率與病死率相混淆。,78,例36 《腦出血病人的護理體會》(實用護理雜志,1985,10:15)一文中:“本組3

61、3例腦出血病人,男性19例,占56.7%;女性42.4%,……,其年齡組,30歲以下的5例,占15.2%;60歲以下的12例,占36.4%;70歲以下的9例,占27.3%;70歲以上的7例,占21.2%。……以上提示,年齡組大者腦出血的發(fā)病率高,而40歲以上者腦出血發(fā)病率低……”。,79,評述36: 上述相對數(shù)都是構(gòu)成比指標而不是率的指標,作者犯有“以比當率”的錯誤。發(fā)病率表示一定時期(年、季、月等)內(nèi)某人群中新發(fā)生某種病例的頻

62、率,在醫(yī)院內(nèi)是無法得到發(fā)病率的。上述資料只能反映33例腦出血患者中不同性別、不同年齡的比重。,80,例37 《使用保留針頭取血方法的探討》(實用護理雜志.1985,1:22)一文中報導,5種不同情況進行肝素頭皮針注射,觀察頭皮針堵塞時間并計算了成功率。按第1種情況進行4例,成功3例,成功率75%;按第2種情況進行6例,成功4例,成功率66.7%……。,81,評述37: 成功率75%的含義應(yīng)當是:平均100次實驗,成

63、功75次。顯然要求計算成功率的分母不能太小。上述資料實驗次數(shù)僅幾例就計算成功率,結(jié)論似不可令人信服。須知,當分母較小時不宜計算相對數(shù),只報告絕對數(shù)即可。,82,例38 在《35例多器官衰竭患者的監(jiān)護》(實用護理雜志. 1986,2(1):11)一文中報道,累及臟器數(shù)與死亡率:2個器官20例,死亡8例,死亡率40%,3個器官10例,死亡9例,死亡率90%,四個器官5例,死亡5例,死亡率100%。,83,,評述38:

64、文中的“死亡率”,實際上是“病死率”。病死率與死亡率雖然都是反映疾病嚴重程度的指標,但病死率是反映某種疾病患者中的死亡數(shù),以百分率表示,而死亡率則反映社會人群中每1,000人中的死亡數(shù),常以千分率表示。二者不能混淆。,84,例39 在《3019例潰瘍病發(fā)病情況調(diào)查分析》(山東醫(yī)藥. 1980,10:52)一文中,作者從本廠兩個分廠共選擇3019人進行了潰瘍病普查,并通過表16分析年齡與發(fā)病率的關(guān)系。,85,評述39:

65、 文中的“發(fā)病率”實際上是“患病率”?;疾÷逝c發(fā)病率雖然都是反映疾病發(fā)生頻度的指標,但患病率(時點率)表示某個時點上人群中存在某種疾病(包括新、舊病例)的頻率,多為體檢中慢性病的指標,而發(fā)病率(時期率)則表示一定時期內(nèi)某人群中新發(fā)生某病(新病例)的頻率。二者不能混為一談。,86,例40 某醫(yī)師研究早產(chǎn)的發(fā)生原因,調(diào)查了160 名早產(chǎn)兒母親的職業(yè),結(jié)果為工人116名(72.5%),職員25名(15.6%),教師9名(5.6

66、%),醫(yī)護8名(5.0%),其它2名(1.3%),因此認為工人懷孕者最容易發(fā)生早產(chǎn)。,87,評述40: 這個結(jié)果犯了“以比當率”的錯誤。要比較那種職業(yè)的孕婦容易發(fā)生早產(chǎn),還必須調(diào)查各種職業(yè)的產(chǎn)婦人數(shù)總共有多少,其中早產(chǎn)的有多少,只有算出早產(chǎn)兒發(fā)生率,才可能分析那種職業(yè)的孕婦容易發(fā)生早產(chǎn)。若該地區(qū)(例如烏魯木齊頭屯河區(qū))產(chǎn)婦中72.5%是工人,那么早產(chǎn)兒母親中工人占72.5%是很正常的,其實過期兒、死產(chǎn)兒、畸型兒母親中工人的比例都

67、較大。不能說明職業(yè)為工人的孕婦最容易發(fā)生早產(chǎn)、分娩過期兒、死產(chǎn)兒、畸型兒。,88,例41 有人調(diào)查男性7674人,沙眼患者6235人,發(fā)病率為81.25%;調(diào)查女性2896人,沙眼患者2225人,發(fā)病率為76.83%。,89,評述41: 不是“發(fā)病率”而是“患病率”?!鞍l(fā)病率”是指某段時期平均每1000人口中新發(fā)生的病例數(shù),其計算公式為:某病發(fā)病率=某年(期)內(nèi)所發(fā)生的新病例數(shù)除以同年(期)平均人口數(shù)以后再乘以100

68、%或1000‰。例如某地某年年平均人口數(shù)為2500人,白喉發(fā)病28人,該地白喉發(fā)病率為11.22‰。,90,,例42 某醫(yī)師在原發(fā)性肝癌誤診原因分析一文中,共收治肝癌161例,入院前外院誤診2個月以上150例,誤診率為93.17%,其中41例入院時依然未考慮本病,誤診率為25.47%。(王凌. 醫(yī)學論文中常見統(tǒng)計學概念誤用分析. 數(shù)理醫(yī)藥學雜志,2000,13(5):435),91,,評述42: 文中“誤診”實際上應(yīng)

69、為“漏診”,入院前及入院時的誤診率應(yīng)為漏診率。實際運用中,較多的是把“漏診”當做“誤診”。因此,在表述時,應(yīng)當把“誤診”與“某病”聯(lián)系起來描述,即“誤診為某病”。,92,,例43 1980年2月28日文匯報報道:“據(jù)統(tǒng)計,城市人的壽命比農(nóng)村少5年。湖北地區(qū)曾調(diào)查了90歲以上的長壽者125人,其中住在城市的占24%,家在農(nóng)村的占76%,可能城市人的緊張生活、噪音、空氣污染對壽命均有影響。”此結(jié)論你認為正確否?要想得出正確的結(jié)論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論