藥品不良反應信號檢測中重復報告的識別及消除.pdf_第1頁
已閱讀1頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、研究背景:
  自發(fā)呈報系統(tǒng)數(shù)據(jù)庫是藥品不良反應監(jiān)測的重要依據(jù),是實現(xiàn)有效藥物警戒的基石,隨著時間的推移、數(shù)據(jù)的積累以及國家對藥品安全性問題的重視,上報至國家藥品不良反應監(jiān)測中心的不良反應報告日益增多,至2017年底中國自發(fā)呈報系統(tǒng)收集到的報告已超過1100萬份。由于《藥品不良反應報告和監(jiān)測管理辦法》要求藥品生產(chǎn)企業(yè)、經(jīng)營企業(yè)和醫(yī)療機構發(fā)現(xiàn)藥品不良反應均應進行上報,以及錄入跟蹤報告時與之前的首次報告未進行關聯(lián)等原因,故難以避免重復

2、報告的問題。且近期國家食品藥品監(jiān)督管理總局頒布《關于藥品上市許可持有人直接報告不良反應事宜的公告》,要求藥品上市許可持有人必須報告藥品不良反應,又會帶來新的重復報告問題。重復報告的存在會引起假陽性或假陰性不良反應信號,從而影響藥品不良反應信號檢測的準確性。如何利用統(tǒng)計學方法從海量的不良反應數(shù)據(jù)中有效地識別并去除其中的重復報告,從而為之后的不良反應信號檢測提供可靠的數(shù)據(jù),是當前亟待解決的問題。
  研究目的:
  本研究以中國

3、藥品不良反應自發(fā)呈報系統(tǒng)數(shù)據(jù)庫為依托,主要探索兩部分內(nèi)容。首先對中國不良反應數(shù)據(jù)庫重復報告現(xiàn)狀進行初步分析,構建適用于中國數(shù)據(jù)庫結(jié)構的變量匹配模型、概率匹配模型和編輯距離法模型,經(jīng)過比較篩選出去除重復報告的最優(yōu)模型。其次使用最優(yōu)模型識別并剔除中國不良反應數(shù)據(jù)庫中的重復報告,重新檢測不良反應信號,探索重復報告對信號檢測的影響程度,為下一步藥品不良反應信號檢測提供高質(zhì)量數(shù)據(jù)。
  研究方法:
  方法學研究:首先,按照報告日期隨

4、機抽取一個月的數(shù)據(jù),使用變量匹配法找出疑似重復報告,然后通過雙人分開對比報告中的其他變量,找出其中的重復報告,獲得重復報告金標準數(shù)據(jù)庫,為模型評判做準備;其次,以重復報告金標準數(shù)據(jù)庫為依托,將三種方法運用到該數(shù)據(jù)中,從姓名、性別、出生日期、藥品名稱、不良反應、不良反應發(fā)生日期六個變量中,選擇不同變量組合,組成四種情境(情境1:姓名、性別、出生日期、藥品名稱、不良反應、不良反應發(fā)生日期;情境2:姓名、出生日期、藥品名稱、不良反應、不良反應

5、發(fā)生日期;情境3:姓名、性別、藥品名稱、不良反應、不良反應發(fā)生日期;情境4:姓名、藥品名稱、不良反應、不良反應發(fā)生日期),以查全率與查準率組成的綜合指標F1-Measure為評判指標,構建最優(yōu)的變量匹配模型、概率匹配模型和編輯距離模型。為了提高運行效率,概率匹配模型和編輯距離模型使用多次查找技術。
  實例應用:將三種模型應用到2014年國家藥品不良反應數(shù)據(jù)中,識別其中的重復報告,將重復報告剔除后重新進行信號檢測,并與未去除重復的

6、信號檢測結(jié)果進行比較,分析重復報告去除前后的新增信號和消失信號,將新增和消失信號與已知的不良反應數(shù)據(jù)庫進行比對,對結(jié)果進行解釋。
  研究結(jié)果:
  1.方法學研究:
  (1)重復報告金標準數(shù)據(jù)庫
  本研究從2014年數(shù)據(jù)庫中,按照報告日期,抽取3月份86882份報告,使用納入不同變量的變量匹配法(出生日期、藥品名稱、不良反應、ADR日期;姓名、性別、出生日期、ADR日期;姓名、藥品名稱、不良反應),找到疑似

7、重復報告1280組。經(jīng)過雙人分開對比民族、體重、電話、疾病史、病歷號、報告人、就醫(yī)單位等其他變量,確定重復報告359組。
  (2)模型結(jié)果
  經(jīng)過4種情境的比較,變量匹配模型在情境4,納入姓名、藥品名稱、不良反應、不良反應發(fā)生日期四個變量時,F(xiàn)1-Measure最高,為58.82%,查全率和查準率分別為57.10%和60.65%。概率匹配模型在情境2,納入姓名、出生日期、藥品名稱、不良反應、不良反應發(fā)生日期五個變量,且閡

8、值為38.5時,F(xiàn)1-Measure最高,為74.93%,查全率和查準率分別為71.59%和78.59%。而編輯距離模型在情境4,納入姓名、藥品名稱、不良反應、不良反應發(fā)生日期四個變量,且閾值為3.85時,F(xiàn)1-Measure最高,為75.96%,查全率和查準率分別為74.37%和77.62%。變量匹配模型、概率匹配模型和編輯距離模型分別檢測出205、257和267組真陽性重復組合。
  2.實例應用
  本研究基于國家藥品

9、不良反應自發(fā)呈報系統(tǒng)2014年1322641份數(shù)據(jù),采用變量匹配模型、概率匹配模型和編輯距離模型分別篩選重復報告。變量匹配模型共發(fā)現(xiàn)4191組重復報告,重復報告發(fā)生率為0.35%,但對于姓名缺失的報告,其真實性令人懷疑。概率匹配模型共發(fā)現(xiàn)5230組重復報告,發(fā)生率為0.36%。但對于僅不良反應發(fā)生日期不同的高度重復報告中,該模型不能很好的進行識別,比如白細胞減少和骨髓抑制不良反應報告。編輯距離模型發(fā)現(xiàn)4309組重復報告中,發(fā)生率為0.3

10、2%,與變量匹配模型相比,編輯距離模型不僅將完全相同的兩條報告篩選出來,同時也將存在微小差異的兩條報告篩選出來;與概率匹配模型相比,編輯距離模型精確度更高,更值得信任。
  去除重復報告前ROR、PRR和IC三種方法分別檢測出29921、32428和21994個藥品不良反應信號,使用變量匹配模型、概率匹配模型和編輯距離模型去除重復報告,ROR方法得到三種模型結(jié)果分別為28803、28612、28739,PRR為31248、3108

11、6、31201,IC分別為21242、21050和21155,信號數(shù)量有一定的減少,但前后變化較小,說明現(xiàn)階段重復報告對不良反應信號檢測影響有限。將去除重復之后得到的信號檢測結(jié)果與去除重復之前進行比較,發(fā)現(xiàn)消失的信號中90%以上都是假陽性信號。
  研究結(jié)論:
  綜上所述,本研究建議使用變量匹配模型(姓名、藥品名稱、不良反應及其發(fā)生日期)或者編輯距離模型(姓名、藥品名稱、不良反應及其發(fā)生日期,閾值為3.85)去除中國藥品不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論