摘要

目的了解我国当前药物不良反应(ADR)/不良事件(AE)信号检测研究文献中数据挖掘方面存在的问题。方法检索中国生物医学文献服务系统、中国知网、万方医学和维普网关于ADR/AE信号检测类研究的文献(截至2022年5月30日)。将数据挖掘部分的相关内容从以下4个维度和9个条目进行调查和评价。(1)背景数据, 包括1个条目;(2)数据预处理, 包括药物映射、AE映射、缺失值处理和数据去重4个条目;(3)数据挖掘算法(DMA), 包括DMA选择、DMA公式解读和信号阈值3个条目;(4)结果解读, 包括1个条目。按照数据挖掘相关规范和技术要求, 以文献中4个维度和9个条目的报告/报告无误率作为总体质量评价指标, 报告/报告无误率≥60%为总体质量达到优良水平。结果共纳入165篇文献。背景数据维度采用了全数据库所有其他药物数据的文献报告/报告无误率为35.2%(58/165), 未达到优良水平。数据预处理维度中进行了药物映射、AE映射、缺失值处理和数据去重的文献报告/报告无误率分别为22.4%(37/165)、73.9%(122/165)、10.3%(17/165)和55.2%(91/165), 该维度的报告/报告无误率为40.5%(267/660), 未达到优良水平, 仅其中的AE映射条目达到优良水平。DMA维度中≥2种DMA、DMA公式解读和信号阈值的文献报告/报告无误率分别为63.6%(105/165)、78.2%(129/165)和87.9%(145/165), 该维度的报告/报告无误率为76.6%(379/495), 均达到优良水平。结果解读的报告/报告无误率为87.4%(144/165), 达到优良水平, 其中7篇将信号解读为"阳性"或"阴性"信号, 14篇对信号意义的解释采用了因果关系的描述。165篇文献的4个维度共9个条目的总体报告/报告无误率为57.1%(848/1 485), 未达到优良水平。结论国内ADR/AE信号检测研究的文献中主要问题为背景数据的选择和数据预处理不足, 提示我国相关研究应在这2个维度方面改进, 提高ADR/AE信号检测研究的质量。