基于既有医疗数据构建研究型数据库的方法学探讨及实例解读(一):变量清单和数据库架构的确定

作者:赵国桢; 闫世艳; 郭玉红; 宋爽; 胡雅慧; 郭诗琪; 徐霄龙; 叶浩然; 朱泠霏; 杜元; 任志颖; 卢海天; 胡晶; 李博*; 刘清泉*
来源:中国中医药信息杂志, 2023, 30(08): 8-13.
DOI:10.19879/j.cnki.1005-5304.202210064

摘要

基于既有医疗数据所形成的真实世界证据对医疗卫生决策产生重要影响。真实世界数据向真实世界证据转化过程中的关键点之一在于研究型数据库的建立。由于真实世界数据库的来源、结构不同及真实世界数据的复杂性、多样化等问题,研究型数据库建设在具体实施过程中仍面临各种挑战。建立研究型数据库需先确定变量清单及数据库架构,包括确定变量清单、评估既有数据、明确数据集结构及制定变量字典4个步骤。首先确定变量清单,其重点在于准确提出临床问题并对临床问题进行解构,再根据解构结果确定研究所需的关键变量;其次评估既有数据,应重点关注既有数据的可靠性,以及关键变量的数据来源;接着选择恰当的数据集结构存储数据,通常使用横断面数据结构或纵向数据结构;最后,将数据库中每个变量的信息记录在变量字典中,以实现对众多变量的管理。以“中西医结合治疗新型冠状病毒感染研究型数据库”为例,对研究中变量清单及数据库架构的确定方法进行介绍,以供相关研究人员参考。

全文