摘要
目的:初步探索正则表达式对冠脉CTA和钙化积分影像报告结构化信息提取的可行性和准确性。方法:首先由具有丰富心血管CT诊断经验的医师根据冠状动脉疾病报告与数据系统(CAD-RADS)专家共识确定需提取的特征标签和特征值。然后随机抽取我科2019年8月后使用CAD-RADS系统规范化的100份冠脉CTA及钙化积分报告作为训练集,通过遍历训练集报告的结构和特点,总结与特征值对应的特征条件,并利用特征条件和正则表达式制定分析方案。最后分别抽取200份经CAD-RADS系统规范化的报告及200份未经CAD-RADS系统规范化的报告作为验证集1和验证集2,利用上述分析方案对验证集1和验证集2进行结构化信息提取,并以同时期由心血管诊断医师人工结构化的报告为金标准,评价分析方案的效果和可移植性。结果:验证集1中,斑块类型的召回率和准确率较低,分别为86.0%和88.3%,其余指标的召回率和准确率均达到95%以上。验证集2除支架检查外,其余指标的召回率均低于验证集1,回旋支钙化积分以及壁冠状动脉的召回率在40%左右,但准确性仍保持在较高水平,为83.9%~100.0%。结论:利用正则表达式对经CAD-RADS规范化的冠脉CTA及钙化积分影像报告进行结构化信息提取是可行的,可以快速、有效地提取到遵循CAD-RADS系统报告的结构化信息,且成本低,但其可移植性具有一定的限制。
-
单位华中科技大学同济医学院附属协和医院