摘要

在日常的临床诊断中,医生常常根据入院病人的异常表型症状进行诊断,这种方式需要医生具备足够的经验才能完成。人工智能的出现使临床诊断出现的新的思路,只要获得足够的训练样本及正确的知识库,就可以帮助医生进行辅助诊断。人类表型本体可以将临床数据转化为结构化的表示形式,并以系统的方式组织管理这些数据。通过使用这些结构化的表型数据,我们可以使用不同的算法辅助诊断罕见疾病和先天性遗传疾病。基于表型的罕见病辅助诊断需要根据表型数据的语义相似度进行打分,将表型集合和疾病的相似度计算出来,将疾病根据相似度得分进行排名,从而得到预测结果的排名。本研究使用公共开源数据库HPO中的表型数据,通过使用添加相反表型的信息,提出了一个新的语义相似度算法,该算法将表型与疾病进行了信息量的量化。本研究使用了模拟数据,与其他算法进行了比较,验证了该算法预测效果。结果显示添加相反表型的算法在模拟数据集上显示了较好的效果,该算法具有合理性和优越性。

全文