摘要

目的 应用LDA模型及其变形对PUBMED数据库中埃博拉病毒相关文献摘要进行主题识别并分类,了解埃博拉病毒研究文献的领域分布及发展趋势。方法 以PUBMED数据库中含有摘要信息的文献为数据源,使用Python、Endnote 20.1.0等工具,借助LDA模型及其变形对文献进行主题识别与演化分析。结果 应用LDA模型识别出监测预警、感染机制、影响因素、检测诊断、临床治疗、疫苗及致病机制7类主题;得到检测诊断、感染机制及疫苗研发领域主题词随时间发展频率变化。结论 疫情是埃博拉病毒研究的主要驱动力,疫情发生后本领域发文量迅速上升并在疫情消失后回归,预测未来发文量将随着疫情再暴发继续上升;预计未来研究将主要围绕疫情防控以及临床转化开展,而基础研究仍具有巨大发展空间。