摘要
文本分类作为自然语言处理领域的核心内容,已经成为文本处理的重点研究问题。该文主要针对社会上出现的大规模常见疾病进行预测。该文通过获取全球各大新闻媒体报道的新闻文本,分别统计新闻文本中出现次数排名前十的疾病,分析原始数据分布的特征。该文将基于CNN和LSTM网络的文本模型与基于LSTM网络的疾病趋势模型进行融合,综合分析文本中新闻文本的文本信息和疾病的时间序列,并使用了一种特殊的疾病选择策略。实验结果表明,该策略在7种不同的新闻数据集上获得了70%以上的准确度。该文提出的融合策略和疾病选择策略对疾病的趋势预测具有一定的意义,有助于提高疾病趋势预测的准确性。
-
单位吉林大学; 长春财经学院