摘要
为解决因城镇燃气事故调查报告标注样本缺乏,从而影响命名实体识别性能这一问题,提出基于BiLSTM-CRF+强化学习的燃气事故领域命名实体识别方法。首先在数据预处理阶段,采用基于文本结构的主旨段落抽取方法,识别事故调查报告的关键段落;其次在模型训练阶段,采用BiLSTM-CRF+强化学习模型,实现城镇燃气事故命名实体识别模型训练;最后利用城镇燃气事故调查报告作为试验数据进行验证。研究结果表明:经由强化学习模型降噪后,实体识别模型的综合评价指标提高5.76%,主旨段落识别方法相比Word2vec特征表示方法,使模型的综合评价指标提升7.17%。
-
单位中国石油大学(华东); 机电工程学院