摘要
针对涉案新闻句中由成分指代引起的语义模糊导致要素实体识别率低的问题,提出一种融入新闻中心句的要素实体识别方法。首先,采用改进的多头注意力将新闻中心句融入新闻正文句中。其次,通过双向长短期记忆网络(Bidirectional Long Short-Term Memory,Bi-LSTM)获取融入新闻中心句后的全局语义。最后,采用条件随机场(Conditional Random Fields,CRF)预测序列标签。实验结果表明,融入新闻中心句的要素实体识别方法可有效增强新闻正文句的语义表示,提升识别率。
- 单位