基于CRF算法的航天命名实体识别

作者:徐建忠; 朱俊; 赵瑞; 张亮; 李娇娇
来源:电子设计工程, 2017, 25(20): 42-46.
DOI:10.14022/j.cnki.dzsjgc.2017.20.011

摘要

航天领域相关文本正在飞速累积,随着人类探索太空的进程快速推进,相关文本的累积速度进一步加快。人工阅读整理此类文本显得效率低下,因此,针对航天文本研究信息抽取技术实现信息自动抽取变得十分有价值,而命名实体识别技术又是自动信息抽取的基础,建立一种航天命名实体识别的高效方法具有很重要的现实意义。本文针对航天领域命名实体识别这一特定问题,通过人工构建训练数据集、特征设计和CRF模型训练,建立了一种航天命名实体识别的高效方法。通过与基于字符串匹配的方法相比较,本文所提方法有着更高的准确率和召回率,验证了本文所提方法的有效性。

  • 单位
    西昌卫星发射中心; 中国人民解放军装甲兵工程学院; 杭州世平信息科技有限公司

全文