摘要
针对老挝语军事领域命名实体识别存在的规则制定不准确、覆盖不全等问题,提出一种融合条件随机场与规则的识别方法。通过分析老挝语语言和领域文本特点,选取词、词性、通名、指界词和词典等原子特征构建组合特征模板,在自建标注语料上训练条件随机场模型,并利用测试语料进行测试。为识别错例,加入能够表达语言确定性的规则进行后处理,以提升识别性能。实验结果表明,该方法总体准确率、召回率和F测度值分别达到91.49%、90.96%和91.22%,可有效提高老挝语军事领域命名实体识别效果。
-
单位昆明理工大学; 自动化学院; 中国人民解放军战略支援部队信息工程大学