摘要

为了更加智能化从服务事件中提取结构化信息,通过研究事件中信息的特性,我们提出了通用实体识别技术(Universal Named Entity Recognition,UNER)。首先,对数据进行清洗和无监督的自动标注,并进行了扩充,大大降低了人工标注的成本。接下来,设计了一种基于深度自注意力变换神经网络(transformer)和条件随机场(Conditional Random Fields,CRFs)的命名实体识别模型。对比之前系统的机器学习模型和大部分NER模型,实验表明,UNER具有0.96的高精度,能够极大缩短运维周期。