摘要
随着电网结构日渐复杂,电网新设备启动愈来愈多,依赖电网运行人员手工编制启动方案无法满足电网智能管理需求。基于大量历史电网新设备启动方案数据,智能编制电网新设备启动方案成为研究的重点。但电网历史新设备启动方案为非结构化数据,无法直接利用。为将非结构化数据转化为结构化数据、提高命名实体识别准确率,文章提出多分类BiLSTM-CRF模型,通过word2vec将编码启动方案利用余弦相似度生成相似度矩阵,将启动方案按相似度分类,利用Bi LSTM-CRF训练多个模型,最后标注出识别结果,将非结构化数据转化为结构化数据。通过小规模数据集验证,结果表明,文章所提算法在准确率、训练时间、F1值上均取得较好结果,能够准确将历史电网新设备启动方案转化为结构化数据,给研究人员提供数据基础。
-
单位合肥工业大学; 国网安徽省电力有限公司; 国网安徽省电力有限公司淮北供电公司; 国网山东省电力公司荣成市供电公司