摘要

电力设备缺陷文本包含大量设备缺陷历史信息,从文本中精确辨识缺陷信息,可提供对于设备的故障率建模和健康状态评价问题的有效指导。引入依存句法分析技术,提出"左贪心"出栈规则和基于神经网络的依存关系状态转移分析模型,实现了电力设备实际缺陷文本和缺陷分类标准文本的依存句法树构建,并结合缺陷文本特点提出了电力设备依存句法树的剪枝、切分和重构方法。同时,提出了基于依存关系的树匹配算法,实现实际缺陷和标准缺陷依存句法树的匹配。以主变压器缺陷文本为例,研究了基于依存句法分析的缺陷信息辨识方法的可行性和有效性。结果表明,所提方法相比于其他树匹配算法和语义相似度计算方法在效率和准确性上有明显提升。