摘要

为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下不同距离的词汇间关联;其次改进图节点结构特征获取方法,从而体现节点度值差异对嵌入的影响;通过融合节点的结构特征与关系特征,增强具有相似邻居节点的同类节点之间的相似性表现;在聚类阶段设计备选节点数参数以缓解截断距离的敏感性。该方法在公开数据集和真实业务数据上进行了参数分析和性能评估,结果表明该方法可获取精准有效的故障实体节点聚类结果。

全文