摘要

针对现有深度聚类方法不考虑事件信息及其结构特点而难以有效划分事件类型的问题,提出基于事件表示和对比学习的深度事件聚类方法(DEC_ERCL)。首先,该方法利用信息识别手段从非结构化文本中识别出结构化的事件信息,避免了冗余信息对事件语义的影响;其次,将事件的结构信息集成到自编码器中学习低维稠密的事件表示,并以此作为下游聚类划分的依据;最后,为有效建模事件之间的细微差异,在特征学习过程中加入多正例对比损失。在数据集DuEE、FewFC、Military和ACE2005上的实验结果表明,所提方法相较于其他深度聚类方法在准确率和标准化互信息评价指标上均具有更好的表现,相较于次优的IDEC,DEC_ERCL的聚类准确率分别提升了21.34%、26.46%、7.36%、39.97%,表明了DEC_ERCL具有更好的事件聚类效果。