摘要

针对现有方法在文本分类任务中没有综合考虑文本的层级结构和标签对于文本特征学习的重要性而导致的鲁棒性不足、表达能力不足等问题,提出了一种基于双曲图注意力网络的短文本分类算法L-HGAT。首先利用文本的复杂层级结构与双曲空间的树相似性特征的契合性,将文本嵌入到具有负常数曲率的双曲空间中,充分利用双曲流行表征的强大表达能力。然后设计双曲图注意力网络,融合节点特征与边特征,增强对文本中关键局部信息的聚合能力。最后使用基于双曲空间中的测地线距离的标签文本交互函数进一步引导文本特征学习,以此提升文本分类精度。实验结果表明,与基准模型相比,所提方法在基准数据集上显著优于现有研究方法,能够有效地提升模型性能,更好地完成文本分类任务。