摘要
讽刺是社会媒体中常用的修辞手法,在一些社交平台上(Twitter、Reddit)普遍存在,用比喻、夸张等方式对人或事进行否定、批评或嘲笑。讽刺检测任务对于理解人们实际的情感和信念至关重要。针对拥有会话上下文的目标文本进行讽刺检测,本文提出了一种基于RoBERTa的社交媒体会话中的讽刺检测模型。该模型主要由两个部分构成:(1)前者是特征抽取层,采用更加鲁棒的迁移学习模型RoBERTa,对会话上下文文本和目标文本分别进行特征的学习;(2)后者是特征融合层,由于目标文本是对会话上下文的回复,考虑到单纯的级联并不能很好的学习两者之间的对话关系,采用了改进版的Attention-over-Attention(AOA)注意力模型,使得目标文本可以关注到会话上下文中重要的信息。最后,在公开的Twitter和Reddit两个数据集上进行了实验,验证了模型的有效性,还分析了对于目标文本的讽刺检测,有无会话上下文以及会话上下文数量的多少对模型性能的影响。
- 单位