摘要
结合英文幽默语言学特征,提出基于语音、字形和语义的层次注意力神经网络模型(PFSHAN)进行幽默识别。在特征提取阶段,将幽默文本表示为音素、字符以及携带歧义性等级信息的语义形式,分别采用卷积神经网络、双向门控循环单元和注意力机制提取PFSHAN模型的语音、字形和语义特征。在特征融合阶段,针对不同单词对幽默语言学特征的贡献程度不同,且不同幽默语言学特征和语句之间关联程度不同的问题,采用层次注意力机制调整不同幽默语言学特征对于PFSHAN模型性能的影响。在Puns和Onliner数据集上的实验结果表明,PFSHAN模型的F1值分别为91.03%和91.11%,能有效提高幽默识别性能。
- 单位