摘要

文章提出融合知识的多模态文本分类方法,识别电影场景在情节发展过程中扮演的角色。本方法主要包括三部分:1)文本序列编码,采用BiLSTM模型获取场景文本的上下文编码信息。2)图建模,视每一个场景为节点,通过计算融合知识的多模态节点表征间的相似度,定义边的权重。3)图卷积层,整合序列嵌入表示和图节点嵌入表示,生成最终的场景节点嵌入表示。实验表明,本方法能够胜任场景角色分类任务,证明了知识嵌入能够提升分类评价指标,并且通过消融实验验证了不同特征组合对分类结果的影响。

全文