摘要
网络模因的分类问题因其独特的研究价值和意义,已成为一个重要的多模态研究任务。在实际应用中,判断网络中的图片是否为网络模因图片是后续网络模因各种分类任务重要的前置任务。该文以中文文本为语言背景,构建了一个包含20 000张模因或非模因图片的网络图片数据集。在此基础上,分别使用多种单模态和多模态的方法对该数据集进行分类实验,其中基于TextRCNN+ResNet50网络的决策级融合方法的F1分数达到了0.96。实验充分验证了深度学习方法特别是决策级融合的多模态方法能够有效地对中文语言环境的网络图片进行模因和非模因的分类,也为网络模因各种后续任务的研究提供了有力的支撑。
- 单位