本发明提供一种基于视觉增强的文本分类方法和系统,涉及计算机视觉以及自然语言理解技术领域,本发明通过注意力机制实现了获取基于图像辅助信息的语义表示和基于文本语义的图像特征表示,充分考虑了图像信息包含的复杂内容以及图像信息和文本之间的相互影响关系,减少文本语义表达过程中的噪声信息的引入,最终实现了对文本语义的准确理解以及提高文本分类的准确性。