摘要
本发明公开一种语种识别方法及系统,其步骤为:S1:将文本行图像输入语种识别单元中,得到语种识别结果,具体包括步骤:S11:将文本行图像输入至特征提取单元进行特征提取,得到文本行图像的局部特征和全局特征,作为第一向量;S12:将第一向量输入至特征融合单元进行融合,得到文本行图像的多尺度融合特征,作为第二向量;S13:将多尺度融合特征输入自注意力单元,并对区别特征进行强化,从特征池中获得对语种识别贡献更大的图像特征,作为第三向量;S14:将第三向量输入至分类网络单元,获得语种识别结果。本发明根据文本和图像信息,预测出输入场景文本图片中的语种类别,大大提升语种识别的准确率。
- 单位