为提高当前场景文本识别算法在自然场景下识别不规则文本和中文文本的准确率,提出了一种基于二维(2D)CTC和注意力机制序列的自然场景文本识别模型。该模型分为编码部分和解码部分,利用二维CTC自适应地关注文本的空间位置信息,同时排除背景噪声的影响。通过在ICDAR数据集上的实验结果表明,对比CTC和Seq2Seq的模型,提高了对不规则文本和中文文本识别的准确率,同时加快了收敛速度。