基于学习主动中心轮廓模型的场景文本检测

谢斌红; 秦耀龙; 张英俊

doi:10.19678/j.issn.1000-3428.0060828

摘要

在场景文本检测领域，存在由于文本尺寸波动较大导致的小文本漏检、大文本欠检测和多尺度文本边界检测错误的情况。针对上述问题，提出一种基于学习主动中心轮廓模型的场景文本检测网络。在残差网络ResNet的基础上构建多尺度特征权重融合模型，对输入的场景文本图片进行多尺度特征提取和权重融合，并计算出最终的特征融合图，适应场景文本长宽比变化较大的情况。在此基础上，将融合后的特征图输入到学习主动中心轮廓模型预测文本框的中心点和边界，该模型为场景文本检测提供丰富先验知识，以解决多尺度文本检测框包含过多背景或部分包围文本造成的边界检测错误问题。在MSRA-TD500、IC13、IC15和IC17MLT数据集上的实验结果表明，该网络能够提高多尺度场景文本检测的准确率，其中在MSRA-TD50数据集上F-measure为0.83，相较于MSR方法提升1%，在IC13数据集上F-measure为0.91，相较于PixelLink网络提升2%，在IC15数据集上F-measure值为0.87，相较于PSENet网络提升1%，在IC17MLT数据集上F-measure值为0.74，相较于TridentNet网络提升1%。

单位
太原科技大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 10:39

基于学习主动中心轮廓模型的场景文本检测

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友