摘要

本发明公开了一种基于多感受野深度特征的文本检测方法、系统、设备及介质,所述方法包括:获取文本检测数据库,将其作为网络训练数据库;搭建多感受野深度网络模型;将网络训练数据库中的自然场景文本图片和相应的文本框坐标真值数据输入多感受野深度网络模型进行训练;通过已训练的多感受野深度网络模型计算出分割用的图像掩码,得到分割结果,将分割区域转化为回归的文本框坐标;统计网络训练数据库的文本框尺寸,设计文本框过滤条件,根据文本框过滤条件,筛选出目标文本框。本发明充分利用深度网络模型的特征学习能力和分类性能,结合了图像分割的特点,具有检测准确率高、召回率高、鲁棒性强等特点,具有较好的自然场景下文本检测效果。