摘要
青铜器铭文图像有效特征的提取是进行铭文识别的关键步骤,针对以图像为信息载体的铭文特征提取方法由于特征维度高、特征向量复杂而识别准确度低的问题,提出了一种基于拓扑与网格双特征的铭文图形集成学习识别方法。以图形为铭文特征的表征,所提方法提取拓扑特征和7维文字结构图形特征,有效描述了铭文文字的结构信息。在此基础上,所提方法利用降维后铭文全局结构信息和局部结构信息的8维4方向弹性网格特征,解决了提取铭文图像特征导致的特征向量维度高的问题。最后,以拓扑特征和弹性网格特征作为集成学习样本的特征向量,利用Bagging方法对特征向量敏感程度不同的机器学习分类器进行集成,提升模型训练效率、提高识别精度。实验结果表明,与图像特征提取方法相比,所提方法对铭文识别准确率提高了15.54个百分点,并且铭文特征向量维度及运行时间大幅度降低。
- 单位