摘要

非Manhattan版面中,区域形状不规则及空间关系复杂使得确定合乎视觉脉络的无歧义的文字阅读顺序成为排版及版面理解过程中的一个难点。针对此问题,建立了新的版面布局模型,提出了基于图论最大匹配理论的阅读顺序确定算法。已成功运用于专业中日文排版系统,取得了满意的效果,并对更深入研究文档图像理解具有十分重要的理论和实践意义。

  • 单位
    北京大学王选计算机研究所