摘要
针对中文漫画图像的特点,提出一种无监督的中文漫画图像对白自动定位方法,以满足中文漫画移动阅读的需求。不同于现有基于学习的方法,该方法不需要训练集,且具有较强的鲁棒性,主要包括3个步骤:1)利用包围漫画图像文字的空白区域(气泡)的连通性进行气泡检测,并在气泡中检测完整字符对;2)基于字符形状与字符排版规则的一致性,聚类形成字符行或字符列,并提取字体特征;3)联合多页漫画图像字体特征,利用贝叶斯分类器检测多页漫画中的剩余字符。在包含900页漫画图像的数据集上进行实验,结果表明,该方法可以有效定位中文漫画图像中的对白区域,取得比较满意的实验结果。
-
单位北京大学王选计算机研究所