主要研究科技期刊及论文的版面分析方法,通过版面分析,将文档版面进行分割及分类,划分出文本和图像区域,有利于进一步的研究。在文档分割阶段,通过对文档横纵方向的投影,对文档进行分割,将分割的阈值自适应化。文档分类阶段,结合击中击不中原理以及模式统计方面的思想,同样采用自适应阈值设定方法,对划分后的子区域块内容进行分类。通过实验对比,该算法准确率较高。