基于构件理解的文档格式优化方法

作者:王娟; 李宁*; 郝海利
来源:北京信息科技大学学报(自然科学版), 2020, 35(05): 14-19.
DOI:10.16508/j.cnki.11-5866/n.2020.05.004

摘要

针对文档纠错方法的不足,提出了一种统计与规则相结合的文档构件查错纠错方法。针对文档构件不同的错误情况,采取不同的查错纠错方法:对于文档局部构件的结构错误采用Schema有效性验证与统计相结合的方法处理;对于文档列表、标题、公式等构件的编号内容采用规则的方法处理。实验表明,该方法有较好的纠错效果。