基于字节流信息熵的版面全局复杂度的评估方法

作者:王琪; 崔荣一*
来源:延边大学学报(自然科学版), 2019, 45(02): 136-140.
DOI:10.16379/j.cnki.issn.1004-4353.2019.02.008

摘要

以图文要素构成的word 2003版面存储文档为研究对象,提出了一种利用信息熵评估版面文档复杂度的方法.首先,从图像和文本存储特点出发,提出一种利用文件字节流信息熵度量版面全局复杂度的方案;其次,将文件视为信源,每个字节视为信源符号,以二进制方式读取文件,然后根据字节相关性,采用N次扩展信源计算信息熵;最后,通过实验验证表明,本文方法切实可行,给出的版面全局复杂度定量描述不仅能很好地符合人的视觉直观感受,而且能够为版面数据可压缩性提供依据.

全文