摘要

传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安全和用户个人隐私问题.为了解决以上问题,提出一种面向隐私保护的相似PDF文件外包自动合并方法.该方法根据PDF文件的结构特点并利用相似哈希函数提取文件特征信息,然后通过计算汉明距离来快速判断PDF文件间的相似度,继而引入秘密分享技术实现相似PDF文件的安全外包自动合并.实验结果表明,所提出的方法能够实现相似PDF文件合并,并确保外包待合并数据的安全性.