摘要
针对当前可搜索加密方案采用词频逆文档频率模型,忽略用户关键词和文档之间存在隐含语义特征的问题,提出一种基于潜在狄利克雷分配主题模型的模糊关键词排序可搜索加密方案。该方案通过主题模型获取关键词和文档之间的隐含语义特征,对关键词进行对偶编码,基于局部敏感哈希函数和布隆过滤器完成模糊关键词对一级主题索引的确认,并根据二级倒排索引返回排序搜索结果,在减小索引规模的同时将文档与搜索关键词进行分离,增强了文档与搜索关键词的安全性。在支持关键词模糊搜索的同时无需预先定义关键词词典,搜索时仅需在确认主题时进行一轮计算。实验结果表明,该方案比传统方案具备更高的语义准确率和搜索效率,并支持对关键词的模糊搜索。