摘要

本发明公开了一种针对MapReduce计算的数据保密方法及系统,包括:在MapReduce的标准reduce阶段reduce2前添加另一reduce阶段reduce1;在map阶段的函数中写入随机分配函数将map阶段每个map任务中的数据平均发送给reduce1阶段的每个reduce任务;将reduce1阶段每个reduce任务合并的键值对数据分别发送给reduce2阶段的每个reduce任务,或者,在键值对数据中添加假键值对数据后分别发送;对数据进行处理,丢弃不属于reduce1阶段各个reduce任务合并的键值对数据。本发明实现了云计算平台中MapReduce作业数据的机密性保护。