分析了现有解决大数据集全比较问题的数据分发相关研究成果存在的问题和混合整数线性规划模型在优化问题中的应用,在此基础上构建了一种分布式系统下数据文件分发策略模型并进行了数据文件分发算法设计,基于大数据平台框架和数据分发算法建立了一个分布式数据文件分发平台.实验结果表明:本文提出的数据分发策略模型和算法具有数据完全本地化、计算负载均衡和存储占用少等优点.