本发明涉及一种基于抽样的大数据交易系统及方法,所述系统至少包括数据交易模块和至少一个终端,所述数据交易模块以启发式抽样的方式抽取与原始数据集的联合概率分布同一性的至少一个子数据集,其中,所述数据交易模块基于卡方检验来检测所述子数据集每个属性的条件概率分布,从而输出符合预设条件的子数据集。本发明基于两个评分函数,使用卡方检验保证抽取出的子数据集与原始数据集的条件概率分布无显著差异,进而保证两者的联合概率分布无显著差异。同时,可以大幅降低数据集的样本量。