摘要

本发明涉及一种基于贝叶斯网络的健康大数据抽验系统及方法,所述系统至少包括抽验模块,所述抽样模块基于卡方检验来检测从原始数据集抽取的至少一个子数据集,并且基于卡方检验结果和与其连接的终端的预设条件来向所述终端发送匹配的子数据集,其中,所述子数据集是由所述抽样模块以启发式抽样的方式从原始数据集中抽取的。本发明基于两个评分函数,使用卡方检验保证抽取出的子数据集与原始数据集的条件概率分布无显著差异,进而保证两者的联合概率分布无显著差异。同时,可以大幅降低数据集的样本量。