摘要

数据中掺杂干扰数据的现象十分常见,对于随机出现的干扰数据处理,目前已有很多方法可以借鉴,但对于人为的干扰数据,若继续使用传统方法,则可能不会达到很好的效果.倾向值可以用一维数值来描述多维数据的特征,且当数据具有相近的倾向值时,其本身常常也很相似,并可能来自同一总体.因此,文章提出一种应用倾向值匹配检测干扰数据的新方法,即用最佳比例匹配来检测干扰数据.文章设计了两个算法,其一用于估计真实数据在原始数据中所占的比例,同时计算真实数据的总体均值估计;另一用于提取拟真实数据并进行建模分析.模拟研究证实了所提出的算法的有效性.