摘要

对不确定数据进行异常点检测能从不确定数据集中检测出与大部分对象不同的对象。用期望语义距离度量对象之间的距离,并提出加权期望语义距离计算方法,通过属性加权充分体现属性在期望语义距离度量中的贡献度不同,从而提高异常点检测结果的应用驱动性和有效性。算法在分类数据集中进行异常点检测,可以避免通常的异常点检测方法在检测时未考虑数据库中对象之间的差异性而导致检测结果的不准确。实验结果表明,分类数据中的加权期望语义距离异常点检测方法克服了传统距离度量在异常点检测算法中的缺陷,优化了算法的性能。