摘要
针对高维数据存在数据簇易受外界环境干扰,出现大量异常簇,且对高维数据异常簇挖掘效率低、误差大等问题,本文以局部敏感哈希的高维数据异常簇为基础提出对其进行智能挖掘的方法。分析局部敏感哈希算法,对高维数据异常簇相似性进行度量,并引入相关的向量空间模型,实现对高维数据异常簇的智能挖掘。实验结果表明,采用本文挖掘方法相比传统的机器学习法和加权快速聚类法,其挖掘数据的准确率、召回率均大幅提高,因此该算法具有一定的实用性。
- 单位
针对高维数据存在数据簇易受外界环境干扰,出现大量异常簇,且对高维数据异常簇挖掘效率低、误差大等问题,本文以局部敏感哈希的高维数据异常簇为基础提出对其进行智能挖掘的方法。分析局部敏感哈希算法,对高维数据异常簇相似性进行度量,并引入相关的向量空间模型,实现对高维数据异常簇的智能挖掘。实验结果表明,采用本文挖掘方法相比传统的机器学习法和加权快速聚类法,其挖掘数据的准确率、召回率均大幅提高,因此该算法具有一定的实用性。