摘要

相似性度量在聚类算法设计中起关键作用,使用合适的距离度量函数能够反映数据对象间的相似性。本文对聚类算法中数据对象间相似性度量的特征进行了系统性归纳总结,通过MapReduce编程模型实现对各种相似性度量聚类算法的实验比较分析,将为聚类分析研究者提供参考。

  • 单位
    茅台学院