摘要
文章将离散观测数据通过基函数转化为函数,然后针对不同场合选用合适的距离度量函数差异,从而将函数型数据聚类问题转化为多元数据聚类问题,拓宽了数据分析类型。结果显示:正交基展开系数的欧氏距离等价于利用函数取值直接定义的欧氏距离;X-D方法稳健、正确率高,但是涉及大量积分运算与存储距离矩阵,适合样本量较小场合,通过基展开可在一定程度上简化运算;主成分聚类方法可以简化数据结构,在一定程度上处理多重共线性,当它与k-means方法结合时,可处理较大样本数据;分步聚类方法可得到函数取值、形态都接近的类;组合聚类算法可提高聚类结果可靠性。
- 单位