摘要
在智能穿戴设备普及的背景下,运动手环为全面地了解人们的身体状况提供了丰富的信息源,但是,其提供的多维活动数据存在未知的异常值,因此需要进行异常值的检测。由于“维度灾难”,通过传统的方法进行密度估计十分困难,导致检测效果不佳。针对该问题,使用了一种高斯混合生成模型(Gaussian Mixture Generative Model, GMGM)健康数据检测方法。该模型利用变分自编码器(Variational Autoencoder, VAE)训练原始数据并且通过降低重构误差提取潜在特征;然后,利用深度信念网络(Deep Brief Network, DBN),通过潜在分布和提取的特征来预测样本的混合成员隶属度。接着,变分自编码器、深度信念网络与高斯混合模型共同优化,避免了模型解耦的影响。高斯混合模型(Gaussian Mixture Model, GMM)预测得到每个数据的样本密度,将密度高于训练阶段阈值的样本视为异常。在ODDS标准数据集上验证模型的性能,结果表明,相较于DAGMM算法,GMGM的AUC指标平均提升了5.5%。最后,在真实数据集上的实验结果也表明了该方法的有效性。
- 单位