摘要
本发明公开了一种用于实时监控的音频聚类方法,包括步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。
- 单位