一种用于实时监控的音频聚类方法

贺前华; 吴志敏

摘要

本发明公开了一种用于实时监控的音频聚类方法,包括步骤：(1)音频数据预处理分段：利用基频值特点把基频值不同的时间上相邻的两个音频段分离开；(2)基于特征点对齐的分段快速计算音频距离：对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离；(3)利用连通距离提高聚类的类内纯净度：对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。

单位
华南理工大学

收藏分享被引浏览

更新时间：2025-02-26 23:34

一种用于实时监控的音频聚类方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友