基于数据驱动的有监督字典学习音频分类方法、系统及介质

陈真; 邱小群; 向友君; 张淘珊

摘要

本发明公开了一种基于数据驱动的有监督字典学习音频分类方法、系统及介质。该方法包括：确定样本集类别数；利用输入的样本及其对应的类标签训练特定类字典；利用已训练的字典得出输入样本的稀疏编码,并将稀疏编码作为特征,训练SVM分类器；利用已训练的字典和已训练的SVM分类器对输入样本进行分类,输出预测标签。本发明通过每个类学习一个字典来实现最小化类内均匀性,最大化类的可分性,提高稀疏性以控制信号在字典上分解的复杂性,同时最小化基于类的重构错误,并提高字典的成对正交性。本发明能够广泛应用于多个场景中,如计算听觉场景识别和音乐和弦识别；其在数据集上的测试也相对稳定,泛化能力表现优秀。

单位
华南理工大学

收藏分享被引浏览

更新时间：2025-02-27 00:57

基于数据驱动的有监督字典学习音频分类方法、系统及介质

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友