摘要
为提升音乐情感鉴赏分类精度,提出基于多模态深度学习的音乐情感鉴赏分类方法。在分析音乐情感特征参数类别的基础上,采用相位残差算法提取音乐中的梅尔频率倒谱系数、基音频率、共振峰和频带能量分布4种音乐情感多模态特征后,输入注意力网络模块,由此获取多模态特征中的隐藏信息;由多模态融合模块融合多模态特征,形成全局综合特征;利用分类器对融合后的特征进行拼接并输出分类结果。测试结果显示:该方法梅尔频率倒谱系数特征能量的分布范围在0 Hz~8225 Hz之间;基音频率特征结果变化范围在80.45 Hz~505.9 Hz之间,每种类别分类的正确概率均在0.988以上。证明所提方法能够有效完成音乐情感多模态特征提取。
-
单位阜阳师范大学