摘要
为了普及国粹京剧,本研究提出一种将随机森林(Random Forest, RF)耦合注意力(Attention)机制和双向长短时记忆(BiLSTM)网络的音乐分类方法RF-BiLSTM-Attention,使用其进行京剧与其他类型音乐的二分类(以下简称“京剧二分类”)。首先,提取音乐所有光谱特征,利用RF选择重要特征;然后,在BiLSTM网络的隐藏层与输出层之间嵌入注意力层,对数据进行分类训练与预测。用来自大众音乐平台和GTZAN数据集的1 500首音乐进行京剧二分类实验,对比RF对循环神经网络(RNN)、长短时记忆(LSTM)网络、BiLSTM等9种模型的影响,结果表明:RF-BiLSTM-Attention模型的分类准确率为89.00%,运行时间为33.22 s,比简单模型中表现最好的RF-BiLSTM模型的分类准确率提高3.33%,运行时间缩短40.54%;比原始BiLSTM-Attention模型的分类准确率提高6.33%,运行时间缩短96.89%。与传统音频分类工作相比,本研究考虑了京剧二分类问题,对京剧起着良好的推广作用。
- 单位