摘要

传统的音乐转录研究中还没有能够在一个音符的时值上给出一个完整的估计,采用一种特殊的网络结构面积与卷积循环神经网络的端到端识别可以有效地解决这个问题。实验表明,采用该方法比传统的转录方法在两个数据集上的准确率分别提高了40.33%和30.89%。