摘要

多示例学习为语音内容分类提供了一种新思路。提出将语音内容分类任务转化为多示例学习问题,首先通过音素识别器将语音转化为音素序列,其次对音素序列进行tri-phone建模并分割成多个片段,然后对片段进行特征提取,最后使用基于支持向量机和卷积神经网络的多示例学习算法对语音内容进行分类。在真实数据集上的实验结果显示,相比于非多示例学习方法,多示例学习技术的引入使平均准确率和F1值得到明显提升。

  • 单位
    信息工程大学