摘要

使用计算机帮助人们练习口语是常见手段,但目前存在一些问题。首先,由于流畅性特征是基于人类知识计算的,因此原始数据中包含的一些关键表示可能会丢失。其次,对模型的各个参数分别进行优化,使模型的性能处于次优状态。为了解决这些问题,在此提出了一种基于卷积神经网络的英语口语流利性评分方法,该方法从原始的时域信号输入中联合学习特征提取和评分模型。实验结果表明,所提出的方法的评分结果较为准确。