摘要
为有效建立网络输入语音特征序列与输出音素间的良性映射关系,提出一种基于DNNHMM理论的多媒体网络语音模糊音调数据准确识别方法。利用多媒体网络阵列的拓扑结构,满足模糊语音音调的特征提取要求,并对音调数据进行解码操作,完成多媒体网络语音模糊音调数据的识别准备。在此基础上,设计完整的DNN-HMM识别框架,并通过估计语音模糊音调数据DNNHMM空间权重的方式,实现数据识别决策树绑定操作,完成新型多媒体网络语音模糊音调数据准确识别方法的搭建。设计对比实验结果表明,与传统识别方法相比,应用新型准确识别方法后,输入语音数据循环单元最大值超过7.0×1011T、输出音素堆叠层数不断减小,达到建立输入语音特征序列与输出音素间良性映射关系的目的。
- 单位