婴幼儿语音信息处理与识别研究模型

作者:左正东; 万光彩*; 杜佳轩
来源:山西师范大学学报(自然科学版), 2019, 33(02): 85-92.
DOI:10.16207/j.cnki.1009-4490.2019.02.017

摘要

本文针对婴儿语音的识别及处理问题,通过Mel尺度倒谱参数(MFCC)等信号分析的参数,对婴儿语音情绪信息的数据采集和预处理过程及相应的特征参数提取方法进行了研究.综合运用了Matlab、Excel、Widi及TT Composer等软件求解,经过综合比较,本文采用了参数和方法,针对辨别婴儿性别以及婴儿身心状态所表达的情绪信息作模式识别研究,并给出了其技术实现方法和实验测试结果,取得了良好的识别效果.对于一男一女唱同一首歌的音频,我们基于性别差异角度对语音信号时域进行特征分析,通过绘制语谱图、能量图、相关函数图等,观察男女声的差异,可以发现语音信号的前面部分性别差异特征,在此基础上再利用MFCC分别得到男性和女性语音的48 110*24 MFCC特征矩阵.通过贝叶斯判别法,将语音进行性别判别归类,再利用该模型对婴儿的声音进行鉴别.

全文