基于端点检测的蒙藏维语音片段数据集

韦向峰<sup>*</sup>; 袁毅; 张全; 吐尔逊·卡得

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于端点检测的蒙藏维语音片段数据集

作者：韦向峰^*; 袁毅; 张全; 吐尔逊·卡得

来源：中国科学数据(中英文网络版), 2019, 4(04): 112-122.

摘要

在"中国少数民族地区蒙藏维言语录音2015数据集"的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语音片段756个,数据总量大小约为111 MB。通过软件自动切分和语言专家的多重审核校对得到高质量的蒙藏维多语种的语音片段数据,可应用于少数民族的语音识别、端点检测、语音增强、语音合成和语言教学等领域。

单位
中国科学院声学研究所; 新疆财经大学

收藏分享被引浏览

更新时间：2024-04-10 01:41

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号