基于迁移学习与强化学习的自动音频标注系统

陈耕耘; 李圣辰; 邵曦<sup>*</sup>; 梅昕浩; 刘徐博; 黄秋实; 王文武

doi:10.15943/j.cnki.fdxb-jns.20221017.005

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于迁移学习与强化学习的自动音频标注系统

作者：陈耕耘; 李圣辰; 邵曦^*; 梅昕浩; 刘徐博; 黄秋实; 王文武

来源：复旦学报(自然科学版), 2022, 61(05): 520-526.

DOI：10.15943/j.cnki.fdxb-jns.20221017.005

摘要

自动音频标注是让计算机为一段音频自动生成标注语句来对该片段进行描述的任务。针对当前音频标注模型不够有效，且模型训练目标与评价指标得分之间不一致的问题，本文提出了一种基于CNN-Transformer的编码器-解码器结构，并采用强化学习进行微调的方法，同时采用了迁移学习为编码器提供一个预训练网络来初始化参数。在Clotho数据集上的实验结果表明，与基线系统相比，该方法能够提升模型的有效性，而通过强化学习对模型进行微调同样大幅提高了优化对象指标的得分。

单位
南京邮电大学; 西交利物浦大学; 通信与信息工程学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 15:15

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号