基于音频驱动的遮挡下人脸表情重建技术

作者:王航宇; 李晓冬; 李新德
来源:指挥信息系统与技术, 2022, 13(06): 89-94.
DOI:10.15908/j.cnki.cist.2022.06.014

摘要

网络舆情对政治生活秩序和社会稳定的影响与日俱增,还原网络视频中刻意遮挡的人脸,有助于网络舆情管控以及掌握网络舆情攻防战的主动权。结合生成对抗网络,提出了一种基于音频驱动的遮挡下人脸表情重建方法。首先,通过音频解耦器实现音频内容与情绪分离;然后,基于双阶段遮挡下人眼关键点检测网络对头部姿态进行估计,得到头部3维姿态编码;最后,基于生成对抗网络,对生成人脸的说话口型、面部表情和头部姿态进行综合控制,实现对说话人脸的生动还原。试验结果表明,该方法可准确有效地还原人脸表情和头部姿态。

全文