摘要
深度伪造技术作为人脸窜改技术的一种,由它合成的换脸视频已经对隐私安全带来了巨大的隐患。现存的深度伪造检测方法通常基于传统的卷积神经网络提取合成视频中空间域的不连续信息,以判断是否为深度伪造视频。随着深度伪造技术的迭代,传统检测方法精度难以取得显著提升。与传统方法不同,文本将合成视频帧进行离散余弦变换,获得视频帧图像的频域表示,使用残差卷积网络学习频域特征,并通过双向LSTM提取帧间不连续信息,从而检测视频帧是否伪造。此外,针对深度伪造数据提出了一种新的数据增强方法Xray-blur,降低换脸视频的空间域不连续性,从而提升训练难度,加强模型对不连续信息的捕获能力。实验表明,该方法在公开数据集Celeb-DF和FaceForensics++上取得了优秀的准确率(ACC)和ROC曲线下面积(AUC),且在面对低质量视频时,具有更好的鲁棒性。
- 单位