摘要
近年来,深度学习方法在人体运动预测方面取得了良好的进展,目前单一阶段方法在预测的准确性和多样性上仍存在改进空间,而采用多阶段方式则导致难以端到端预测。为此,本文提出了一种基于扩散概率模型的去噪预测网络,旨在以端到端的方式去预测出准确多样的人体运动。其中提出了一个基于Transformer的模块,包含一个无softmax的修正线性自注意力,提升了人体运动预测的准确性。此外,本文还提出了一种基于DPM-Solver++的扩散模型采样策略,预测出更加连续和多样性的人体运动姿态序列,并将预测出同一质量人体运动姿态序列的采样时间缩减至一半以下。最后,将本文方法在两个标准数据集Human3.6M和HumanEva-I上进行充分评估。实验结果表明,本文方法优于最先进的单一阶段的方法。
- 单位