摘要
人体姿态估计是行为感知领域中一个重要的环节,也是民用飞机驾驶舱智能交互方式的一项关键技术。为建立民用飞机驾驶舱复杂光照环境与飞行员姿态估计模型性能的可解释联系,提出基于视觉Transformer飞行员姿态估计模型ViTPPose,模型在CNN主干网络末端使用包含多层编码层的双支路Transformer模块,编码层联合Transformer 与空洞卷积,在增大感受野的同时捕捉后期高阶特征的全局相关性。基于飞行机组标准操作程序,建立飞行模拟场景下的飞行员操纵行为关键点检测数据集,ViTPPose在此数据集上完成飞行员坐姿估计,并通过与基准模型对比,验证其有效性。在驾驶舱复杂光照的背景下,构建坐姿估计热图,分析模型对光照强度偏好,测试模型在不同光照等级下的性能,揭示模型对不同光照强度的依赖关系。
- 单位