摘要

传统视频编码与压缩方法难以有效去除视频数据中的大量冗余信息,降低了传输效率。对此,提出了一种面向语义通信的三维(3D)骨骼点数据信源编码与压缩方法(DMDCT)。针对骨骼点数据中的冗余问题,提出了多尺度骨骼点表示方法,自适应地描述参与每个不同动作语义骨骼点运动状态的同时保留人体骨骼语义架构;引入离散余弦变换(DCT)从频域层面分离多尺度骨骼点表示的低频分量和高频分量,进一步减少了整体数据量。区别于传统通信传输原始视频数据的方式,结合语义通信只传输与高层任务相关的骨骼点数据,提高了数据传输效率。在公开数据集NTU RGB+D上以动作识别为例的实验结果表明,DMDCT在同等压缩率的top1准确率比同类算法提高了约5%,且在仅保留10%的DCT系数时仍可达到74.2%的准确率,而数据量仅为原始数据量的6%。

全文