摘要
人体实例分割是以人为中心的场景理解和识别的核心问题。然而人体实例体型的差异性、人们之间的互动等导致了空间关系的复杂性,给分割任务带来了极大的挑战。目前主流的实例分割方法大都严重依赖物体的边界框检测,因此通常无法很好地将两个高度重合的对象分开。利用已经具有完备数据标注的人体骨骼特征为人体实例分割任务提供先验知识,提出了一种双流的网络结构,用来分别提取骨骼特征和图片上下文特征。接着,特征融合模块(FFB)自适应地融合来自不同流的特征并将其送入分割模块,得到最终的分割结果。实验结果表明,所提算法在COCOPersons、OCHuman数据集上的平均精确度分别为59.5%、56.7%,相比其他算法均有一定的提升。
- 单位