摘要
为进一步提升由单图像进行三维重建的精度,通过对Pix2Vox网络进行改进,提出一种基于深度学习的方法实现单图像三维重建的神经网络.首先,在Pix2Vox网络结构中增加多尺度连接和通道注意力机制,以保留多尺度信息,强化重点特征学习;其次,提出一个阈值计算模块,实现了适应不同类别的阈值设定方法,优化阈值取值;最后,提出一种融合型损失函数,融合模型的结构损失和类别损失,减小不平衡数据与类间差异对重建效果的影响.实验结果表明,该网络在公共数据集ShapeNet的13种模型类别上,平均IoU指标达到0.670,比Pix2Vox等网络取得了更好的单图像三维重建效果.
- 单位