跳转至

Joint Training of a Convolutional Network and a Graphical Model for Human Pose Estimation

论文

https://arxiv.org/abs/1406.2984

摘要

Cite

本文提出了一种新的混合架构,它由深度卷积网络和马尔可夫随机场组成。我们展示了该架构如何成功地应用于单眼图像中的关节式人体姿态估计这一具有挑战性的问题。 该体系结构可以利用结构域约束,例如身体关节位置之间的几何关系。我们表明,这两种模型范式的联合训练提高了性能,并使我们能够显著优于现有的最先进技术

早期关键点检测工作

方法


总结

Cite

我们已经表明,在人体姿势识别任务中,将新型ConvNet部分检测器和MRF启发的空间模型统一到单个学习框架中显著优于现有架构。 我们的体系结构的训练和推理使用商品级硬件,以接近实时帧速率运行,使该技术适用于各种应用领域。对于未来的工作, 我们希望通过增加我们的简单空间模型的复杂性和表现力(特别是对于像LSP这样的无约束数据集)来进一步改进这些结果

评论