跳转至

Fully Convolutional Networks for Semantic Segmentation

论文

https://arxiv.org/abs/1411.4038

摘要

Cite

卷积网络是产生特征层次结构的强大视觉模型。我们表明,卷积网络本身,经过端到端、像素到像素的训练,超过了语义分割的最先进水平。 我们的关键见解是构建“完全卷积”网络,该网络接受任意大小的输入,并通过有效的推理和学习产生相应大小的输出。我们定义并详细描述了完全卷积网络的空间, 解释了它们在空间密集预测任务中的应用,并将其与先前模型联系起来。我们将当代分类网络(AlexNet、VGG网络和GoogLeNet)改编为完全卷积网络, 并通过微调将其学习的表示转移到分割任务中。然后,我们定义了一种新的架构,该架构将来自深层、粗糙层的语义信息与来自浅层、精细层的外观信息相结合, 以产生准确和详细的分割。我们的全卷积网络实现了PASCAL VOC(2012年平均IU为62.2%,相对提高了20%)、NYUDv2和SIFT Flow的最先进分割, 而典型图像的推断时间不到五分之一秒

第一篇做像素级分割任务的工作

工作

总结

Cite

全卷积网络是一类丰富的模型,现代分类网络就是其中的一个特例。认识到这一点,将这些分类网络扩展到分割,并通过多分辨率层组合改进体系结构, 极大地提高了最先进水平,同时简化和加快了学习和推理

评论