跳转至

U-Net: Convolutional Networks for Biomedical Image Segmentation

论文地址

https://arxiv.org/abs/1505.04597

摘要

Cite

人们普遍认为,深度网络的成功训练需要数千个带注释的训练样本。在本文中,我们提出了一种网络和训练策略, 该策略依赖于数据增强的强大使用,以更有效地使用可用的注释样本。该体系结构由捕获上下文的收缩路径和实现精确定位的对称扩展路径组成。 我们表明,这种网络可以从很少的图像进行端到端训练,并且在电子显微镜堆栈中的神经结构分割的ISBI挑战上优于现有的 最佳方法(滑动窗口卷积网络)。使用同样的网络,我们在透射光显微镜图像(相位对比和DIC)上训练,在2015年的ISBI细胞追踪挑战赛中, 我们以大幅度获胜。此外,网络速度很快。在最近的GPU上,512x512图像的分割时间不到一秒钟。完整的实施(基于Caffe)和经过培训的网络 可在http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net.

题目中就说明了,是专门用来做医学图像分割的。医学图像中一个非常常见的问题就是标注好的数据比较少,且标注成本极高,因此摘要中 特意指出了使用了数据增强以及可以使用很少的训练数据进行训练。摘要中所说的一个收缩路径和一个对称扩展路径,就是U-Net的核心结构。

数据增强

Cite

显微图像主要需要平移和旋转不变性,以及对变形和灰度值变化的鲁棒性。特别是训练样本的随机弹性变形 似乎是训练具有极少注释图像的分割网络的关键概念。我们使用粗糙的3乘3网格上的随机位移向量生成平滑变形。 位移从具有10像素标准偏差的高斯分布中采样。然后使用双三次插值计算每个像素的位移。收缩路径末端的 丢弃层执行进一步的隐式数据扩充

这里提到了要分割细胞,细胞是具有平移和旋转不变性的。但是如果是对于牙齿,就只有平移不变性了,因此实际使用时 要针对具体任务进行设置。此外,这里突出了弹性形变的重要性,而对于牙齿这一类刚性物体,是否要应用弹性形变还需要实验验证

网络结构

[^1].UNet的Pytorch实现

评论