Deep Learning for Medical Image Segmentation：Tricks, Challenges and Future Directions¶

论文¶

代码¶

摘要¶

Cite

在过去几年中，计算机视觉深度学习技术的快速发展极大地促进了医学图像分割（MedISeg）的性能。然而，最近的MedISeg出版物通常侧重于主要贡献（例如，网络架构、训练策略和损失函数）的展示，而无意中忽略了一些边际实现细节（也称为“技巧”），这导致了不公平的实验结果比较的潜在问题。在本文中，我们为不同的模型实现阶段（即预训练模型、数据预处理、数据增强、模型实现、模型推断和结果后处理）收集了一系列MedISeg技巧，并通过实验探讨了这些技巧对一致基线模型的有效性。与仅简单关注分割模型的优势和局限性分析的论文驱动调查相比，我们的工作提供了大量可靠的实验，在技术上更具可操作性。通过对具有代表性的2D和3D医学图像数据集的广泛实验结果，我们明确阐明了这些技巧的效果。此外，根据调查的技巧，我们还开源了一个强大的MedISeg存储库，其中每个组件都具有即插即用的优势。我们相信，这项里程碑式的工作不仅完成了对最先进的MedISeg方法的全面和补充性调查，还为解决未来医学图像处理挑战提供了实用指南，包括但不限于小数据集学习、类不平衡学习、多模态学习和领域适应。

实验为主的工作，可以参考官方发布的知乎简介

工作¶

使用两个网络2D UNet和3D UNet，ResNet50做backbone，在四个数据集上进行实验，四个数据集两个是2D两个是3D，在六个阶段上测试各种技巧

模型预训练阶段
预训练阶段可以看到的是，预训练还是大数据集效果更好，不整花里胡哨的，就堆数据效果就更好，其他各种奇怪的预训练技巧，换个任务换个模型没准就崩了
数据预处理阶段
预处理阶段的结果，patch size基本上确实是越大越好，但是一些trick对于肿瘤和肾的影响又不一致，因此数据预处理的这些东西确实需要针对数据集和任务看着来

另外一个数据集的结果，跟上面结论差不多
数据增强阶段
我比较关注的一个实验，GTAug是基于Ground Truth的数据增强，GTAug-A是像素相关的（对比度、亮度、归一化之类的），GTAug-B是空间相关的（翻转、旋转） GANAug是基于GAN的数据增强。读论文的时候几乎随便一篇上来就是旋转翻转Intensity clip，大家好像都默认了这些是基本操作。但是我做的一些实验发现这些数据增强有的时候反而使得效果更差。这篇论文实验也得到了类似的结论，可以看到数据增强很玄学，有的数据集好用有的数据集不好用，但是有意思的一点是效果有提升的时候基本也就一两个点，但是效果变差的时候直接七八个点，所以数据增强这个玩意还是得慎用

另一个数据集的结果类似，如果忽略零点几个点的变化，几乎可以认为各种数据增强全军覆没。作者文中有说，对2D图像往往GTAug效果好，对于3D图像GANAug效果比较好
模型实现阶段
效果拉胯不看了
模型推断阶段
推理阶段，试了两个东西，一个是TTA一个是集成，TTA我也不知道是啥看表效果也拉胯，模型集成还是yyds。集成试了平均和投票，我看了下应该是平均更好。说实话整篇论文这么多trick看下来，目前为止就看到这么一个靠谱的。

另外一个数据集的结果
结果后处理阶段
效果拉胯不看了，像移除小区域这种操作，那肯定是recall降低precision提高，Dice一般也下降了，到时候视任务而定吧

总结¶

Cite

我们为不同的实施阶段收集了一套MedISeg技巧，即预训练模型、数据预处理、数据扩充、模型实现、模型推理和结果后处理。这些技巧几乎涵盖了用于医学图像分割任务的所有常见和基本方案；其他精心设计的技巧可以被视为这些更复杂的组合。在我们的工作中，为了避免实现变化带来的性能模糊，我们通过实验探讨了在一致的2D UNet和3D UNet基线模型上收集的技巧的有效性。在2D ISIC 2018、2D CoNIC、3D KiTS19和3D LiTS的实验结果的见证下，我们明确阐明了这些技巧的效果。此外，基于调查的技巧和基线模型，我们为2D和3D医学图像开放了强大的MedISeg存储库，其中每个组件都具有即插即用的优势。与现有的论文驱动的细分调查相比，我们的工作可以提供广泛的实验，在技术上更具可操作性。我们工作的重要贡献之一是明确探索这些收集的技巧的效果。我们的工作不仅可以促进后续方法注重技巧，而且可以实现公平的结果比较。这可能是必要的，尤其是在网络架构面对一些复杂任务变得越来越复杂的当下，例如图像分割对象检测和图像生成。此外，当我们将所有常用的技巧集成到统一框架中时，MedISeg模型中的技巧之间的实现或补偿可能存在冲突，该框架可以为即将到来的分段管道（包括网络架构、训练策略和损失函数）提供经验和协调指导

看完了之后，觉得这篇文章应该叫《医学图像炼丹避坑指南》，比较好奇官方的github发布的框架咋用，反正我是论文看完后除了集成之外哪个trick都不想用

Deep Learning for Medical Image Segmentation：Tricks, Challenges and Future Directions¶

论文¶

代码¶

摘要¶

工作¶

总结¶

评论