跳转至

\(U^2\)-Net: Going Deeper with Nested U-Structure for Salient Object Detection

论文

U\(^2\)-Net: Going Deeper with Nested U-Structure for Salient Object Detection

代码

https://github.com/xuebinqin/U-2-Net

摘要

Cite

在本文中,我们设计了一个简单而强大的深度网络架构U2-Net,用于显著目标检测(SOD)。我们的U2-Net的架构是一个两级嵌套的U结构。 该设计具有以下优点:(1)由于我们提出的ReSidual U型块(RSU)中不同尺寸的感受野的混合,它能够从不同的尺度中捕获更多的上下文信息, (2)由于这些RSU块中使用的池化操作,它增加了整个架构的深度,而不会显着增加计算成本。这种架构使我们能够从头开始训练深度网络, 而无需使用图像分类任务的骨干。我们实例化了所提出的架构的两个模型,U2-Net(176.3 MB,GTX 1080Ti GPU上的30 FPS)和 U2-Net†(4.7 MB,40 FPS),以促进在不同环境中的使用。两种模型在六个SOD数据集上都实现了竞争性能。 代码可用:https: //github.com/NathanUA/U-2-Net。

摘要和题目可以看出,本文的工作中心是more nested,想起了Unet++。不同于其他的SOD,本文中提出的模型基于RSU块,可以从头训练。

方法

相当于嵌套的UNet,编解码路径上的每个节点都换成一个小的UNet

结论

Cite

在本文中,我们提出了一种新颖的深度网络:U2-Net,用于显著目标检测。我们的U2-Net的主要架构是两级嵌套U结构。 嵌套的U-结构和我们新设计的RSU块使网络能够从浅层和深层捕获更丰富的本地和全局信息,无论分辨率如何。 与建立在现有骨干上的SOD模型相比,我们的U2-Net完全建立在建议的RSU块上,这使得从头开始训练并根据目标环境约束配置不同的模型大小成为可能。 在本文中,我们提供了全尺寸的U2-Net(176.3 MB,30 FPS)和较小尺寸的U2-Net†(4.7 MB,40 FPS)。 在六个公共显著目标检测数据集上的实验结果表明,两种模型在定性和定量测量方面都与其他20种最先进的方法相比具有很强的竞争力。 尽管我们的模型与其他最先进的方法相比取得了有竞争力的结果,但计算和内存有限的设备(如手机、机器人等)需要更快、 更小的模型。在不久的将来,我们将探索不同的技术和架构,以进一步证明速度并减小模型大小。此外,需要更大的多样化突出对象数据集来训练更准确和鲁棒的模型

结论中对效果的表现还是满意的,未来工作是轻量化

评论