跳转至

BoostMIS:Boosting Medical Image Semi-supervised Learning with Adaptive Pseudo Labeling and Informative Active Annotation

论文

https://arxiv.org/abs/2203.02533

摘要

Cite

在本文中,我们提出了一种名为BoostMIS的新型半监督学习(SSL)框架,该框架结合了自适应伪标记和信息主动注释,以释放医学图像SSL模型的潜力: (1)BoostMIS可以根据当前学习状态自适应地利用未标记数据的聚类假设和一致性正则化。该策略可以自适应地生成从任务模型预测转换而来的一个热“硬”标签, 以便更好地进行任务模型训练。(2) 对于具有低置信度的未选择的未标记图像,我们引入了一种主动学习(AL)算法, 通过利用虚拟对抗扰动和模型的密度感知熵来找到作为注释候选的信息样本。这些信息丰富的候选项随后被送入下一个训练周期,以更好地传播SSL标签。 值得注意的是,自适应伪标记和信息主动注释形成了一个相互协作的学习闭环,以提高医学图像SSL。为了验证所提出方法的有效性, 我们收集了转移性硬膜外脊髓压迫(MESCC)数据集,该数据集旨在优化MESCC诊断和分类,以改进专家转诊和治疗。 我们在MESCC和另一个公共数据集COVIDx上对BoostMIS进行了广泛的实验研究。实验结果验证了我们的框架对于不同的医学图像数据集的有效性和通用性, 与各种最先进的方法相比有了显著的改进。

本文主要的贡献是

  • 据我们所知,我们是第一个将AL并入SSL的公司,以释放未标记数据的潜力,从而更好地进行医学图像分析。
  • 我们提出了自适应伪标记和信息主动注释,合理利用未标记的医学图像,并形成闭环结构,以提高医学图像SSL。
  • 我们收集了一个转移性硬膜外脊髓压迫(MESCC)数据集,用于方法开发和广泛评估,旨在优化MESCC诊断和分类,以改善专家转诊和治疗
  • 在MESCC数据集上证明了所提出的BoostMIS的一致优势,该数据集大大超过了现有的SSL方法。

方法


总结

Cite

在本文中,我们提出了一种医学图像半监督学习(SSL)框架BoostMIS,该框架利用主动学习(AL)来释放未标记数据的潜力,以更好地进行医学图像分析。 在该算法中,我们提出了自适应伪标记和信息主动注释,它们利用未标记的医学图像并形成闭环结构,以提高医学图像SSL模型的性能。实验结果表明, BoostMIS在医学图像分类任务上显著优于SoTA SSL和AL方法。所提出的框架利用Apache SINGA进行分布式培训,已集成到我们的MLCask中, 用于处理医疗图像和分析。

感觉有点偏理论啊

评论