You Only Look Once:Unified, Real-Time Object Detection¶
代码¶
https://arxiv.org/abs/1506.02640
官网¶
https://pjreddie.com/darknet/yolo/
摘要¶
Cite
我们提出了YOLO,一种新的目标检测方法。先前关于对象检测的工作将分类器重新用于目标检测。相反,我们将对象检测框定为空间分离的边界框和相关的类概率的回归问题。 单个神经网络在一次评估中直接从完整图像预测边界框和类概率。由于整个检测管道是单个网络,因此可以直接根据检测性能对其进行端到端优化。我们的统一架构速度极快。 我们的基本YOLO模型以每秒45帧的速度实时处理图像。该网络的较小版本Fast YOLO每秒处理惊人的155帧,同时仍实现了其他实时检测器的两倍mAP。 与最先进的检测系统相比,YOLO会产生更多的定位误差,但不太可能预测背景中的误报。最后,YOLO学习对象的非常一般的表示。当从自然图像到艺术品等其他领域时, 它优于其他检测方法,包括DPM和R-CNN
又快又好,嗷嗷的
方法¶
Cite
单阶段的网络比双阶段的网络还是看起来舒服多了
输入图片分割成\(S*S\)个网格,每个网格预测\(B\)个边界框,每个边界框预测\(C\)个类别的概率,每个边界框预测\(x,y,w,h\)的坐标,因此网络的输出是\(S*S*(B*5+C)\)的张量
总结¶
Cite
我们介绍了YOLO,一个统一的对象检测模型。我们的模型构造简单,可以直接在全图像上训练。与基于分类器的方法不同,YOLO是基于直接对应于检测性能的损失函数进行训练的, 整个模型是联合训练的。快速YOLO是文献中最快的通用目标检测器,YOLO推动了实时目标检测的最新技术。YOLO还很好地推广到新领域,使其成为依赖快速、鲁棒对象检测的应用的理想选择