Fast Facial Landmark Detection and Applications:A Survey¶
论文¶
https://arxiv.org/abs/2101.10808
摘要¶
Cite
密集人脸标志检测是人脸处理流水线的关键技术之一。它被用于虚拟人脸再现、情绪识别、驾驶员状态跟踪等。早期的方法仅适用于受控环境中的面部标志检测, 这显然是不够的。神经网络在野外人脸标志性检测问题上表现出了惊人的质量改进,目前该领域的许多研究人员正在对此进行研究。人们提出了许多聪明的想法, 往往相互补充。然而,对大量新方法的探索具有相当大的挑战性。因此,我们提出了这项调查,我们将最先进的算法分类,并对最近引入的野生数据集 (例如,300W、AFLW、COFW、WFLW)进行了比较,这些数据集包含在无约束条件下拍摄的具有大姿态、面部遮挡的图像。除了质量,应用程序还需要快速推断, 最好是在移动设备上。因此,我们在桌面和移动硬件上都包含了关于算法推理速度的信息,这很少被研究。重要的是,我们强调了算法的问题、它们的应用、漏洞, 并简要介绍了已建立的方法。我们希望读者能发现许多新颖的想法,了解算法在应用中的应用,这将有助于进一步研究
人脸密集关键点检测,关注了在移动应用,即硬件受限的条件下的算法应用
总结¶
Cite
从详细的调查中,我们看到以下面部标记检测算法问题,需要在未来的研究中解决:1)尽管方法的质量显著提高,但其中很少有人关注资源受限环境(如移动或边缘设备)中的真实应用性; 2) 许多应用程序要求在移动或便携式设备上具有高性能,但据我们所知,只有一种算法的作者在原始论文中直接针对移动应用程序。注意,最先进的算法推理速度慢; 3) 虽然现代研究已经集中于不可控环境中的数据集,但一个很有前途的研究方向是在更恶劣的条件下增强算法,用于具有大姿态和显著面部遮挡的图像,同时仍保持高的标志密度。 在这些条件下,当前生成的算法的误差相当高。我们认为WFLW数据集是最有兴趣进行进一步研究的数据集。此外,希望看到更多新颖的面部地标检测算法, 以报告其在桌面GPU上的推理速度,如果可能的话,也可以在移动设备上。我们希望,所有章节中描述的现代发展将引导读者找到实用的新想法和进一步的研究方向