创新奇智勇夺人工智能顶级竞赛Wider Face人脸检测
发布时间:2019-05-24 19:31来源: 网络整理近日,世界权威的人脸检测公开评测集WIDER FACE公布最新评测排名。创新奇智(AInnovation)研发的AInnoFace人脸检测算法,超越百度、旷视、腾讯、京东、滴滴、卡耐基梅隆大学、北京邮电大学、中国科学院大学等众多国内外知名人工智能企业和高校人工智能实验室,在WIDER FACE的Easy、Medium和Hard三个评测子集的六项评估结果中, 综合排名第一(六个分项排名中五项第一,一项第二)。
(图片来自于WIDER FACE官网,为方便读者阅读该排行榜,笔者标注了部分人脸检测算法的研发企业和高校)
WIDER FACE人脸检测数据集
人脸检测是计算机视觉领域中非常热门和非常挑战的算法难题。人脸检测也是人工智能算法最重要的商业场景之一。为了提升人工智能算法和对外显示人工智能技术实力,很多AI公司都会选择公开数据集来验证自身的算法能力。在众多数据集中,WIDER FACE是目前业界公开的规模最大、检测难度最高的人脸检测数据集,由香港中文大学于2016年建立。该数据集共包含32,203张图像和393,703个人脸标注。其中40%的数据为训练集(Training),10%的数据为验证集(Validation),50%的数据为测试集(Testing)。每个集合中的数据根据人脸检测的难易程度分为“Easy”,“Medium”,“Hard”。
WIDER FACE的数据集识别难度非常大,更加贴近现实的场景,典型例子如下图所示。
从图片中可以看到,该数据集汇集了剧烈变化的人脸尺寸、各种各样的拍照角度、人脸姿态变化,不同程度的人脸遮挡、表情变化,不同类型的光照污染、强弱差异,以及多式多样的化妆风格等多种影响因素,因此该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含CMU等海内外一流高校,京东、腾讯、百度、华为、IBM、滴滴、旷视等知名AI公司),在该数据集上一较高下。
创新奇智AInnoFace算法
创新奇智提出的AInnoFace算法以著名的一阶段检测器RetinaNet为起点,采用了IoU损失函数(IoU regression loss)进行边框回归使得检测结果的位置更加精准,使用了选择性二阶段回归和分类(Selective Refinement Network)让检测结果的召回率更高并且产生的虚检更少,融合了多种数据増广策略使得最终的检测模型更加鲁棒,借鉴了标签最大化操作(Max-out Label)让分类预测结果更加准确从而降低虚检,利用了改进的多尺度测试策略以更好地检测不同尺度的人脸。经过上述一系列改进,AInnoFace算法对极端尺寸、模糊、遮挡等姿态下的人脸都有很好的检测效果,能有效提升复杂场景下人脸检测召回率及精准度,更好地解决了开放场景人脸检测的技术难题。
AInnoFace人脸检测算法构建在RetinaNet网络的基础上。(a)骨干网络:前馈ResNet-152 网络架构用来提取多尺度特征图。(b)颈部网络:一个6级特征金字塔网络(FPN)用来生成更丰富的多尺度卷积特征金字塔,在这之后,连接两个共享子网,一个子网负责分类目标框,另一个网络负责将目标框回归到真实框。 最后,我们使用focal-loss作为二分类的损失和使用IoU loss 作为框回归的损失。
以曾经有“世界上人数最多的自拍合影”照片为例,从公开消息查询,百度的算法PyramidBox在该图片上检测到880张人脸,而AInnoFace算法可以检测出918张人脸,检测精度遥遥领先,来感受一下AInnoFace算法的威力吧!
具体到本次竞赛的各项指标,如下图所示 ,也可以在官方主页中查到。在众多知名人工智能企业、高校人工智能实验室中,创新奇智脱颖而出,夺得冠军,令业界印象深刻!
(图片来自于WIDER FACE官网)
厚积薄发,快速发展
WIDER FACE竞赛高手大咖云集,成立一年多的创新奇智力压群雄获得第一。这并不是偶然,而是与创新奇智优异的商业化能力和优异的技术研发团队密不可分。
创新奇智成立于2018年3月,是创新工场的AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM、微软、SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用 “技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。