NO.1 依图科技取得全球最权威人脸识别测试第一名!

NO.1 依图科技取得全球最权威人脸识别测试第一名!


在最近公布的国际权威人脸识别供应商测试 FRVT(Face Recognition Vendor Test)结果中,云栖联盟成员依图科技获得了四项测试的第一名,超过了俄罗斯公司 Vocord(Vocord 是国际老牌安防厂商,长久以来超越 Google 等公司盘踞人脸识别算法第一名)。

FRVT 是由美国国家标准技术局 NIST(National Institute of Standards and Technology) 组织的人脸识别供应商测试,作为美国国家采购的官方指导,其测试的权威性是全球工业界实际应用的黄金标准。

FRVT 的人脸识别测试集合来自美国国土安全局的真实业务场景,例如出入境、刑侦过程中收集的大量照片。与时下热门的由学术机构举办的 LFW、MegaFace 测试相比,FRVT 更贴近实战,测试规模更大,不仅拥有百万量级测试数据,同时这些测试数据均不公开,有效避免算法过拟合甚至是作弊手段。

表一:主流的人脸识别测试场景、测试集、指标比较

表二: 在三个测试集上代表厂商成绩比较。安防厂商海康威视未发布公开测试成绩。

LFW 是由美国马萨诸塞大学发布并维护的公开人脸数据集,测试数据规模为万,国内多个团队例如百度、腾讯、大华、旷视、商汤都曾获得了 99.5% 以上的成绩。

MegaFace 是由美国华盛顿大学发布并维护的公开人脸数据集,测试规模比 LFW 大 100 倍,更能区分各个算法的性能差异。第一名是创立于 1999 年的老牌俄罗斯公司 Vocord,获得 91.7% 的成绩,比第二名腾讯优图高出 8%。

在顶级的竞争中,数据和计算的优势并不能保证输出最优秀的算法性能。

由美国国家标准技术局(NIST)主持的 FRVT,除了主持机构的权威性外,测试结果的权威性还来自其评测的严谨和全面性:

1、数据均来自真实业务场景,测试结果好则代表该技术可以在实战场景中直接应用。

2、数据规模是通过对百亿对样本采样,达到百万量级。如此大规模的测试集可以稳定评估算法性能,详细区分不同算法的优劣。

3、测试数据不公开 (盲测),这保证了测试的公正性。因为参赛的算法团队无法利用测试数据做模型训练,可以有效避免过拟合或直接作弊等手段,因此相对于 LFW、MegaFace 而言,FRVT 则更能体现测试的公正性。

4、科学专业性,FRVT 对不同实战场景、人种、年龄、性别,做了详细分解下的识别性能比较,并在模型速度、特征库大小、比对阈值等做了详细评估。

这是目前为止全球公开的、最大规模测试集、最权威测试指标下的最好成绩,比2014年参与同样测试的第一名日本公司NEC在准确率上有大幅提高。

NIST 针对测试作了不同场景、不同人种、不同性别、不同年龄的识别性能比较。从 FRVT 的官方描述来看,其提供的测试数据对应了出入境管理、身份门禁认证、平安城市监控等实战应用场景,依图在四项主要的测试场景中均获得第一名。

在更详细的人种(黑人、白人、亚洲人等)、性别比较中,依图的算法表现几乎没有差异;而其他算法随着识别难度增加,识别率出现了不同程度的较大降低。对比结果说明依图的算法可以在不同类型数据分布的实用场景中,例如黑人较多的场景下,算法也可有稳定表现。

(具体报告来源于 Ongoing FRVT 2017.6.19 报告)

过去四年,从 LFW 到 FRVT,测试指标已经从千分之一误报到千万分之一误报,识别性能已经提高一万倍,意味着误报降低万倍。可以预见,很快就会出现测试指标在亿分之一、十亿分之一、百亿分之一误报下的识别性能比较,这将是另一个千倍的智能识别能力的增长。

可以想象,在十亿级超大规模比对、十亿分之一超低误报下的高识别性能,意味着智能技术将解锁更多的应用场景,从楼宇建筑到城市量级,甚至多城联动,再到全国范围内的人脸比对、安防布控都将成为可能。

机器之心就此事特别采访了依图科技 CEO 朱珑,朱珑说:“NIST 是工业界最权威的测试,有最直接的应用指导价值。从测试的结果来说,有两个意义: 我们可以平静的接受,来自中国的算法技术超过全球的竞争对手;更大的意义在于,掌握标准制定话语权和实际全球影响力的美国国家标准技术局,已经显得‘没见过世面’,千万分之一的误报下的识别率并不能拉开我们和第二名的差距,我们的算法已经在 10 亿分之一的误报下达到超过 90% 的识别率。希望将来,国际主流学术机构能接受,只有中国参与的标准测试,才反映全球最前沿的技术理解。”

朱珑

霍金的徒孙这个身份,给朱珑这位创业者带来了不小的光环。朱珑的老师Alan Yuille教授是国际计算机视觉届奠基人之一,师从霍金。Alan先后就职于MIT人工智能实验室、哈佛大学计算机系,现任职于UCLA统计系,也是UCLA视觉识别与机器学习中心主任。

朱珑出生在福建福州,和他从小一起长大的好友林晨曦也是一位标准的“学霸”,上海交通大学硕士毕业。林晨曦曾经是阿里巴巴的云计算资深专家、技术总监,2008年他跟着王坚从微软亚洲研究院来到了阿里,创造了阿里云的飞天分布式云计算操作系统。

这两个人,一个擅长高精度人工智能算法,一个擅长把人工智能算法高效工程化和产品化的大规模并行计算系统,两个人在2012年联合创业,联手创建了依图科技股份有限公司(以下简称:依图科技)。过去的四年间,这家创业公司成为了一匹人工智能产品化的黑马,接下来他们还想要做更多。

林晨曦

依图科技的第一代人工智能产品也是现在的主要产品为人像识别和车辆识别系统:蜻蜓眼人像识别比对系统、蜻蜓眼车辆识别系统。

其中的人像识别比对系统可在0.5秒级内完成单张人像查询亿级数据库后返回精准结果,领先于国内其它技术供应商的百万级查询水平,也超越了人眼识别平均水平,在青奥会、珠海航展、G20峰会安保系统成功应用。而车辆识别系统则能通过对车辆品牌、型号等精准识别,实现品牌识别、假套牌库分析、基于视觉特征的“以图搜车”,已经用于8个省公安厅,并获2015年公安部科学技术进步奖。

为什么依图科技的人像识别和车辆识别有这么高的精度与效率呢?这首先是因为朱珑的算法是经过了高度的优化,除了大幅提升识别精度外,还在考虑工程优化方面下了很大的功夫。而林晨曦的大规模并行计算工程化经验,则大幅提高了算法的运算效率和优化了工程实践。

根据前瞻产业研究院统计,2015年生物识别技术全球市场规模将达到130亿美元,2020年将达到250亿美元,5年内年均增速约14%。自2015年到2020年,人脸识别市场规模增长了166.6%,在众多生物识别技术中增幅居于首位,预计到2020年人脸识别技术市场规模将上升至24亿美元。广阔的市场空间,为孕育依图科技这样的黑马提供了前提。

城市大脑

2016年3月,杭州市政府启动了城市大脑项目,这个项目由杭州市政府主导,由包括阿里云在内13家企业的人工智能科学家参与,依图科技也是13家参与企业中的一家。

所谓“城市大脑”,就是利用人工智能算法,对整个城市进行全局实时分析、自动调配公共资源进行优化,城市交通是第一个要解决的问题。

在“城市大脑”项目中,依图科技的角色是负责道路的建模和车辆行驶轨迹的识别,能具体到每一辆车的行驶轨迹,具体到某辆车于几点几分出现在哪个路口、完成了左拐还是右拐;其次是道路拥堵状况建模和红绿灯关系建模,从而推断车辆的饱和程度、两个红绿灯之间的相位关系(如何识别一路绿灯或红灯)等。

林晨曦介绍说,依图科技现在仅是对一条杭州萧山区最堵的市心路建模,涉及到8个红绿灯、7个路口。其中的难点在于“每天的交通情况都不一样”,既有早高峰与晚高峰的突发因素,也有天气、车祸等不确定因素;此外,传统的道路优化是单个路口,现在是要考虑8个红绿灯整体联调。其中,对道路拥堵建模采取的是深度学习算法,对8个红绿灯联动建模采取的是梯度下降算法。

“城市大脑”的难点在于首先要对现实物理世界建模,而用数据和数学表达对物理世界的刻画一直是人工智能终极挑战之一。“城市大脑”的交通优化要先设计一个对现实物理世界的模拟仿真器,然而在这个模拟仿真器上做大量的数据实验,用机器学习的方式对道路进行建模,再用真实的数据流来验证数学模型的可行性与精度。

林晨曦表示,“城市大脑”要对所有城市每条道路进行建模,然后合并在一起是对整个城市的建模,再对车辆轨迹建、路口和意外事件建模。因此,这是个极为复杂、混合的模型,每个模型是刻画一个小的现实物理世界问题,但结合在一起就异常复杂了。

比如对一个区域建模的最大挑战:一是获取外部环境数据需要跨团队协作,数据采集的精度和实时性等都对算法有影响,因此要协调很多部门;二是研究方面没有可借鉴,美国和世界各地与交通相关的文献中目前没有使用视频数据获得具体车辆个体信息的研究,即使是MIT也没有达到这么深的地步。

过去,智能安防在城市建设中扮演了十分重要的角色,如今,从智能安防到智能交通,这对于人工智能来说是一个质的飞跃。智能安防使用到的人脸识别和车辆识别已经从算法研究推进到了具体的工程化与产品化阶段,而智能交通的研究才刚刚开始。智能安防属于单个问题的优化,而智能交通则是多个问题的同步全局性优化,而且智能交通还涉及到异常和意外情况,因此如果能解决智能交通问题,那就是人工智能的一个历史性飞跃,这也是依图科技希望探索的下一个人工智能高地。

在新人工智能算法的商业化方面,林晨曦认为“要抓用户的刚性需要,待人工智能算法进步到能把问题解决了,商业模式自然就有了”。当然,对城市交通建模与股市建模不一样的地方,在于股市是不受控的场景,但城市交通是有物理约束条件,属于有可能解决的范畴。

依图科技的人像识别和车辆识别软件产品既能部署到客户自己的数据中心里,也能以SaaS的方向对外提供,总部位于上海市并在美国硅谷设有研发中心,已经发展到百余名员工。

 

 

资讯来源:源自网络