您的位置:首页 > 其它

人脸识别之Face++

2017-04-20 08:58 197 查看
Face++是国内少有的明星级技术型创业公司,由三个清华CS男创立,提供人脸识别技术服务,去年拿到了黑马大赛的冠军,今年又获得了创新工场的投资。

作为一个备受脸盲症困扰的人,我对人脸识别颇感兴趣,于是上周前往位于银谷大厦内的Face++办公室,采访了Face++的联合创始人印奇。

对我而言这是一次信息量很大的采访,我们从公司的创立与发展聊到了人脸识别的技术与应用场景。让我印象最深的是这家公司的口号:Be different, be interesting。“我们想做不一样的事情,并且把这件事情做得有意思,”印奇说。

在聊人脸识别技术的过程中,我们也谈到了深度学习。深度学习在图像识别领域为人们所熟知的应用是在海量图片中识别一类物体,这大概要归功于Google发布的那段“找猫”的视频。

不过人脸识别是一个细分领域,经过多年的积累,人脸检测和脸部关键点定位的技术都已十分成熟。而且在这一领域,人们通常需要机器去做的也不是在海量的不同类型的图片中寻找有人脸的图片,而是在海量的人脸图片中找出与指定的图片相同的人,即人脸比对。那么深度学习在这个领域能带来哪些帮助呢?

印奇说,传统的深度学习是辨别不同的类别,而在人脸识别领域,深度学习被用于辨别同一类物体里不同个体的,“更精细化,所以更难”。

“你想想,一个机器,你教懂它猫和狗的区别,和教懂它你和我的区别,其实后者更难,因为同一类物品的变化更细微。”

此外,深度学习还能用于补全人脸信息,例如给出一个人的正面照,让机器来绘制出它的侧面。

印奇说,按目前Face++的技术,用一张正面照能较为精准地识别60度以内的侧面照,即两只眼睛都可见的情况。如果角度更大,则需要补充额外的信息,“比如我只见过你正面,没见过你侧面,我要去识别的话,可能需要见过100万人的正面和侧面的联系才能推测出你的侧面长什么样子。”

这正是利用了深度学习的思想。“如果没有其他的关系,它一定不能(补全人脸信息),因为这不符合常理;但如果机器学习了一亿人的正面和侧面,那你给我一亿零一个人的时候,我其实可以做到,我可以用我之前学到的知识帮你做这件事。”

不过印奇认为现在的技术距离完成这项工作还有很长的路要走:“你给我一张普适的人脸照片,我肯定做不到;但如果你进行一些限定,或者我给你补一个70%-80%,那应该是可以做到的。”

以下是我对印奇的采访中,围绕人脸识别技术的其他部分节选:

图像识别是个很大的领域,为什么你们专注于人脸识别?

我们最终一定是想做大的图像识别,但这里面有几个问题。

一个是技术成熟度,人脸识别是研究时间较长的领域。相比之下,现在炒的比较热的商品识别,我们认为这些技术离真正成熟要更久。而人脸由于只处理一类问题,所以最终可能能更快地达到特别准确,并符合用户预期。

第二,你做大的图像识别一定要从一类图片来处理,而人脸又是最重要的一类,包括在社交等各个方面,人脸的信息在图像信息的单类物品里面最重要的。所以我们选择最重要的并且最早成熟的一个领域来做。

人脸识别的基本流程是怎样的?

首先找到人脸在哪,然后是关键点定位,把眉毛、眼睛、鼻子这些点用作识别的基本信息,然后再做识别。按我的理解,现在的人脸检测和关键点定位已经相当成熟,符合大家预期了。但在关键点定位之后的识别这块还没有做得特别成熟。

在这里我们是把人脸当作特异化的物体来处理。假如我要做狗的识别,那模块其实缺了很多,首先我都找不到这张狗,一张图里有只狗,机器不知道哪是狗,也不知道哪是狗的头,哪是狗的尾巴;而人脸的模块已经成熟了,并且只做这类图片时我们会提取之和这类图片相关、其他图片没有的特征。

传统基于关键点定位的人脸识别技术有哪些问题?

传统的人脸识别更多的是图像层面的比对,比如说要检测人脸和关键点,然后把两个图片做像素或者图像里的特征值的比对。这些比对在光照等因素影响下都会变化很大。

我们更加讲究高层语义识别,比如你的话,我们会给你定义男生,年龄在20岁到25岁之间,然后还有五官的类型,这就跟自然语言理解是一样的,你只有跟人一样去理解人脸,你匹配的结果才能符合人的预期。

如何测定人脸识别的精确度?

如果有人给你一个数字,说精确度是多少,那一定不靠谱。首先人脸识别跟场景特别相关,如果大家都是证件照,很规整,那肯定很简单;如果大家有正脸有侧脸,那肯定很难。所以给这样一个概念:当用户没有特别奇怪的场景,角度不是特别大,两个眼睛都能看见,光线还比较正常的情况下,现在我们的系统能做到1比1000左右的精准识别,你可以认为它满足人们的预期,在这里面找这个人一定能找到;如果是1比10000,那可能能在前10个人里面找到你。这是用户给我一张照片的情况,如果用户给我一段视频或者多张照片,那精确度会随之增加。未来我们肯定是希望能在1比几万甚至十几万能够做到比较精准的识别。

海量图片数据能给你们带来什么帮助?

这也是我们为什么现在这个节点做人脸识别。正因为有这么多数据,你的技术才有可能飞跃,就像Google当年做搜索,如果没有用户反复点击的数据,你也没法做得好。然后深度学习也是一个大的方向,深度学习也是需要很海量的数据。就像你说的,有一个正面照,能否知道它的侧面,就是需要很海量的数据才能完整这件事情。

除了人脸比对,脸部的信息还有别的价值吗?

还可以知道人的属性、情绪,尤其是跟广告很有关的。广告所需要的大部分信息都是可以通过人脸来分析的,甚至是人的年龄、保养程度等。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Face++ 人脸识别