笔趣阁
会员书架
首页 >其他小说 >人工智能革命:历史、当下与未来 > 我不是脸盲晚期 ——图像识别

我不是脸盲晚期 ——图像识别(第2 / 2页)

上一页 章节目录 加入书签 下一章
推荐小说:

首次出现在公开场合的百度大脑在人脸识别上的成功,意味着在人工智能领域,我国的科研水平绝不会屈居人后。

<img alt="" src="/book/uploads/2022/02/20220208-81.jpg">

图8-3 微软颜龄识别网站how-old.net

人脸识别是利用分析比较人脸视觉特征信息进行身份鉴别的专门技术,也是人工智能的重要领域,只有在看懂世界的基础上,计算机才能更好地思考。看懂世界的一个重要方面,无疑就是会“认人”。但最近一次人脸识别技术的风头,正是被国内互联网巨头百度抢了去。2017年1月6日,在江苏卫视播出的节目《最强大脑》第四季中,百度公司出品的人工智能机器人“小度”首战告捷:在跨年龄人脸识别任务上,以3:2的比分险胜“最强大脑”代表王峰!

“小度”和王峰的“决战”分为两轮,第一轮,嘉宾章子怡从20张蜜蜂少女队成员童年照中挑出3张高难度照片,选手通过动态录像表演将所选童年照和在场的成年少女相匹配。第二轮,人机共同观察一位30岁以上的观众,随后将他从30张小学集体照中找出。根据节目组的安排,“小度”和王峰第一轮需要识别两个对象。对第一个对象的识别,王峰和“小度”都答对了。第二个对象的识别,现场出现了一个事先没有想到的“状况”:“小度”为一个对象给出了72.98%和72.99%两个极其接近的匹配答案,这令现场嘉宾大为困惑。可更令人震惊的是,事实证明待识别的对象群组中的确有一组双胞胎!作为科学嘉宾的魏坤琳博士也不禁啧啧称奇。

<img alt="" src="/book/uploads/2022/02/20220208-82.jpg">

图8-4 《最强大脑》中的小度

最后,作为“小度”负责人的百度首席科学家吴恩达(An-drew Ng)现场选择72.99%的照片作为最终结果,匹配正确,而王峰则识别错误。正是这一局成为了整场比赛的胜负手:“小度”凭借这1分的优势战胜了人类。

来自百度公司的科学家在现场也对人脸识别技术进行了深入的解读。相比于普通的图像识别,人脸识别的难度更高:每个人的脸部结构特征都是类似的,在判断上就会出现困难。此外,人脸识别中还存在着多种多样的干扰因素:表情、光照、角度等外部因素都会影响到人脸识别的精确度,口罩、墨镜、头发、胡须等人脸遮盖物也会破坏识别效果,更不用说整容、美图或是双胞胎等因素了。

为了达到与人类相似的水平,百度大脑学习包括网上公开的人脸照片、视频影像资料、第三方版权购买内容及一些向大众公开征集的人像照片在内的总共2亿张图片。这个数目相当于看遍了三分之二的美国人口。但即使这么大的训练样本也有难以解决的问题:在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这是个巨大的拦路虎。由于跨年龄的训练数据难以收集。基于深度学习的神经网络在数据匮乏的情况下,就难以习得跨年龄的类内和类间变化。

当然办法总比问题多,针对跨年龄人脸识别的第一个难点,百度深度学习试验室的人脸团队选择用度量学习的方法。即通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。针对第二个难点,考虑到跨年龄人脸的稀缺性。百度深度学习试验室用一个用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对他做更新。这样不容易出现过拟合的问题。

点击切换 [繁体版]    [简体版]
上一页 章节目录 加入书签 下一章