AlphaGo让AI从云端照进现实

《电脑爱好者》2017年第20期 2018-04-08 13:28专题 标签:AlphaGo AI

前文我们提到过,支持Siri语音助手的iPhone手机硬件和AI沾不上边,但用于实时处理Siri信息并反馈结果的终端侧(On-device)却需要前瞻的机器学习技术。换句话说,这是一种AI在云端的表现。而真正将云端AI优势照进现实的,还是谷歌AlphaGo所表现出的精湛棋艺。

AlphaGo的逆天棋艺

在过去,AI对普通大众总是“只闻其声”,和我们的生活似乎没有太大交集。然而,谷歌AlphaGo却通过在围棋应用上的表现震惊了世人(图1),让我们认识到AI真的能在特定领域比人脑更聪明。

01

2016年3月,AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上AlphaGo又以3比0的总比分战胜世界围棋冠军柯洁(图2)。

02

要知道,在AlphaGo以前,其他软硬平台的人工智能在围棋领域连业余六段左右的选手都赢不了!

AlphaGo的AI源动力

AlphaGo更“聪明”的秘诀,在于它改用了一种针对机器学习优化过的处理器(图3),而谷歌则将其命名为TPU(Tensor Processing Unit,张量处理单元)。据悉,TPU相较于传统处理器有着7年的领先优势,其宽容度更高,每秒在芯片中可以挤出更多的操作时间用于更复杂和强大的机器学习模型,并将之更快的部署。

03-1(和03拼一起)

去年AlphaGo在和李世石对局时,使用的还是1202个CPU和176个GPU组成的集群。而与柯洁对弈的AlphaGo版本却只需一台物理机上的4个TPU芯片(图4),每颗TPU的功耗也仅有40W。换句话说,短短一年,AlphaGo就将所需计算的资源从1202颗CPU和176颗GPU压缩到4颗TPU,功耗更是缩减到千分之一!

04

目前,TPU已经服务于许多谷歌的应用中,包括用以改善搜索引擎结果关联度的RankBrain,以及在街景服务(Street View)改善地图与导航的精确度与质量等等。此外,谷歌还表示TPU仅仅是现有处理器针对AI的有效补充,它依旧需要运行在现有的CPU+GPU平台上,所以并不会直接与英特尔或NVIDIA进行竞争。

扩展阅读:ASIC和FPGA是什么

目前用于AI的芯片除了CPU和GPU外,还包含ASIC和FPGA两大分支(图5)。其中,FPGA(field programmable gate arrays,现场可编程门阵列)和GPU又称通用芯片,前者被微软、英特尔和Xilinx等企业青睐,百度云、阿里云、科大讯飞的语音识别服务等也都是基于深度学习FPGA芯片所搭建;ASIC(Application Specific Integrated Circuit,专用集成电路)的优势是更专业,有着更高准确率和更低功耗,而且成员最为丰富,本期话题中涉及的谷歌TPU、苹果A11、寒武纪的A1都隶属于ASIC,只是ASIC算法框架尚未统一,所以旗下的各位成员还都处于各自为战的阶段。此外,IBM推出的TrueNorth则是类脑芯片(BPU),潜力甚至要高于其他对手。

05

源于云端的物理限制

AlphaGo虽然拥有强大的AI能力,但它却摆脱不了一个先天制约:依托于云端的它,需要覆盖足够广、速度足够快的网络支持。当你与AlphaGo下棋时,只要拔掉网线(或是关闭无线路由)(图6),好吧,哪怕你是准高级选手都有机会战胜AlphaGo,证明你有着比柯洁还要厉害的棋艺。

06

无处不在的云端AI

实际上,AI早已融入了我们的生活,只是它们和AlphaGo一样都是生活在云端,和本地化设备关系不大,所以我们总是选择性的将其忽略。

前文我们说过,想玩AI,数据、算法和计算能力缺一不可。因此,国内真正能打包全要素的AI玩家多是以BAT(百度、阿里、腾讯)等为代表的互联网巨头。只要你在使用这些公司的服务,那你就已经在默默地接受AI的“馈赠”了。

比如,百度推出了对话式人工智能系统DuerOS、下一代汽车平台阿波罗计划,并辅以百度大脑和智能云;阿里巴巴将AI业务纳入阿里云体系,先后推出了智能私人助理阿里小蜜和无人商店淘咖啡;腾讯设立AI实验室,主要布局游戏、社交和内容业务,比如围棋AI“绝艺”等。

此外,京东旗下的Alpha智能服务平台则算是技术+服务+渠道的一站式智能解决方案代表(图7),能帮助传统音频企业最大限度降低物联网硬件开发技术门槛和研发成本,轻松打造具备一定AI交互能力且具备声纹识别的智能音频类产品,CFan本期评测的叮咚2代智能音箱就已具备了AI的雏形。

07

将语音交互作为AI研究方向的还有暴风TV,其最新推出的智能电视全部内置AI助手“暴风大耳朵”功能,凭借AI远场语音和AI信息流两类黑科技可更深度地理解上下文,与用户进行多轮对话并支持声纹识别(图8),哪怕没有遥控器也能进行复杂的资源查找、点播服务和语音交互。

08

再比如,今日头条之所以能实现千人千面的封面选择,同样是利用AI进行用户画像、自然语言理解和协同过滤步骤,用低成本去挖掘用户需求,然后进行内容聚合从而得到智能匹配的个性化推荐方案。而头条推出的集成自然语言处理、视觉图形处理和机器学习技术的写稿机器人也是令人印象深刻。

总之,人工智能将是未来20年甚至50年的长期发展技术,不可能有一家公司可以通吃所有领域的AI。换句话说,下棋的AI不能用于汽车的无人驾车、用于人脸识别的AI也不擅长进行深度语音识别和交互。在这种大环境下,参与AI竞争的企业谁都有可能做到各领风骚多少年,只做擅长的细分领域,机会谁都有。

AI在面部识别上的应用

适合AI的领域有很多,但真正与我们密切相关,或者说享用成本最低的,只是语音识别(交互)和面部识别等少数领域。

以面部识别为例,最经典的AI案例就是百度寻人平台(xunren.baidu.com)(图9)。2017年5月23日,百度CEO李彦宏在第十二届百度联盟峰会上分享了一对七旬老人,利用一张身份证照片找到走失8个月儿子的真实案例故事。

09

百度寻人平台的运行原理是运用人脸识别技术,将用户上传照片与丢失人口数据库中的照片进行相似比对,根据相似程度对人脸的身份信息进行判断。然而,影响人脸识别的因素太多,比如光照、人脸姿态、遮挡程度、跨年龄的变化等等。而AI在该平台的最主要应用则是,用200万人2亿张人脸图片进行训练模型,然后用少量的跨年龄数据对它做更新。在没有引入AI之前,利用照片寻人就是个笑话。

此外,小米手机MIUI系统也曾主打过面孔相册功能(图10),极大地提高了用户在茫茫手机相册中找人的效率,而小米也曾表示小米人脸检测算法团队研发的新算法在FDDB人脸检测准确率榜上取得排名第一。问题来了,想开启小米手机的面孔相册功能,必须登录小米ID,并打开云相册功能(图11),需要将所有照片上传到云端服务器,最终实现在云相册照片内容中按照面孔进行分类整理。

10

11

无论是百度寻人平台还是面孔相册功能,它们的流程都是用户提供数据(照片),然后利用云端平台的算法和强大的计算能力,实现与数据匹配照片的筛选,支付宝的人脸验证也是类似的原理 (图12)。可能有同学会问了,无论是iOS、Android还是Windows,似乎都有支持根据人脸分类的相册APP啊?面孔相册一类的功能有什么可吹的?

12

这就是本地计算与云端AI计算的差异所在了。大家可以自行下载一下此类软件,无论是人脸的识别准确率还是筛选速度,表现都是极为勉强,遇到侧脸、遮挡和时间跨度(年龄),识别率更是低得吓人。

那么,为什么本地相册无法实现快速和精准的人脸识别?要知道,将照片传到云端又会出现安全风险(隐私照片被泄露)。没办法,前文我们已经说过,别说是智能手机,哪怕是强如i7-7700K+GTX1080独显的台式机,在进行AI运算时也是力不从心。

好消息是,随着苹果A11和海思麒麟970处理器平台的出现,AI终于有机会实现从云端落地的梦想,曾经很多必须借助云端服务器才能确保效率和准确性的功能,在没有网络加持下依靠手机本地的运算能力也能搞定!

 

上一篇:AI已被唤醒