您现在的位置:首页 > 科技科学 >

DeepMind是否找到了正确的科学探索方向?

2020-08-08 09:09 来源:杨园三居 浏览:

  原标题:DeepMind是否找到了正确的科学探索方向?

 

  谷歌母公司Alphabet旗下的DeepMind过去一年损失总额达5.72亿美元。作为全球规模最大的人工智能学术研究机构之一,DeepMind在过去三年中始终亏损,累计金额已超10亿美元。在未来12个月内,DeepMind还需要继续投入超过10亿美元。

 

  这是否意味着AI技术正在走向崩溃?


  这不一定。研究活动本来就相当烧钱,与一系列最顶尖的科学项目相比,DeepMind的支出只能算是“九牛一毛”。欧洲的大型强子对撞机项目每年光是维护成本就高达10亿美元,最终发现希格斯玻色子的总成本估计将超过100亿美元。而且,人们印象中的真正人工智能(也被称为人工通用智能,简称AGI)这类既能玩转《星际迷航》、又能听懂人类表达的重量级成果,开出的价码也绝对不会便宜。

 

  即便如此,DeepMind逐年上升的亏损水平仍然值得关注:2016年,DeepMind亏损额为1.54亿美元;2017年增长至3.41亿美元;2018年则进一步提升至5.72亿美元。在笔者看来,这其中包含着三大核心问题:

 

  DeepMind是否找到了正确的科学探索方向?

 

  从Alphabet的角度来看,这样的投入规模是否合理?

 

  如此可观的亏损数字,又会给整个AI市场带来怎样的影响?

 

  首先来看探索方向的问题。之所以值得讨论,是因为DeepMind明显是把鸡蛋都放进了同一个篮子——也就是深度强化学习。这项技术主要用于通过模型识别将深度学习与强化学习加以结合,基于奖励信号实现学习能力,从而使系统学会如何在游戏中获得更高分数、或者在象棋等游戏中对抗求胜。

 

  DeepMind的成名之作是2013年发表的一篇论文。这篇令人振奋的成果阐述了如何对单一神经网络系统进行训练,以教会其游玩多款雅达利游戏(包括〈突围〉以及〈太空入侵者〉),并最终获得近似甚至超越人类的成绩。这篇论文让DeepMind成了AI领域的摇滚******,并成功引起谷歌方面的注意。在2014年1月被谷歌收购之后,DeepMind进一步推动技术开发,先后在围棋以及不朽神作《星际争霸》游戏中接连取得胜利。

 

  但问题在于,这项技术对环境有着非常具体甚至可以说是苛刻的要求。例如在游玩《突围》时,哪怕是一丁点微小的变化,例如将镜头对焦位置移动几个像素点,其性能都会受到巨大影响。DeepMind的《星际争霸》系统同样局限性明显:在同一地图内使用同一种族进行对战,其成功确实足以超越人类;但在其它地图使用另一种族时,成绩就会快速下滑。要转换作战风格,我们必须从头开始重新进行系统训练。

 

  从某种程度上讲,深度强化学习是一种经过增强的记忆系统;它在某些场景中确实拥有良好表现,但对工作内容的理解程度却非常有限。因此,这类系统没什么灵活性可言,无法即时根据环境变化做出调整,并最终导******微小的变化都会显著影响实际性能。(DeepMind最近公布的肾病检查方案,也因为类似的问题而遭到质疑。)

 

  深度强化学习同时需要大量数据作为支持——例如在学习围棋时,需要完成数百万盘自我对局才能掌握个人奥妙。很明显,人类棋手不需要也不可能完成如此庞大的训练量,而且这样的过程难度极高且成本极巨,只有谷歌这样的科技巨头才能负担得起恐怖的计算资源需求。换言之,绝大多数企业与客户根本不可能在自己孱弱的独立计算机上实现类似的现实问题解决能力。根据估算,AphaGo的整个训练周期耗资达3500万美元,其消耗的能量足以支持12760个人连续三天不停进行脑力劳动。

 

  以上讨论的只是经济问题。更重要的是,正如Ernest Davis和笔者在即将出版的《Robboting AI》一书中提到,我们能否信任现有AI方案。目前,深度强化学习只能在良好可控的环境下提供可靠的结果;这样的局限对于围棋这种两千年来没怎么发生变化的场景非常适用,但我们显然不敢贸然把它引入到其它现实问题当中。

 

  >>> 难以实现商业应用

 

  之所以难以商业应用,主要是因为目前大多数实际问题都不像游戏那样拥有严格的场景与条件。也正因为如此,DeepMind目前仍拿不出比较像样的深度强化学习商业方案。与此同时,Alphabet已经在DeepMind身上烧掉了约20亿美元(包括2014年收购DeepMind的6.5亿美元)。但除了赚到的好名声之外,DeepMind在过去一年中只带来了约1.25亿美元的实际收入,其中相当一部分为Alphabet内部利用深度强化学习技术降低冷却成本省下的电费。