您现在的位置:首页 > 体育直播 >

王小川:去年AlphaGo输的那盘是算法瓶颈 不是bug

2020-07-20 09:16 来源:杨园三居 浏览:

­  王小川

­  文|扬子晚报记者 徐晓风

­  中国江苏网5月22日讯他是所有爸妈心目中“别人家的孩子”,这位清华学霸从小学习优异,拿到的大大小小各类竞赛奖项无数;他是互联网业界的钻石王老五,27岁就当上了搜狐高级副总裁,现任搜狗CEO,曾声称搜狗就是自己的“老婆”……这是一次反射弧很长的采访,缘起于去年世界互联网大会期间,记者在乌镇内一家小店邂逅王小川后的简单餐叙,一直到不久前的博鳌亚洲论坛。这位搜狗掌舵者留给记者的印象是他始终散发着强大的自信和对未知领域的狂热探索欲望。

­  “有个很著名的自媒体人问我,搜狗要转型做AI(人工智能的英文缩写)了?我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,越来越聪明的搜索引擎能够帮我们选择出更好的页面来。百度集团总裁兼首席运营官陆奇就放出一句话,说搜索是AI最好的场景,搜索和AI是天生在一块儿的。”

­  不管是在乌镇水乡小店的长条餐桌上,还是在搜狗发布2016年全年和2016年Q4财报的访问现场,或者是前不久举办的博鳌论坛上,王小川跟记者聊得最多的都是人工智能。2月21日公布的财报显示,2016年全年,搜狗营收44亿元人民币,已经连续12个季度实现了持续盈利,把自己最美好的18年青春年华都与搜狗绑在一起的王小川感慨“搜狗搜索活下来了”,也开始秀搜狗与AI的“二三事”。

­  说到搜狗的AI,其实最近大家很熟悉的就是2017年2月6日,耗资4000万打造的搜狗问答机器人汪仔登录江苏卫视的《一站到底》。在人类获胜选手领先3分的情况下,汪仔最终完胜哈佛女学霸。“搜索的未来将走向问答机器人。用户的搜索行为会从输入一个关键词,变成表达一个完整的句子,让机器找出其中的含义,同时,搜索引擎返回的内容,也将从简单的10条链接转向直接给出答案或者是建议。”王小川如是说。而搜狗汪仔无疑是“问答机器人”这一理念的具象形态。搜狗汪仔背后依靠的是基于人工智能技术的搜狗立知问答系统,这个搜狗研发的面向未来的搜索技术,在理解用户的问题或信息需求后,利用海量网络信息及大规模知识库,能够直接给出答案,背后蕴含了语义分析,问题理解,信息抽取,知识图谱,信息检索,深度学习等众多技术。

­  学霸出身的王小川回答记者问题时也略带着学术味儿,不过对于汪仔的能干,他举了个简单的例子:以前机器人和人比赛,要求是全部说完才能抢答,可是《一站到底》里只要主持人开始念题,在任何时间点都可以去答,这代表高手可以预测题并抢答,对人工智能机器人来说就非常难,比如节目组派了顶尖选手来做测试,一个题目说“《鹿鼎记》中哪一种毒药……?”提到这个问题的时候,人已经答了,题还没问完呢。所以如何判断问题并且去推测、抢答,汪仔背后是有综合的技术挑战。

­  参加了江苏卫视另一个王牌节目《最强大脑》的百度机器人小度现在也正当红,与汪仔同样粉丝无数,王小川对此并不回避:“大家可能都想看百度小度跟搜狗汪仔比几场,这是不可避免的事,这个场景也是挺好的。”

­  “去年六月份,我去了英国伦敦,和开发阿尔法狗的工程师做了交流,我特别好奇的事情就是机器输掉的那一局到底发生了什么事情?他们说不是程序有BUG,就是深度学习本身有瓶颈。围棋比赛是三月份,我是在六月份去的伦敦,已经过了三个月,这个问题依然没有解决。但是我离开以后一个星期,他们的程序就能够正确面对之前输掉的那一局棋谱,我问他是否这个BUG修好了,工程师说没有,只是代表那一局那个特定问题,正好机器可以解决。但依然不知道在什么情况下,阿尔法狗会继续出错。所以深度学习这样一个体系其实还是有瓶颈在的。”

­  去年11月份,王小川在乌镇世界互联网大会上展示了实时机器翻译技术,该技术可将演讲者的中文同步翻译成英文并实时上屏,被现场同声传译的翻译戏称为职业终结者。不过在展示自己新技术的同时,王小川聊得更多的还是:以深度学习为代表的今天的人工智能技术,还有哪些不靠谱的地方?在产品上不适用之处有哪些?

­  拿语音识别来说,王小川表示现在技术在安静的环境里面识别准确度已经到了97%,但是一旦有噪音,准确率就会迅速下降。研究人员把汽车的引擎噪音、风的噪音等等也加入了机器学习系统,但是如果碰到两个人在说话,同声传译的机器又该怎么分辨?对于人来说,只要有细微的音色等差别就能够把其中的一个声音识别出来,和机器在处理过程当中有巨大的不同。