一篇《自然》杂志封面文章28日引爆舆论——名为“阿尔法围棋”(Alpha Go)的谷歌计算机程序,在完全平等条件下以5∶0完胜欧洲冠军、职业围棋二段棋手樊麾。《自然》以“All SYSTEMS GO”为题报道,指出计算机围棋战胜人类冠军一切已然就绪。
这当然不是说说而已:Alpha Go已经约战近10年来获世界冠军头衔最多的棋手、韩国天才李世石九段,奖金是由谷歌提供的100万美金。
国内媒体甚至用“人类最后的智力骄傲即将崩塌”来渲染此事,似也有据可依:两个月前,首届世界计算机围棋锦标赛冠军“石子旋风”(Dolbaram)对决中国现任围棋名人连笑,结果被让4子、被让5子负,被让6子胜,就被誉为“历史性的突破”;此前,计算机围棋甚至不足以成为业余高段位棋手的对手,对弈职业棋手,被让9子几无胜绩……放在18年前超级计算机“深蓝”战胜国际象棋世界冠军卡斯帕罗夫之后、计算机围棋博弈水平仍一直远低于人类的大背景下,Alpha Go敢于挑战世界顶尖棋手,确有一种石破天惊的震撼效应。
那么这一次,计算机围棋战胜人类,真的近在眼前了吗?
人类智力运动“皇冠上的明珠”
计算机围棋之难,首先难在这项被称为人类智力运动“皇冠上的明珠”本身的多重复杂性。“最简单的规则,最复杂的变化”,是对围棋最简单明了的概括。
“围棋具有巨大的状态空间复杂度和博弈树复杂度,又在本质上无法做准确的静态盘面评估”,这使得即使采样样本足够大,也有力所不逮之处。北京邮电大学教授、计算机围棋研究所所长刘知青用以下一组数据来说明:状态空间复杂度(用于搜索),围棋是10172,中国象棋、国际象棋分别是1048、1046;博弈树复杂度(用于决策),围棋是10300,中国象棋、国际象棋分别是10150、10123。
另一重复杂,是围棋落子选点无法验证。一手棋有多大价值,数学证明,或搜索验证,都难以胜任。“分析围棋棋子位置,数目的多少,以及棋子之间的静态关系(例如影响函数),无法完整、准确地评判围棋棋子的作用和最终死活;围棋棋子的作用和最终死活必须由博弈的具体进程决定”。
令人震惊的巨大突破
尽管Alpha Go此次完胜的对手并非职业顶尖棋手,中国围棋队总教练余斌九段仍感觉“吃惊”。以往认为,计算机围棋“100年都不会有突破”的他,从中看到“关键的突破点已被找到”。
刘知青把它看作“远超过去”的巨大突破——已公布的五局棋谱,经国内“准一线”棋手察验,质量很高,“虽然离一线水准还有差距,但差距不大”。
具有相当棋力、一直从事“互联网+围棋”的北京万同科技有限公司CEO陈雷注意到,五局棋的对弈时间早于去年11月份的首届世界计算机围棋锦标赛,而彼时的赛后沙龙上,几乎所有计算机围棋技术从业者都相当乐观地认可,计算机棋手平等战胜人类,会在15—20年内发生。其实陈雷在“乐观派”中亦属最乐观的,当时他就认为“10年内必有突破”;但“谷歌默默无闻地做,一下子拿出来”,仍“令人震惊”。
深度神经网络让Alpha Go显著进步
乐观的理由,在于近年来“蒙特卡洛算法”的应用,它在解决围棋盘面“一手棋有多大价值、怎样判断形势优劣”两大核心问题上,比前辈做的都好。
但此次Alpha Go明显更进了一步。刘知青、陈雷介绍,它应用了目前人工智能领域最热门的卷积神经网络技术,能模拟人脑神经元,具有深度学习、主动识别、自适应等功能,在图像处理方面异常强大。
比如,作为其核心的两种深度神经网络“策略网络”(policy network)和 “价值网络”(value network)的成功应用:前者,将盘面落子选点从几百、几十个大大缩减为三五个,逐渐接近职业棋手;后者,也是最难的,在盘面形势判断上,通过职业棋手棋谱的验证、筛选,给出下一步的预判,这比以往基于海量数据的“蒙特卡洛树搜索”(未加任何验证)对职业棋手盘面符合率达到40%—50%要好很多。
在此情况下,专业人士所最担忧的“所有技术开发人员都不知道职业棋手是怎么想的”,似可迎刃而解。
Alpha Go会是另一个“深蓝”吗?
至于令人瞩目的3月份人机约战,包括对计算机围棋最乐观的人在内,迄今没有人明确表示Alpha Go会是另一个“深蓝”。
“具体结果不好说”,刘知青没有明确胜负倾向,但技术发展这么快,看不到“天花板”,“还有两个月时间,谁知道会发生什么”。
余斌、陈雷都看好李世石。作为技术乐观派,陈雷并非唯技术论者:“围棋挑战的不光是智力,而是体现了东方思想精髓。”以“极度定量”方式表达一切的计算机,目前还达不到战胜李世石、柯杰等顶尖棋手的水平。
曾任中科院自动化所所长的中国自动化学会副理事长王飞跃则把即将到来的人机大战看成一次“炒作”,真正公平的设奖博弈,应该是打擂台式的“混选”,而非指定棋手应战。他更认为,在终极意义上,人工智能战胜人类是“伪命题”,因为只要规则明确,计算机围棋战胜人类“是迟早的事情”。