从阿尔法狗、斯坦诺维奇到芒格（一）：大白话告诉你阿尔法狗为什么这么牛

2017-01-20 11:48:00

本文将用三篇独立篇幅来描述我最近一段时间以来的的思维成果。也许到了第三篇才能真正明白我到底想说什么。没关系，我保证每篇单独看也是有干货的。

神秘高手Master横扫围棋界

从2016年的12月29日晚上登录奕城，到1月4日晚上古力投子认输，去年4:1战胜李世石的阿尔法狗化名“Master”横扫当世中日韩几乎所有顶级围棋高手。其中包括当今围棋武林超一流高手的“北乔峰”柯洁和“南慕容”朴廷桓，以及古力、常昊等十多位武林一流高手。虽已退隐江湖，但是战力比照少林寺方丈级别的“棋圣”聂卫平也是它的手下败将。 1月4日古力以2目半告负那场也是Master取得的第60连胜。总战绩 60胜1平0负。唯一“没赢”的一盘，结果还是因为当时掉线了，结果下午双方再战，Master继续连胜。

柯洁在赛后的微博

尽管很多棋迷面对人类被碾压的赛果很不服气，依然对中国“第一人”柯洁和阿尔法狗的新一轮人机大战很期待。还有不少棋迷认为，Master一直是以快棋挑战人类高手，在人机对弈中，这对人类来说或许有点不公平。人类应该由多名顶尖高手“组团”，采取超慢棋的规则，和阿尔法狗来一场“公平对决”。如果允许人类长时间思考，Master或许就能被战胜。据说有消息称今年谷歌也会正式调整柯洁。

不过在我看来，那句“李世石是最后一个战胜过AI的人类”非常大的几率一定会成为现实。从对战角度来看，不论是快棋慢棋还是人类组团对抗，几乎不太可能战胜阿尔法狗了。也就是说不论是站着打坐着打梅花桩上打还是单挑天罡北斗阵，阿尔法狗基本以后都会是不败的位置了（参考鼎盛期的郭靖单挑几百人的天罡大阵）。

为什么这么说？这就要说到阿尔法狗的成长路径了。

用人话简单告诉你阿尔法狗是怎么成为东方不败的

第一招：拜古今中外的人类高手为师——深度卷积神经网络
这玩意儿的逻辑说白了就是把人类选手的对弈的棋局作为样本作为AI的学习对象（大约3000万个样本），然后通过不断练习，从而获得成长。这个原理也跟1997年战胜国际象棋世界第一卡斯帕罗夫的计算机深蓝的原理是接近的。

但是！实战中此方案的战力并不怎么样。阿尔法狗的主要研发者黄士杰博士说这个方案基本可以和业余6级的人类选手互有胜负，离顶级高手的水平非常远。

第二招：自创武功——蒙特卡洛搜索树

这招是黄博士的老师Remi Coulum的理论突破。

这招跟前面第一招最大的区别是：完全不以人类的过往经验为参照！
基本逻辑就是一开始只输入围棋的基本规则，然后让电脑开始随机模拟每一种每一步的落子方案。而最终获胜的落子方案得分就会增加一点点。随着模拟的棋局下得越来越多，那些看起来不错的落子方案的分数就会越来越高，而这些落子方案越是有前途，就会被更多的选中进行推演，于是最有“前途”的落子方法就会“涌现”出来。

所以在于人类对战时，看起来阿尔法狗只走了一步，其实背后可能已经下了上十万甚至更多局棋了。最关键的是，这种大智若愚的方式完全脱离了人类过去的围棋世界观。所以柯洁才说“人类几千年的实战演练都是错的”。AI通过这种方式，仅凭对于基本规则和计算能力可以下出人类想都没有想过的新套路。也就说达到传说中的“无招胜有招”的境界了

第三招：左右互搏——自我博弈
虽然蒙特卡洛搜索树很牛逼了，但是还是需要依赖深度学习，才能让AI达到更高的水平。但是与人类博弈或者单纯地模拟棋局还是成长得太慢，所以黄博士他们的办法是：自我博弈。你可以想象一下，AI左右互搏一个人分成两个人对打练习，然后就会不断的自我进化。

终上所述，阿尔法狗的原理基本就是深度学习+蒙特卡洛搜索树+自我进化。

为什么说人类不太可能赢过AI了

只有我觉得黄博士这个笑容很诡异吗？

从上一段的原理可以得出看出来，阿尔法狗到底是怎么战胜所有人类高手的？

第一：对于仅仅基本规则的掌握和庞大模拟计算能力带来是阿尔法狗的套路会完全超出人类现存积累的所有套路、棋谱、范式以及最根本的：对于围棋的理解。本质上人类高手去比拼的时候比的也是计算能力，一如当初吴清源初到日本时一鸣惊人的原因一样。只有能够计算并下出到对手算不到的可能性的人，才会获胜。而在蒙特卡洛搜索树面前，人类以为的可能性只是计算知晓的可能性的小小一部分。而随着模拟和实战次数的上升，这个差距只会越来越大。

第二：阿尔法狗的学习方式是自我博弈和深度学习。而人类的学习方式和速度基于大自然给与的天然限制在这点上也几乎是确定不可能再战胜AI了。

所以我到底想说什么

将来在所有的人工智能开发领域，可以预见的是几乎所有AI都会使用类似蒙特卡洛搜索树、自我博弈和深度学习这些原理。而依赖这种快速、深度、自我学习的方式以及强大模拟计算能力下的AI，在任何单独的领域，人工智能几乎都会比人类做的好。

对人类来说，最大的问题并不是继续纠结人工智能时代会不会到来，人工智能会不会有自我意识或者奴役人类这些问题了。而是我们如何在一个与人工智能共存的时代生存。

初步可以预见的变化是：

与机器对话的语言系统（并不一定是目前编程语言的形态）成为所有人的必修课。

与机器对话将不仅仅是程序员的工作，而是每个人都要学习的。电气化时代会有人不懂基本电学原理吗？改革开放之后英语成为高考必考科目。2010年后大概没几个人说不会上网了。而到了今天，连我爸都会用微信找我要红包了。

单一的技能、单一思维模式下的人一定会被淘汰。

2016年1月10日又爆出新消息，美国德州扑克AI已经在一对一的无限注德州扑克中赢过人类。某种意义上来说，它比阿尔法狗更厉害。因为德州扑克相比围棋，是一个非完美信息博弈。也就是说需要每一步的时候都需要计算机临时做出马上反应。也就是我们通常说的——“直觉”。
下一个人类被AI打败的领域会是哪个？不知道，也无所谓。因为所有领域都很快会有新的人工智能产生，包括很多人认为计算机无法染指的艺术领域。如果你还是坚守着一门手艺，一个职能或者某一门特定学科背景下的思维方式，在你所在领域被AI超过后，你将如何自处？“在拿锤子的人眼里，世界所有问题都是一颗钉子”，人工智能时代不是钉子没了或者锤的姿势变了，是锤子没了。

人类目前花费四分之一、三分之一时间的学习方式也一定会被淘汰。

> 漫长的幼崽期、基于工业时代过于细分的学科体系及教育制度、人脑的天然限制，这些综合起来让我们每个人需要花费了20-30年的时间在学习。而后续的自我学习则受制于许许多多客观因素，也无法与人工智能 加速学习 的模式相提并论。

我知道你们想问什么：那到底该怎么办？难道就等着当AI的电池？大学也不用上了？现在也干脆不用学习，不用努力工作了吧，反正会被淘汰。坦白说，我也无法给出一个一劳永逸的对策。（之前有期待的读者你们太瞧得起我了）。但是在我的认知里有两件事是相对确定的：

首先，冷静下来。人工智能和人类并不是相对立和互相取代的关系

> 区别于多数科幻电影的恐慌，凯文·凯利在《必然》发布会聊到这个话题的时候说：人工智能与人类一定是相互合作的关系。 因为人工智能互相拥有对方不具备的东西。 埃隆·马斯克也说“如果不能战胜他们，那就加入他们”。 人机共生 是更加可能的状态。

充分发挥人类区别于人工智能的优势

> 那么人类到底拥有什么人工智能不具备的？> 首先是跨越并综合系统一与系统二的思维方式。（卡尼曼《思考，快与慢》）人类可以随时在直觉与深度思考之间，情感与理性之间迅速选择最合理的解决问题的路径；> 其次是跨越多种学科门槛，通过联想、跳跃、迁移，也就是非线性的方式去学习，最终达到超越具体学科知识点本身，对这个世界形成一种哲学层面的认知。这也是人工智能基本不可能获得或者短时间内获得的能力。

预告：下一篇我们要讲讲“人类目前的认知和学习模式还有什么样的问题”这件事儿。

以上

从阿尔法狗、斯坦诺维奇到芒格（一）：大白话告诉你阿尔法狗为什么这么牛

神秘高手Master横扫围棋界

用人话简单告诉你阿尔法狗是怎么成为东方不败的

为什么说人类不太可能赢过AI了

所以我到底想说什么

相关文章