这几天阿法狗大战李世石的新闻开始刷屏,全世界的目光都聚集在了这场最强人脑和最强大脑之间的PK,在阿法狗连续两三次战胜李世石之后,舆论开始完全倾向人工智能一边,原本预测人脑能取得完胜的我们不得不承认一个残酷的事实,人类最后一项棋牌运动也将被电脑攻陷。那么AlphaGo到底是个什么的怪物呢?

AlphaGo的核心是两种不同的深度神经网络。“策略网络”(policy network)和“值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

人工智能大战李世石AlphaGo到底是啥

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

更为可拍的是,AlphaGo具备了深度学习能力,这个深度学习是可以不断进化的,学习过的越多,选点的水平就越高,而在选择了有限的点之后,就可以用MCTS (Monte Carlo tree search)来算下去了,求出最优解。AlphaGo可以通过自己与自己下棋从而产生出无数盘棋局。这就好比拥有了一个可以不断自己我学习,从不知疲倦的大脑。

AlphaGo研发有何意义?AlphaGo里面的深度学习、神经网络、MCTS,和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo今天要进入一个新的应用领域,用AlphaGo的底层技术和AlphaGo的团队,应该可以更快更有效地开发出解决方案。简单来说,计算机具备了深度学习能力以后,人类的所有劳动都可以被替代。工厂是无人的,车辆是无人的,飞机是无人的,饭店服务员是机器人,名厨是一台自动烹调的机器,人类只复杂在机器故障或者失灵时候,做人为的干预与检修。而机器给人创造的财富几乎没有上限,只取决于自然资源的多少。或许,电影中虚构的天网系统将在不久的将来成为现实。