人工智能大战李世石 AlphaGo到底是什么？

这几天阿法狗大战李世石的新闻开始刷屏，全世界的目光都聚集在了这场最强人脑和最强大脑之间的PK，在阿法狗连续两三次战胜李世石之后，舆论开始完全倾向人工智能一边，原本预测人脑能取得完胜的我们不得不承认一个残酷的事实，人类最后一项棋牌运动也将被电脑攻陷。那么AlphaGo到底是个什么的怪物呢？

AlphaGo的核心是两种不同的深度神经网络。“策略网络”（policy network）和“值网络”（value network）。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。

其中，“值网络”负责减少搜索的深度——AI会一边推算一边判断局面，局面明显劣势的时候，就直接抛弃某些路线，不用一条道算到黑；而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋，有些棋步是明显不该走的，比如不该随便送子给别人吃。将这些信息放入一个概率函数，AI就不用给每一步以同样的重视程度，而可以重点分析那些有戏的棋着。

人工智能大战李世石AlphaGo到底是啥

AlphaGo利用这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。

更为可拍的是，AlphaGo具备了深度学习能力，这个深度学习是可以不断进化的，学习过的越多，选点的水平就越高，而在选择了有限的点之后，就可以用MCTS （Monte Carlo tree search）来算下去了，求出最优解。AlphaGo可以通过自己与自己下棋从而产生出无数盘棋局。这就好比拥有了一个可以不断自己我学习，从不知疲倦的大脑。

AlphaGo研发有何意义？AlphaGo里面的深度学习、神经网络、MCTS，和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo今天要进入一个新的应用领域，用AlphaGo的底层技术和AlphaGo的团队，应该可以更快更有效地开发出解决方案。简单来说，计算机具备了深度学习能力以后，人类的所有劳动都可以被替代。工厂是无人的，车辆是无人的，飞机是无人的，饭店服务员是机器人，名厨是一台自动烹调的机器，人类只复杂在机器故障或者失灵时候，做人为的干预与检修。而机器给人创造的财富几乎没有上限，只取决于自然资源的多少。或许，电影中虚构的天网系统将在不久的将来成为现实。

人工智能大战李世石 AlphaGo到底是什么？

最新更新