在过去的二十年里,用机器算法下国际象棋已经取得了很大进步。1997年,IBM公司的国际象棋程序“深蓝”(Deep Blue)在一场六局的比赛中击败了当时的人类世界冠军卡斯帕罗夫。阿尔法围棋(AlphaGo)则是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司基于“深度学习”开发。2016年3月,阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜;2017年10月,AlphaGo Zero发布,三天内自学了三种不同的棋类游戏,包括国际象棋、围棋和日本将军棋,而且无需人工干预,成为世界上最好的棋类玩家。
经过几十年的发展,人类大师关于棋类游戏的经验都被作为复杂的评估工具编进程序中,表明在下棋中该寻求什么样的有利位置以及避免陷入什么样的不利境地。但以往很多国际象棋程序却天生无视这些原则,给人留下的印象是野蛮粗暴的,这些程序速度快得惊人,但却完全缺乏洞察力。
所有这些都随着机器学习的兴起而改变。AlphaZero通过与自己对弈并根据经验更新神经网络,从而发现了国际象棋的原理,人机并迅速成为史上最好的棋手。它不仅能够轻而易举地击败所有最强大的人类棋手,还能击败当时的计算机国际象棋世界冠军Stockfish。在与Stockfish进行的100场比赛中,AlphaZero取得28胜72平的好成绩,没有输掉一场比赛。
对付人类棋手从来不是阿尔法围棋(AlphaGo)的目的,开发者只是通过围棋来试探它的能力,而研发这一人工智能机器人的最终目的是为了推动社会变革、改变人类命运。在柯洁与阿尔法围棋的围棋人机大战三番棋结束后,阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。阿尔法围棋将进一步探索医疗领域,利用人工智能技术攻克现实现代医学中存在的种种难题。