极客数码,专为Geeker推荐好玩的极客数码产品、创意数码产品

AlphaGo VS 李世石九段:人机世纪大战观看指南

2016-03-09 01:30 浏览: 693402 views 我要评论(0 条) 字号:

1997 年,IBM 超级计算机「 深蓝 」3 比 2 取胜国际象棋冠军卡斯帕罗夫,这被认作人类计算机发展史上的一大里程碑事件。


十九年后,Google 人工智能( AI )程序「 AlphaGo 」已经杀入对弈难度更大的围棋战场,并将与世界围棋冠军李世石九段在 2016 年 3 月 9 日到 15 日进行本世代的「 人机大战 」。


作为一项延续 4000 多年的人类智力游戏,围棋被视作世界上最复杂的棋盘游戏,也是目前仅有的一项人脑能够战胜电脑的棋类运动。


人机大战一触即发,抢先奉上观看指南。

AlphaGo 什么来头?

AlphaGo 是一款围棋人工智能程序,由位于英国伦敦的 DeepMind( Google 旗下公司)团队历时两年开发而成。相比于二十年前战胜国际象棋冠军的 IBM 超级计算机「 深蓝 」,AlphaGo 现在想要打败围棋选手依然困难得多。

国际象棋中,平均每回合有 35 种可能,一盘棋可以有 80 回合;而围棋每回合有 250 种可能,一盘棋可以长达 150 回合。所以围棋最大有 3^361 种局面,换算一下大致是 10^170。国际象棋最大只有 2^155 种局面,大致是 10^47,而已知宇宙中原子的数量为 10^80。

面对围棋中如此巨大的运算量( 10^170 ),靠电脑机械列出所有可能方案,再形成树形地图的传统做法,不仅效率低而且无法延续下去。

直到 Google 下属的 DeepMind 团队找到了「 深度学习(Deep Learning)」的终极杀器。「 深度学习」是人工智能(AI)领域当下最为热门的研究领域。

具体到 AlphaGo 上,「 深度学习」的能力就是利用「 价值网络( value network ) 」去计算局面,然后再用「 策略网络( policy network )」去选择下子。「  价值网络 」和「 策略网络 」是两种不同的深度神经网络,并且共同构成了 AlphaGo 的「 大脑 」。


▲ AlphaGo 的两种深度神经网络结构示意图

围棋过程中,AlphaGo 的「 大脑 」可以模拟人脑先「 筛选 」出那些有利的棋局,并「 抛弃 」掉明显的差棋,从而将计算量控制在AlphaGo 「 大脑 」可以完成的范围内。具体来看:

1.「 价值网络 」负责减少搜索的深度:AI 会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。

2.「 策略网络 」负责减少搜索的宽度:面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。

3.利用蒙特卡洛拟合,将这些信息放入一个概率函数,AI 就不用给每一步以同样的重视程度,而可以重点分析那些能赢的棋步。

需要说明的是,人脑不可能像电脑一样无时不刻地接受「 深度学习 」,所以理论上来说只要 AlphaGo 经历了足够的训练,就能击败所有的人类围棋选手。


Google 在 今年 1 月对外宣布,AlphaGo 于去年 10 月战胜了樊麾二段,后者已经连续三年获得欧洲围棋冠军。需要强调的是,AlphaGo 是在没有任何让子的情况下以 5:0 完胜樊麾的,这也是电脑第一次在公开比赛上战胜职业围棋选手。


▲ AlphaGo 与樊麾二段的 5 局较量

战胜樊麾二段后,AlphaGo 一鼓作气将李世石九段定为「 终极 PK 」的目标,犹如二十年前「 深蓝 」将对决选手锁定国际象棋冠军卡斯帕罗夫一样。

李世石有多厉害?

李世石是韩国围棋九段棋手,这一段位已是专业围棋棋手中的最高级别。


李世石 1995 年入段,1998 年升为二段,1999 年升为三段。2003 年初因获得 LG 杯冠军,直接升为六段;同年 4 月获得韩国 KT 杯亚军,升为七段;当年 7 月再夺富士通杯冠军,直接升为九段。

自 2002 年首次加冕富士通杯以来,李世石在最近十多年时间中共获得了 14 个世界冠军,是世界棋坛最近十年获得世界第一头衔最多的职业棋手。

据悉,李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用「 稳、准、狠 」来形容,经常能在劣势下完成逆转。

需要说明的是,李世石九段刚刚在农心杯三国围棋擂台赛上败给来自中国的小将柯洁九段,后者对其战绩为 8 胜 2 负。 Google 方面表示,如果李世石最初不同意参加与 AlphaGo 的人机大战,就会考虑让柯洁顶替。

人机世纪大战比赛日程

AlphaGo 与李世石九段的人机世纪大战由 Google 牵头安排,正式比赛会在韩国首尔的四季酒店举行。

具体赛程安排如下:

3 月 9 日 (星期三):首场比赛;
3 月 10 日(星期四):第二场比赛;
3 月 12 日(星期六):第三场比赛;
3 月 13 日(星期日):第四场比赛;
3 月 15 日(星期二):第五场比赛。

每日开赛时间均为北京时间中午 12 点。比赛采用贴 7.5 目的中国规则( 比赛结束时,后走棋的棋手贴目)。每位棋手各有两个小时布局时间,3 次 60 秒的读秒,每场比赛预计需要大约 4 到 5 个小时。

人机世纪大战的获胜方将得到 Google 赞助的 100 万美元奖金。如果 AlphaGo 获胜,奖金将捐赠给联合国儿童基金会( UNICEF )、STEM 教育计划以及围棋慈善机构 Go Charity。

围棋的入门知识

一、围棋的棋局

围棋由棋盘和棋子共同组成。棋盘由纵横各十九条等距离、垂直交叉的平行线构成。形成 361 个交叉点( 简称为「 点 」 )。在棋盘上标有九个小圆点,称作「 星 」。中央的星又称「 天元 」,如下图所示:


棋子分黑白两色,正式比赛以黑、白各 180 子为宜。

二、围棋的下法

1.对局双方各执一色棋子;
2.空枰( 棋盘没有棋子 )开局;
3.黑先白后,交替着一子于棋盘的点上;
4.棋子下定后,不再向其他点移动;
5.轮流下子是双方的权利,但允许任何一方放弃下子权而使用虚着。

三、围棋的几个关键词

1.棋子的气

一个棋子在棋盘上,与它直线紧邻的空点是这个棋子的「 气 」。

直线紧邻的点上如果有同色棋子存在,这些棋子就相互连接成一个不可分割的整体。

直线紧邻的点上如果有异色棋子存在,此处的气便不存在。棋子如失去所有的气,就不能在棋盘上存在。

2.提子

把无气之子清理出棋盘的手段叫「 提子 」。

提子有二种情况:下子后,对方棋子无气,应立即提取对方无气之子;下子后,双方棋子都呈无气状态,应立即提取对方无气之子。

3.禁着点

棋盘上的任何一点,如某方下子后,该子立即呈无气状态,同时又不能提取对方的棋子。这个点叫做「 禁着点 」。如下图的 A 点都是黑方的禁着点。


4.计算胜负

着子完毕的棋局,采用数子法计算胜负。

将双方死子清理出盘外后,对任意一方的活棋和活棋围住的点以子为单位进行计数。双方活棋之间的空点各得一半。

棋盘总点数的一半 180.5 点为归本数。一方总得点数超过此数为胜,等于此数为和,小于此数为负。

5.贴 7.5 目的中国规则

由于黑棋先走,故而在布局上占有一定的优势。公平起见,最后在计算双方所占有的点数时,黑棋需要扣减一定的目数或子数。

中国规则为 7.5 目的大贴目规则,即黑棋最后贴还 3.75 子。日本和韩国为贴 6.5 目规则。

PS:尾巴们可在评论区对人机世纪大战的胜负做出预测哦!

(图片来源:Reuters、AFP、Nature,部分资料引用自果壳


网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复