“人类棋手的棋力会有一定程度的上下波动,她大约是业余5-6到职业1-2段的范围,我现在对阿尔法狗的判断,差不多在职业一段。这是个历史性的突破。”
黄士杰分析了一番,看了刚刚两人的对局,他感觉自己的业余6段确实稍微有点水分。
“虽然她还没有定段成功,但这相当程度上是由于华国女子棋手名额的限制。”孟繁岐出言解释道:“前面许多年,都是只进两个名额,我听说今年可能有些变化。总体来说,战鹰虽然没有定段,但这也算是半个职业棋手输给围棋智能了,算半个历史性时刻。”
黄士杰和戴密斯听了之后都哈哈大笑,点头称是。
“我们可以提前约一下樊麾二段了,他是去年欧洲围棋冠军。”孟繁岐推荐道,他想要尽量加快阿尔法狗的节奏。“我们一会讨论更新一版本之后,可能一周的时间,战鹰就很难再跟得上阿尔法狗的节奏了。”
阿尔法狗初版的能力,比孟繁岐预期要高不少。
这里主要是因为孟繁岐的轻量级网络,节约了大量计算资源给搜索方法那边。
前面说到,一个19x19的矩阵可以用来表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。
可以用[-1,0,1]三个数字来指代。
但单独只使用一个这样的矩阵是不够的。
还需要其他相同形状的矩阵来表达其他常用的判断信息,比如棋子的“气”。
在阿尔法狗中,这里采用了48个[19x19]的矩阵输入,这让本身对棋了解不大够的孟繁岐大开眼界。
“目前阶段,我们就是使用海量的落子数据,不断让网络逼近人类的落子位置。可以说,这一版本的阿尔法狗只是先得到了一个模仿人类模仿得非常好的模型。”
“单独只是这个策略网络的话,棋力大概elo评分在2000左右,还有很大的不足。”
孟繁岐微微点头,第一流棋手的棋力大约在elo评分3600左右。
2000分确实还差得远,战鹰此时的初段水平大概是在2500-2600左右。
这版本的阿尔法狗主要是策略网络+走子验算,两者结合之下,将分数从2000提高到了与战鹰相若的水平。
这个所谓的策略网络,其实和孟繁岐最初参加竞赛的图像分类十分相似,原理都差不多。
让孟繁岐走上世界舞台的IMAGE千分类图像竞赛,需要网络判断,给定的图像是1000个中的哪一个类别。
也就是说,网络会返回一个长度为1000的数组,告诉你每一个对应类别的概率是多少,这1000个概率加起来就是百分之一百。
而这个策略网络,其实也可以看做是19x19,也就是361分类问题。
每一类,意味着在对应的点上下棋的概率。
当然了,围棋不比普通图像分类,棋盘上哪里可以落子哪里不可以,还有一定的讲究。
先不说气还是什么其他的,至少原本有子的地方,你不可以继续去落。
因此,也需要专门引入规则,对这些地方进行判断,把这些落子点,排除在外。
网络计算了输入的棋盘现状之后,就会返回一个[19x19]的矩阵。
这361个概率之和也同样为百分之一百,后来常见的围棋AI,大都会把概率最大的五个又或者是十个点标注出来。
并用颜色深浅来区分这里落子的概率。
所谓的AI一选二选,也就是围棋智能面对当前局面,返回的棋盘矩阵当中,概率最大的两个数字的对应位置。