重磅!曝新阿尔法或自学围棋 不再喂人类棋谱

来源:百度文库 编辑:超级军网 时间:2024/05/03 10:56:45
http://xw.qq.com/sports/20160311035432

腾讯体育3月11日讯 3月10日,李世石输掉了人机大战的第二局,0-2落后,赛前豪言的5-0或4-1成了泡影,现在棋迷最担心的是他被阿尔法零封。对于第二局比赛,有些职业棋手认为李世石至少有两处应该选择做劫抗争,因为没有出现他们认为的打劫,就有了“保密协议规定不能打劫”的猜测,如果是真,正如常昊九段所言“下的不是同一种围棋了”。
  11日一早,台湾围棋推广协会副秘书长张晓茵透露,阿尔法(AlphaGo)的开发者之一,来自中国台湾的Aja Huang在台湾书呆弈讨论区公开发文回应:没有此协议,请尊重李世石。随后,晓茵的朋友圈透露一个更令人吃惊和期待的消息:新的阿尔法将不再学习人类棋谱,而是自我学习围棋!
  这一消息,张晓茵是从她哥哥张怀一的脸书文章中看到的。张怀一是台湾职业棋手,当年来大陆学棋,跟古力、谢赫是同学好友。
  据了解,谷歌所属的Deepmind公司接下来会做这样一个实验:开发一个新的阿尔法,不“喂”它任何人类的棋谱,从零开始,只让它在自我对弈的纯实战中学习提高。也就是说,新的阿尔法不学人类,完全“创造”自己的围棋下法。如果在这种情况下战胜人类,那么阿尔法真的可以当人类的围棋老师了!

http://xw.qq.com/sports/20160311035432

腾讯体育3月11日讯 3月10日,李世石输掉了人机大战的第二局,0-2落后,赛前豪言的5-0或4-1成了泡影,现在棋迷最担心的是他被阿尔法零封。对于第二局比赛,有些职业棋手认为李世石至少有两处应该选择做劫抗争,因为没有出现他们认为的打劫,就有了“保密协议规定不能打劫”的猜测,如果是真,正如常昊九段所言“下的不是同一种围棋了”。
  11日一早,台湾围棋推广协会副秘书长张晓茵透露,阿尔法(AlphaGo)的开发者之一,来自中国台湾的Aja Huang在台湾书呆弈讨论区公开发文回应:没有此协议,请尊重李世石。随后,晓茵的朋友圈透露一个更令人吃惊和期待的消息:新的阿尔法将不再学习人类棋谱,而是自我学习围棋!
  这一消息,张晓茵是从她哥哥张怀一的脸书文章中看到的。张怀一是台湾职业棋手,当年来大陆学棋,跟古力、谢赫是同学好友。
  据了解,谷歌所属的Deepmind公司接下来会做这样一个实验:开发一个新的阿尔法,不“喂”它任何人类的棋谱,从零开始,只让它在自我对弈的纯实战中学习提高。也就是说,新的阿尔法不学人类,完全“创造”自己的围棋下法。如果在这种情况下战胜人类,那么阿尔法真的可以当人类的围棋老师了!

大概再等一年多的时间,就会有纯自学版的Alphago面世了,很好奇新版本能达到什么水平。对检验算法来说意义巨大,对人工智能也是非常重要的一步。
……首先你要有一台性能足够好的超算
……首先你要有一台性能足够好的超算

不需要超算,目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。
Gunslinger 发表于 2016-3-11 18:47
不需要超算,目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。
主要是能拿来training的样本都是会下棋的人下的,
而完全靠自学的话,要走不少弯路。
主要是能拿来training的样本都是会下棋的人下的,
而完全靠自学的话,要走不少弯路。
完全自学也有可能跳出一些目前人类下围棋的局限性,不管怎么样结果应该都很有趣。
不需要超算,目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。
几千台机器,很普通?
几千台机器,很普通?
传说是2000个gpu。类比一下64个线程的E7也得30多个。
softy 发表于 2016-3-11 12:47
几千台机器,很普通?
几千台机器...单单是Google所拥有的就超过一百万台服务器。如果你用亚马逊的云服务,你也可以随时拥有一个几万核心的机器。
核动力坦克 发表于 2016-3-12 02:08
传说是2000个gpu。类比一下64个线程的E7也得30多个。
是每个GPU都顶30个E7
general_j 发表于 2016-3-12 02:15
几千台机器...单单是Google所拥有的就超过一百万台服务器。如果你用亚马逊的云服务,你也可以随时拥有一 ...
虚拟的几万核心其实没用,算法信息交换的延迟就把性能拖下来了。
谷歌有超过1万台专用于机器学习训练算法的主机,每台挂8个GPU。对应一般的机器学习算法每个GPU相当于几十个至强CPU的能力。现在只是不知道分了多少资源给AlphaGo。





用的是集群,具体调用多少台,看google的分配。
求软件编法
自学?能吗?
虚拟的几万核心其实没用,算法信息交换的延迟就把性能拖下来了。
谷歌有超过1万台专用于机器学习训练算 ...
收敛过程中可能动用的资源多,因为主要手段是左右互搏,而且要速度。
拿来和人下,用已经收敛的程序,可能相对来说真用不了多少计算能力。
是另外一台阿尔法狗的版本吧
熊首督军 发表于 2016-3-12 09:54
用的是集群,具体调用多少台,看google的分配。
体系化的节奏
拿來作兵棋推演司令。