重磅！曝新阿尔法或自学围棋不再喂人类棋谱

来源：百度文库编辑：超级军网时间：2024/05/03 10:56:45

http://xw.qq.com/sports/20160311035432

腾讯体育3月11日讯 3月10日，李世石输掉了人机大战的第二局，0-2落后，赛前豪言的5-0或4-1成了泡影，现在棋迷最担心的是他被阿尔法零封。对于第二局比赛，有些职业棋手认为李世石至少有两处应该选择做劫抗争，因为没有出现他们认为的打劫，就有了“保密协议规定不能打劫”的猜测，如果是真，正如常昊九段所言“下的不是同一种围棋了”。
　　11日一早，台湾围棋推广协会副秘书长张晓茵透露，阿尔法（AlphaGo）的开发者之一，来自中国台湾的Aja Huang在台湾书呆弈讨论区公开发文回应：没有此协议，请尊重李世石。随后，晓茵的朋友圈透露一个更令人吃惊和期待的消息：新的阿尔法将不再学习人类棋谱，而是自我学习围棋！
　　这一消息，张晓茵是从她哥哥张怀一的脸书文章中看到的。张怀一是台湾职业棋手，当年来大陆学棋，跟古力、谢赫是同学好友。
　　据了解，谷歌所属的Deepmind公司接下来会做这样一个实验：开发一个新的阿尔法，不“喂”它任何人类的棋谱，从零开始，只让它在自我对弈的纯实战中学习提高。也就是说，新的阿尔法不学人类，完全“创造”自己的围棋下法。如果在这种情况下战胜人类，那么阿尔法真的可以当人类的围棋老师了！

http://xw.qq.com/sports/20160311035432

腾讯体育3月11日讯 3月10日，李世石输掉了人机大战的第二局，0-2落后，赛前豪言的5-0或4-1成了泡影，现在棋迷最担心的是他被阿尔法零封。对于第二局比赛，有些职业棋手认为李世石至少有两处应该选择做劫抗争，因为没有出现他们认为的打劫，就有了“保密协议规定不能打劫”的猜测，如果是真，正如常昊九段所言“下的不是同一种围棋了”。
　　11日一早，台湾围棋推广协会副秘书长张晓茵透露，阿尔法（AlphaGo）的开发者之一，来自中国台湾的Aja Huang在台湾书呆弈讨论区公开发文回应：没有此协议，请尊重李世石。随后，晓茵的朋友圈透露一个更令人吃惊和期待的消息：新的阿尔法将不再学习人类棋谱，而是自我学习围棋！
　　这一消息，张晓茵是从她哥哥张怀一的脸书文章中看到的。张怀一是台湾职业棋手，当年来大陆学棋，跟古力、谢赫是同学好友。
　　据了解，谷歌所属的Deepmind公司接下来会做这样一个实验：开发一个新的阿尔法，不“喂”它任何人类的棋谱，从零开始，只让它在自我对弈的纯实战中学习提高。也就是说，新的阿尔法不学人类，完全“创造”自己的围棋下法。如果在这种情况下战胜人类，那么阿尔法真的可以当人类的围棋老师了！

大概再等一年多的时间，就会有纯自学版的Alphago面世了，很好奇新版本能达到什么水平。对检验算法来说意义巨大，对人工智能也是非常重要的一步。

……首先你要有一台性能足够好的超算

……首先你要有一台性能足够好的超算

不需要超算，目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。

Gunslinger 发表于 2016-3-11 18:47
不需要超算，目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。
主要是能拿来training的样本都是会下棋的人下的，
而完全靠自学的话，要走不少弯路。

主要是能拿来training的样本都是会下棋的人下的，
而完全靠自学的话，要走不少弯路。
完全自学也有可能跳出一些目前人类下围棋的局限性，不管怎么样结果应该都很有趣。

不需要超算，目前运行Alphago的硬件计算能力很普通。

不过超算应该能加速自学进程。
几千台机器，很普通？

几千台机器，很普通？
传说是2000个gpu。类比一下64个线程的E7也得30多个。

softy 发表于 2016-3-11 12:47
几千台机器，很普通？
几千台机器...单单是Google所拥有的就超过一百万台服务器。如果你用亚马逊的云服务，你也可以随时拥有一个几万核心的机器。

核动力坦克发表于 2016-3-12 02:08
传说是2000个gpu。类比一下64个线程的E7也得30多个。
是每个GPU都顶30个E7

general_j 发表于 2016-3-12 02:15
几千台机器...单单是Google所拥有的就超过一百万台服务器。如果你用亚马逊的云服务，你也可以随时拥有一 ...
虚拟的几万核心其实没用，算法信息交换的延迟就把性能拖下来了。
谷歌有超过1万台专用于机器学习训练算法的主机，每台挂8个GPU。对应一般的机器学习算法每个GPU相当于几十个至强CPU的能力。现在只是不知道分了多少资源给AlphaGo。

用的是集群，具体调用多少台，看google的分配。

求软件编法

自学?能吗？

虚拟的几万核心其实没用，算法信息交换的延迟就把性能拖下来了。
谷歌有超过1万台专用于机器学习训练算 ...
收敛过程中可能动用的资源多，因为主要手段是左右互搏，而且要速度。
拿来和人下，用已经收敛的程序，可能相对来说真用不了多少计算能力。

是另外一台阿尔法狗的版本吧

熊首督军发表于 2016-3-12 09:54
用的是集群，具体调用多少台，看google的分配。
体系化的节奏

拿來作兵棋推演司令。

重磅！曝新阿尔法或自学围棋不再喂人类棋谱今天阿尔法狗围棋赢了李世石人类输了！围棋电脑1-0李世石我比阿尔法狗聪明：从围棋看中国上古历史中国新武器让F-35不再强大或逼美削减订货请问阿尔法什么时候进货或更新网站？沉船重磅文章出来了，新京报！快节奏生活加速人类进化未来或产生新物种法媒：新化石或证明"露西"并非人类唯一祖先南非发现新人种遗骸：或改变人类对祖先认知阿尔法面对谷歌围棋AI，人类最后的智力骄傲即将崩塌

重磅！曝新阿尔法或自学围棋 不再喂人类棋谱

重磅！曝新阿尔法或自学围棋不再喂人类棋谱