阿尔法狗决定进军星际了,能够训练出实际指挥作战的基层 ...

来源:百度文库 编辑:超级军网 时间:2024/04/29 10:55:28
阿尔法狗指挥一堆大狗二代往前冲,这画面很美啊!当然这个目前肯定是不行的,阿尔法狗的胜利其实并没有突破性,只是在传统搜索算法引入了随机算法,想想当年随机过程这个树上挂着的人远比高树,线性代树,复变函树,抽象代树要少啊!等我把我另外一个帖子里面的内容慢慢转过来哦。阿尔法狗指挥一堆大狗二代往前冲,这画面很美啊!当然这个目前肯定是不行的,阿尔法狗的胜利其实并没有突破性,只是在传统搜索算法引入了随机算法,想想当年随机过程这个树上挂着的人远比高树,线性代树,复变函树,抽象代树要少啊!等我把我另外一个帖子里面的内容慢慢转过来哦。
http://lt.cjdby.net/forum.php?mod=viewthread&tid=2179023&mobile=1

我相信阿尔法狗的基本算法,选择策略已经被大家研究烂了,刚刚才看到阿尔法狗宣布下一步要进军星际,这个再也不是蒙特卡洛树+深度卷积的简单分支判断和舍弃能够做成的,  暂时不明白谷歌要怎么升级阿尔法狗的算法,谷歌设定的情形是用阿尔法狗模仿人类选手的操作来和人类选手作战,并不是阿尔法狗直接操作电脑,甚至开图,那种情形人类早就打不赢了。   
我们要研判一下阿尔法狗如果以人类选手身份打星际它会怎么做,尤其是公平起见,APM就设定在100左右,完全可以让人类一手,战略层面会出现这个场景,阿尔法狗是电脑就用神族把,人类肯定是人族了:

第一层:我们在打作弊二以上的电脑的时候,电脑最难做出的判断是多线骚扰,如果阿尔法狗用六脉神剑,它肯定要进行防守,假设阿尔法狗对各种六脉神剑视频进行了深度学习,知道前期最多损失到多少农民,比如6~8个农民就不行了,但是随着时间推延2~3分钟,哪怕一个先知杀十几个农民人类选手也不在乎,阿尔法狗直接通过你的现场兵力投入的持续时间,尤其是人类选手也在对阿尔法狗进行互骚(这里我们假设阿尔法狗是通过对你现有兵力数量和生产效率的组合可能性进行了遍历),阿尔法狗判定人类选手肯定使用了雅典娜之惊叹,而且很有可能是一名中国籍选手;

第二层:电脑的探路农民终于发现了人类的三基地都是裸开,果断的点掉了正在升级的科技和建筑,准备迅速KO第一个主基,毫无疑问这个时候阿尔法狗对最大弈法值Q的那个边界节点(快速打击对手生产基地)和前驱概率进行累加算出一个值(进行暴兵推第二个基地),再把这个值再置为前驱概率,那么这个时候阿尔狗甚至会放弃掉估值神经网络对风险的预判吗?

第三层:中国选手很很大概率在对战中是使用虚——实——虚迷惑对手,但是对应本局的却是实——虚——实,人类选手这个时候就赌阿尔法狗攻上主基地高地的时候依然无法判断自己是主动万佛朝宗还是雅典娜之惊叹失败之后被迫单矿真善美。。。

只是一个很简单的实例,相信阿尔法狗在这个时间可能认为55%熊已上路,后面要被万佛朝宗爆了,35%自己占优,人类被迫单矿真善美,还有10%的可能性冲不掉高地的房子,被迫转和人类打城市化。如果这个时候谷歌的工程师没有插手,阿尔法狗已经被人类选手这种打法搞懵了
战术场景,阿尔法狗和人类也许会出现另外一个场景,这也是本文的一个新论题,阿尔法狗在其他领域的学习能不能模糊的转换成星际的战术能力(一定要记住,阿尔法狗一点也不懂星际正如它一点也不懂围棋一样,它是在通过深度学习进行策略判断): 1.假设人类选手通过真善美打了出来,双方再次交换变成双矿对双矿,人族10坦克30光头加三四个铁鸦一个运输机(这个搭配不科学,我只是为了方便假设设定的模型),神族被消耗之后,就剩几十个追猎加几个不朽,通过对军事理论和星际兵种的伤害权值,生命值等等,阿尔法狗判断神族占轻骑兵速度优势,但是重骑兵有可能无法在轻骑兵消耗完之前打光对方坦克,双方僵持;   2.人类通过背靠河流架起坦克,阿尔法狗通过搜索人类战争字典,匹配到最大值你这不是准备复制却月阵吗?正好这个时候阿尔法狗已经一只巨像加两个哨兵赶到战场,那么破却月阵必攻击对方柔软的后方,不朽和哨兵骗炮,追猎利用速度优势去后面偷光头强,巨像和坦克就展开BB党的最爱,大和对轰衣阿华(这段是我脑补的)   3.其实这还是人类选手的一个局,他巧妙的利用阿尔法狗的卷积算法进行打分、匹配、选择的固定模式,算定电脑会这样展开兵力,其实人类选手想复制的是亚历山大利用速度,血量优势打赢大流士的那一场经典,其实阿尔法狗也可以学习到这个战例,但是认定条件最多1%,因为位置不对称啊;  4.其实人类选手真实的想法是逆复制亚历山大,人类知道追猎的速度和过河优势,也知道不朽的血量优势,反过来先用包括坦克的所有活力先点追猎,这个时候追猎相当于没有被加强的左翼,遭到了无情的歼灭,这个时候阿尔发狗变成滑铁卢的皇帝陛下, 可能点掉了几个光头强,甚至可能第一时间点掉了运输机,但是怎么也冲不掉中央的英军(攻城坦克),最后被迫撤退,但是巨像被尾随的光头强全歼。。。
以上,我相信肯定发生,而且必然发生,正如科技届人士都在开局认为阿尔法狗必然战胜李,而其他人却相反。当阿尔法狗战胜了李,绝大多数科技届人士都认为其他并不是人工智能的巨大突破,完全是传统蒙特卡洛树+深度卷积。

-------------------------------------------

但是,阿尔法狗就像一个圣斗士,我们人类使用过的招数下一次必然无法再对其有效了,也许克伦威尔的一句战争口号非常对——我们打败国王多数次,他还是国王;国王只要打败我们一次,我们都要被砍头。

所以,现在阿尔法狗进军星级界只是一个噱头,估计天梯上2000分就能把它打出翔来,但是它通过几个月的学习呢?一两年之后的深度学习理论发展呢?

我们无法预测它的发展速度,但是我相信,就在我发帖的这个时间点,必然有一个全身赤裸的男人,随着一道闪电出现在黄世杰家附近。。。。。。。
大家说说,人工智能要胜任基层指挥官,至少要在星际项目上打赢人类,当然为了避免帖子过长很多人没有心思看完,再强调一下,是作为人类身份参赛而不是接管电脑AI,那样的话人类可能连一个农民都杀不了阿尔法狗的。

而且为了打赢人类应该可以分别训练,狗一指挥,狗二后勤,狗三通信,协调,狗四装备整修和人类生产工厂对接,狗五负责简单的军事计算机程序再研发。然后在这个过程中,狗狗们产生了协作性,组织性,还产生了领导狗……

不说了,我发现我宿舍门口也好像有个不穿衣服的男人,现在隔壁老王不穿衣服出来都伴随一道闪电啊……
应该是模拟鼠标键盘,对画面进行实时分析,判断形势,展开战斗。重点是快速分析与判断,做出抉择,肯定不会是比手速。
阿尔法狗指挥班排进攻和防守,很快就会在现实中看到。

别意淫了,现在星际有人工智能AI了。那种微操作,不是人类能达到的。分分钟虐得连你妈都不认得
别意淫了,现在星际有人工智能AI了。那种微操作,不是人类能达到的。分分钟虐得连你妈都不认得
那必然是要限制AI的操作频率,甚至要让人类在操作上占点‘便宜’,这样依靠战术完胜人类才有意义。这个挑战主题是智能,而不是外挂
......
星际争霸向平衡系统优化对电脑有利
然而现实战争情况比星际复杂错综无数倍,光打星际的水平肯定无法做指挥官的,具体的动作事态演绎还现实些,像美帝目前的舰载机自主起降或预设目标的自主攻击,要决定什么时候攻击,攻击到什么程度还要与其他部队怎么配合依然还要人
应该是模拟鼠标键盘,对画面进行实时分析,判断形势,展开战斗。重点是快速分析与判断,做出抉择,肯定不会 ...
这是肯定,红警三就是一个很鲜活的例子
然而现实战争情况比星际复杂错综无数倍,光打星际的水平肯定无法做指挥官的,具体的动作事态演绎还现实些, ...
但是起飞,指挥一堆无人机群攻,做个基层的指挥官可以吗?
别意淫了,现在星际有人工智能AI了。那种微操作,不是人类能达到的。分分钟虐得连你妈都不认得
我很多年前对不看帖就回帖就无力吐槽了
阿尔法狗指挥班排进攻和防守,很快就会在现实中看到。
把大狗二代配给人工智能,也许比人更好。人类就是加强到士官长那样的水平,还是不如了
......
星际争霸向平衡系统优化对电脑有利
恩,基层指挥官面临的局势,和需要的判断就是这样
但是起飞,指挥一堆无人机群攻,做个基层的指挥官可以吗?
可以执行具体事项,比如起飞和降落这种事项或飞到目标区域或对预设目标发射导弹这些较具体事项都可以,但像什么时候起飞,时候降落,朝那个方向飞飞多远,目标预设判断等等这些依然是人在做,这种级别怎么做的了基层指挥官,连战斗机飞行员都不行,也是目前主要做攻击机的原因,不过随着空战远程导弹化以后无人战斗机应该不远,不过要独立指挥还难,与基层指挥官彼此配合人机联合优势互补更容易些,这也是信息化的一环
可以执行具体事项,比如起飞和降落这种事项或飞到目标区域或对预设目标发射导弹这些较具体事项都可以,但 ...
在陆地,我觉得你描述的情形非常适合一个人类班长加一个机器人士官长,指挥一个班的机器人。空战中,人类和机器人互相搭配,貌似更适合人类直接指挥无人机,只是把更多的判断交给无人机?


说到黄世杰,我好像记得合肥的某个电脑培训学校的老总(可能是世杰电脑学校的王世杰),当年住在中科大校园的家属区里,某天晚上在楼下被人趁黑灯瞎火揍了一顿

说到黄世杰,我好像记得合肥的某个电脑培训学校的老总(可能是世杰电脑学校的王世杰),当年住在中科大校园的家属区里,某天晚上在楼下被人趁黑灯瞎火揍了一顿
逸仙润之尊仲尼 发表于 2016-3-20 18:57
在陆地,我觉得你描述的情形非常适合一个人类班长加一个机器人士官长,指挥一个班的机器人。空战中,人类 ...
士官长?不清楚,
不过空战大概就是你说的意思,因为有些战斗是即时的瞬息之间就可能过去了,所以人类给机器下达具体任务后由机器按照预先设置好的判断程序进行即时判断就可以发挥机器反应速度快的特点抓住即时战机。
而人类则在一些突发或状况外做最终抉择,比如飞机出去然后途中发现其他有价值目标是按预先的计划打击原来目标还是优先攻击新目标或对对方实力预料错误或对方有新支援等状况时是继续攻击还是撤退还是拼死打击又或是进攻同时遭受打击是优先防御还是继续进攻打击等等这些这类则由人来决定、

毕竟战场上各种预料不到的突发现象也有许多可以预料但人脑可能反应不及而错失的战况都有
所以就两厢结合、、
就算让阿法狗虚拟一个键盘鼠标信号来操作,并且限制它的“手速”,在操作层面它的优势也是巨大的,它基本不会有无效操作,微操无敌,对于造兵啊,采矿啊什么的时间把握也不是人类能够比的。如果战略层面差不太多,人类怎么赢它?
应该让他尝试挑战《文明》,和电脑拼手速太疯狂了。
阿尔法狗打星际不过就是升级版的疯狂的电脑嘛
我不信电脑还能审时度势,侦查我的打法然后应对。
liuhengwu1985 发表于 2016-3-21 09:50
我不信电脑还能审时度势,侦查我的打法然后应对。
如果你有看比赛或者打比赛的话应该知道,每一个打法极限的时间段能得到什么都有模型的,AI可以侦查图形识别定义你的流派之后就能算出你的极限兵力,而他选择一个不亏的模式的极限运营就好了,至于全图找茬看敌对目标点之类,AI不会输人类的,至于操作,AI就更不会输人类了,反应时间不在一个级别上。
x998877661 发表于 2016-3-22 02:12
如果你有看比赛或者打比赛的话应该知道,每一个打法极限的时间段能得到什么都有模型的,AI可以侦查图形识 ...
我印象里AI都是默认地图全明,星际没打过,魔兽我遇到过最变态的电脑也无非是比较新的战术,比如亡灵一本蜘蛛流爆科技三本爆憎恶和黑鸟之类的,另外就是钱花的比一般的疯狂电脑要快,暴兵爆科技同时进行,不过如果程序做的好一些我相信他们的微操肯定要好于我们的手速,不过说它会审时度势,我还是爆怀疑态度,因为人类虽然有战术思想,但在细节上还是有差异的,说它能准确的判断我的打法仍然表示怀疑,因为我的打法会随时调整的。
我印象里AI都是默认地图全明,星际没打过,魔兽我遇到过最变态的电脑也无非是比较新的战术,比如亡灵一本 ...
游戏自带的ai是另外一回事,开发团队出发点不同和擅长的领悟不同,为ai投的软硬件设备也不同,和alpha go真没什么可比性
士官长?不清楚,
不过空战大概就是你说的意思,因为有些战斗是即时的瞬息之间就可能过去了,所以人类给 ...
那么机器肯定还是可以根据训练,得到卷积回退的答案。它经过大量的学习,完全可以应付任何情况,如果太复杂的情况,正如你所举例的,只有极少数优秀基层指挥官可以胜任,而且这些人类指挥官一旦战死,其指挥能力,作战经验是无法传递到另外一个人类的。
我印象里AI都是默认地图全明,星际没打过,魔兽我遇到过最变态的电脑也无非是比较新的战术,比如亡灵一本 ...
因为阿尔法狗这次,从数学上说,切,毫无新意!但是从实际来说,它通过模仿,学习,现场“训练”,以类似人类的思维打败了人类选手。而你说得很对,为什么要进军星际,就是要再次显示阿尔法狗的现场学习训练能力,在最即时的情况下,用人类的方法打败人类。
就算让阿法狗虚拟一个键盘鼠标信号来操作,并且限制它的“手速”,在操作层面它的优势也是巨大的,它基本不 ...
那么我们可以继续降低它的apm,60,这不能再低了吧?操作对于职业选手已经是劣势了