《闪电战 3》采用神经网络制作AI意味着什么?

0 条评论


  • 3

    aLmac受害者 计算机专业 ps4无望

    吕飞扬叽里呱啦MANYO 赞同

    作为对神经网络有一点研究的人说一下。

    rts和为其相比是有很大区别的,alphago使用的大致是卷积神网络(cnn)+加强学习(reinforcement learning),两者都是神经网络的衍生,前者使用卷积的方法提取棋盘特征;后者大致的思路是先随机选择落子,再根据最后的输赢反过来判断这一步落子的“正确程度”,决定学习的策略。

    使用神经网络或者其他大多数机器学习的方法来进行ai的训练,本质是“根据游戏进行的状态(输入),确定下一个操作是什么(输出)”

    这两种办法之所以能够用在围棋上,围棋的状态容易描述是一个很重要的原因,为期盼一共19*19个交叉点,一个矩阵是能够描述所有的棋局的。而rts则更佳复杂一点,举个例子war3里面两个小兵中间的位置距离为1,也可能为2。而这种细微的差异是否应该作为两种不同的状态来描述。如果是,那么导致的问题是输入的状态太多,或者输入的维度是不确定(即不知道输入数据的长度),输入太多会导致待训练参数过多,难以训练的问题,而输入维度不确定在神经网络的框架目前没有一个十分有效的解决办法;如果认为这种细微的差异应该当作同样的一个状态,那么需要大量的测试以找到最合适的区分两个状态的阈值,而这种做法往往不会在所有的情况下都取得最好的效果。另外,相比于国际象棋和围棋,还有一点很大的不同是信息的不对称性,即对弈各方所掌握的信息是不相同,人类玩家往往利用“经验”来处理各种情况

    类似的,输入的问题也会出现在输出当中

    然后谈一点个人看法,有办法训练出来一个很强的ai虐杀所有职业选手吗,我觉得是有的,但是我觉得是没有意义的事情。面对一个状态最优解是存在的,人类能通过逻辑、经验这样的东西去寻找自己能想到的解法中认为的最优解,这里这个选择的正确性取决的一是主体能想到的解法的集合是否足够大,二是这个判断选择的方法是否合理。按照这样的方法其实这边比拼的就是记忆力\训练样本量和思考能力\计算能力。但是这么做无疑会打击玩家的信心,举个例子,像‘汐’这种跳跃难度设置得十分高得作品,不停的尝试对玩家水平的提升十分有限,玩家难以从成功中获得成就感,而使用按键精灵固定的按键顺序,反而更加容易过关。当然这里的讨论没有考虑rts、moba中一些“神来之笔”的操作。

    打个简单的比方,就像是2000m比赛里面,3号道上的选手骑着摩托车

    以上

    更新于 2017-06-13 09:48:42 3 条评论


  • 1

    Arcadiathe Paymaster

    zka41101959 赞同

    开发者应该是没有做一些具体的技术说明,因此以下回答基本基于主观臆测


    AlphaGO尝试让计算机去理解掌握一些抽象的概念。而这里的AI,他的输入可能就是一些战场上的统计信息,单位信息等等,——否则的话,没道理他不会称呼自己是一个基于深度学习的AI,毕竟NN做游戏AI不是什么新鲜事,上个世纪就有了。所以说和AlphaGO没有任何可比性


    我简单看了这个AI的官方展示,作为一个没有玩过该游戏的玩家,感觉AI的单位操作非常的正常。因此我猜测这可能是一个策略层面上的AI。负责决策单位和整体的行动模式,没有十分具体的操作。这样对人类和AI来说都是扬长避短,但是并没有多大意义

    发布于 2017-06-13 00:59:48 0 条评论


  • 1

    OwenTsai游戏设计,Web开发

    彭达 赞同

    基于竞技层面,并不算有创新,因为暴雪那边已经举办多次这样的比赛了。而意义上讲,我保持怀疑和观望的态度。

    之前说过,RTS游戏中的高等AI设计难度主要在规则的制约上。

    无数程序员为星际争霸开发AI,暴雪甚至举办基于此的比赛,鼓励更高等的人工智能的开发。然而事实上,战略AI无论是开发还是实际使用都有很大的问题。

    首先为了制约AI的信息获取或者说更好地学习人类的策略,人工智能需要和人类玩家有共同的视野范围限制,这意味着程序员要在不知道战场形势的情况下进行编程,编写一系列的逻辑规则编写。这毫无疑问是极其困难的。

    其次,即使规则集极其庞大,AI得以实现和其他玩家的配合、互动、协助和计策,战场局势瞬息万变,如何考虑各种可行策略的权重也是十分复杂的。即使AI具备自主学习的能力,可以模仿玩家的行为动作并加入到自己的决策过程中,但在实际体验效果并不好。

    arcadia 在之前一个问题的评论下说到:对于围棋,人类和算法的输入输出可以保持一致,但是电子游戏不一样。人类接受的是图像和声音,AI大部分则是直接接受游戏里的数据(也有接受图像的,谷歌做过一个ai玩游戏机的项目)。另外AI的输出能力也大于人类,比如控制100个单位分100线发起进攻,人类显然做不到。这之间怎么制定一个公平的规则限制AI的优势就很困难了

    当然如果脱离竞技层面单纯地说AI开发的话,明显我还是对星际争霸那变更感兴趣一些。

    更新于 2017-06-12 20:51:37 0 条评论

  • 登录奶牛关账号即可参与讨论

{{question['follower_count']}} 个玩家关注

...

相关元素

相关游戏

相关问题

钢铁雄心系列从 1 到 4,中国的设定的变化轨迹是怎样的?

6人关注 1个回答

怎么样给文明6设计 经济胜利 的胜利条件?

5人关注 1个回答

《文明:太空》5种结局分别代表怎样的宇宙形态?

6人关注 3个回答