评论 3

正直的香蕉君 1年前

第一点,增强学习和神经网络没有直接联系,不是衍生算法,深度增强算法的话是深度学习和增强学习的结合。

第二点,如果是开发者要训练AI,不会拿图像作为输入的,维度太高了,游戏的内部信息抽特征。游戏的AI的目的不是为了像Alpha GO一样达到人类玩游戏的水平,不过是有类似的工作的,比如用深度增强学习去玩DOOM,以及 multi-agent 的深度增强学习打 RTS 是有的。

aL [作者] 1年前

@正直的香蕉君 ‍ 我大概吧增强学习理解为训练的策略0 0。对于第二点,我并没有说用图像作为输入,而是想说这个输入是很难找到的

正直的香蕉君 1年前

@aL ‍ 直接拿坐标之类的就好,用神经网络来作为Q函数或者value函数就好,维度的问题可以用这种 approximate function 来模拟,现在的 DRL 就在做这种工作。

登录奶牛关账号即可参与讨论