首先深度学习=深度神经网络。
传统普通的游戏AI以我个人的理解就是写一些固定的算法(例如贪心法等)来让游戏中的一个agent做出一些决策和操作。 这方面我也没太多研究,仅供参考。
而以机器学习(包含深度学习)为主的方法,我们也称之为data-driven的方法,既数据驱动,简单说也就是通过庞大的数据量来学习一个最有可能接近胜利的决策(如围棋的AlphaGo)。更进一步,在训练中利用损失函数来表示预测结果和所期望的结果的差,然后将这个差值反传到模型中并更新模型的权重,不断迭代至收敛,最终得到一个训练好的模型。然后对任何情况,将该情况量化并作为向量输入到模型中,得到一个输出向量作为决策,这样的决策可以让AI能更接近胜利。
跟传统方法的比较也就是,传统方法局限性非常大,一个普通的算法很难在一个复杂的场景下考虑到所有可能并计算出最优解,而给模型一个目标损失函数,然后通过不断的自我训练,更新自身的能力来尽可能的达到胜利,但其内部如何进行决策都是一个black box,无论开发者还是用户都无从得知它会得到什么结果,而传统方法开发者可以清楚知道AI做出的任一个决策,都是如何推导出来的。
