撰写了文章 更新于 2021-03-04 17:22:32
用博弈论解释多人竞技游戏不配合现象(四)
上一节讲到,多次连续博弈如果来不及确定对方的选择,可能会导致不配合现象。这节我想说的是,即便吸取了前三节的教训,给与玩家足够的时间去思考和反应,并且让他们配合多次,依然会有不配合现象存在。
先看上一节的表格:
不配合 | 被动 | 主动 | |
不配合 | (-2,-2) | ||
被动 | (3,2) | ||
主动 | (2,3) |
如果我们能提前知道对方的选择,就不可能在明知道对方选择的情况下选择其他选项。
把收益表简化成如下形式:
观望 | 主动 | |
观望 | (-2,-2) | (3,2) |
主动 | (2,3) | (2,2) |
本来按照上一节的想法,给与他们足够的时间思考之后,配合应该是板上钉钉的事情,(-2,-2)的不配合点看起来没有任何可能达到。实际情况是,双方都可能会期望对方先采取行动,而自己则被动配合,以获得更大的利益。
比如说,LOL中,需要有人在资源团之前抢位置和做视野;CS:GO破点时,需要一个突破手和后续补枪的玩家。
打突破手是相对来说比较容易给别人做嫁衣的,所以他的收益比观望选手的收益低,也就是形如(3,2)。如果都选择全程看戏,则会错失良机,可以用(-2,-2)描述,如果都选择主动则因为距离太近获得(2,2)。
并且这个配合有一个很明显的先后顺序,也就是我知道你选择观望还是主动出击。
举个实际例子(PS:我水平很菜,所以匹配到的队友也很菜,论水平我不配写文章,但是论在遇到的不配合现象的次数,我觉得我还是很有发言权的。)
这是一局真实的官匹鱼塘局,此时双方比分僵持。(在这个地图匪的得分理应高一些,所以匪实际上是弱势的)。匪方的0号选手是一名积极配合的选手——但没人配合他,他被迫在A小等待;另一头,A大的三杆狙连门都没出,6号选手使用的是冲锋枪,也不愿意做马前卒,实际上A点在减员一人后是空的,但是匪方三人显然把突破的损失想得太高了,陷入了一个谁先突破的问题,最后错失进攻良机,白给两杆大狙和一杆连狙。
这样的问题在绝大多数的路人对局之中都会或多或少的存在,我敢说玩过这个游戏的绝大多数玩家都经历过在B通道或者A大门大眼瞪小眼的情况,就是发生概率和僵持持续的时间的问题。下面用博弈论解释一下这个情况:
一旦进入僵持状态,实际上是进入了一个没有先后顺序、不知道对方这一次将如何选择的连续博弈,他的收益表如下:
等待 | 主动 | |
等待 | (-c+x,-c+x) | (v,0) |
主动 | (0,v) | (v/2,v/2) |
解释一下各个符号的意义:
c:都选择等待损失的游戏体验(在这里假设每次等待的损失相同)
v:利益分配中不公的份额,例如(2,3),则是被动收益3-主动收益2=1
x:后续博弈的期望收益
一旦进入这个博弈,意味着双方没有达成纯策略纳什均衡,在不能交流的情况下也不知道对方下一次选择的情况下,考虑混合策略纳什均衡。
假设对方采取等待的概率为p,混合策略纳什均衡存在于玩家不论如何选择收益都相等的点,即等待收益等于主动收益的点:解得玩家选择等待的概率p为:
此时玩家在这次博弈中能获得的期望收益Pt为:
且因为每次的v、c相等,所以这一次的期望收益即为下一次的期望收益
联立以上式子可以求得:
令c=1,以上两个函数的图像如图所示:
图4‑1
横坐标为争夺的利润v,细线表示函数P=F(v),代表观望的概率 ,粗线表示函数Pt=f(v) ,代表玩家的收益,随着争夺的利润v增大,玩家采取不配合的策略的概率将越来越接近1,同时期望收益越来越接近0.5c。
令v=1,以上两个函数的图像如图 4‑2所示:
坐标和函数意义同上。随着c增大,玩家采取不配合的概率减小,同时期望收益越来越接近v/2。
需要注意的有一点,p仅仅是单次的观望概率。只要有一次有一方玩家选择主动则博弈结束,所以实际上陷入长时间僵持的可能性要远小于玩家单次选择观望的概率p。
可以得出的结论是,想要减少不配合的现象,我们可以在不破坏玩家体验的前提下使得他们之间不公的差距v变小,而使得不配合的代价c变大。