首先,请允许我回答一下囚徒困境是什么。
让我们假设一下,任天堂的马里奥和路易由于犯罪被关在两间牢房中,他们无法彼此进行交流。紧接着,检察官向马里奥提供了一条信息,同时告诉他路易也会知晓这条信息。该信息是这样的:
- 如果你揭发了对方的罪行但是对方拒不承认的话,你会被无罪释放,对方会被判入狱5年;
- 如果双方都不揭发对方,检察官可以凭手中的证据让双方都入狱1年;
- 如果双方都选择揭发对方的罪行,那么双方就都会入狱3年。
对于马里奥或者路易而言,最好的策略都是举报对方。但是事实上,如果他们都选择了对于自己来说的最佳策略,也就是都揭发对方,那么他们就都会入狱3年,两个人加起来一共入狱6年,这代价是比任何一种方案都要多的。但是如果他们选择一种更为天真的策略,即双方都不揭发对方,整体效果反而比之前的策略好得多。
为了清晰起见,我们把囚徒困境中的收益结构整理如下:
- 揭发对方的诱惑:无罪释放
- 双方共同合作的奖励:每个人入狱1年
- 双方都揭发对方的惩罚:每个人入狱3年
- 倒霉蛋的收益(由于对方不合作导致自食苦果):入狱5年
坐牢时间的长短并不重要,重要的是坐牢时间会随着“诱惑>奖励>惩罚>倒霉蛋”的层级上升。只要这个层级存在,那么对于每一个人而言的个人最佳策略永远都会低于两人合作带来的收益。但是信任对方是有风险的,这就是一种真正的两难境地。
Fullerton认为这种困境可以激发玩家之间的尔虞我诈或者相互合作等。如果可能的话,你甚至可以把这种抛给玩家的困境作为游戏的核心玩法之一,但是确保困境能与游戏的目标性保持一致。
综上所述,囚徒困境的应用关键并非创造一个多么困难的、包含道德和戏剧性元素的抉择,而是创造一个如上文所述的收益层级。
在一次全球开发者大会GDC上,Radical Entertainment公司的Steve Bocska将囚徒困境中的收益层级应用在一个游戏概念设计中。这个游戏是这样的:两名玩家允许在一个在线游戏中进行物品交易,但是进行交易的物品需要支付高额运输费用8000 USD。同时玩家可以选择购买传输器,这种机器可以瞬间传送物品到达目的地,不需要支付运输费用。传输器的价格是5000 USD,但是必须交易双方都购买了传输器才可以。
对于一名玩家而言,最好的交易就是双方都有传输器,这样就能省下运输费用。但是一旦交易对方没有购买传输器而玩家先购买了,那么玩家就亏了5000美元,并且仍然要支付8000 USD的运输费。
大家可以使用收益矩阵进行分析,对比马里奥和路易的情况,你们很容易就能列出矩阵。
这只是一个简单的囚徒困境的变形应用。事实上在游戏中,两难困境和囚徒困境被广泛使用,给玩家制造一种复杂的游戏体验。甚至有的游戏将囚徒困境运用作为游戏的核心机制。当你遇到需要决策的状况时,试着分析一下这个决策是否存在一个收益层级符合本文列举的层级关系,或者符合类似的收益矩阵。如果是的话,就可以认定为是囚徒困境的应用了。
补充一下,关于决策与运筹,可以参看一些相关书籍,利用相关理论进行分析。这里推荐一门学科,是设计和工科都要学的,Operation Research,国内译为运筹学。