撰写了文章 更新于 2017-09-25 14:37:05
Steam生态全解读#2+ 9月20日,Steam对差评轰炸做了什么
“我们决定不改变玩家评测游戏的方式,而着重于改变潜在购买者查阅评测数据的方式”
往期传送门:
https://steamcommunity.com/games/593110/announcements/detail/1448326897426987372
9月20日,伴随这篇发文的是一次令人惊喜的改动,甚至可以说是这一年半来评测系统唯一一次几乎让所有人都信服的改革,因此我延后了第三期,专门写写这次变化的意义。
一、“差评轰炸”的官方回应
“评测恶意轰炸是指玩家在非常短的时间内发布大量评测,目的是降低某个游戏的测评分数。与此同时,他们给彼此的评测点赞推荐,而对其他玩家的评测踩低。……一方面,进行轰炸的玩家达成了用户评测的目的:他们发表了自己的意见,告诉大家为什么不应该购买这个游戏。但我们也注意到玩家关注的问题常常与游戏无关。”
http://store.steampowered.com/app/383870/Firewatch/
老例子说腻了,正好借着Steam的新版式,我们换个最近刚撞枪口的Firewatch(看火人),事情经过大致是:知名主播Pewdiepie在直播时说了Nigger(效果大概跟联机时明明可以说‘艹尼玛’对方说了‘支那垃圾’差不多),在网络上引起轩然大波。Firewatch开发团队为此愤愤不平,以版权之名要求pdp下架他做的Firewatch的视频,引发一众粉丝来刷差评。除了近期成为“褒贬不一”之外,Firewatch的总体游戏好评已经被拉到83%。
不过,还记得第一期我们聊过的Steam曾经的评测体系无法防御任何外部冲击吗?刷差评的行为首先在官方来说是难以直接制约的,因为买了就有权评价,当时的Steam也一直没有针对此问题发表意见,我们甚至不知道Steam是否愿意削弱权重;从玩家角度来说,对刷差评的行为我们撑死也只能道德谴责一下,并没有有效抑制刷差评的手段。
大半年过去了,我们终于迎来了官方的回应:
对我来说,Steam此举最大的改革是——终于不再由认真写评测的人为错误买单
二、系统平衡的回归
新增的图表兼顾了效率和公平,不但直接提供给玩家30天内“只看非正常波动期内评测”/“去掉非正常期后的评测”的选择,也总算弥补30天机制牺牲了旧评测曝光的问题,我们可以在新图表中看到完整的过往评测走势——尽管这只是一种间接曝光,但它是目前系统中唯一直接提醒玩家“别忘了首页显示的只有最近30天的评测哦,想了解全貌的话之前还有一大段评测历史呢”的热心小贴士。
当然,了解一项机制好不好不能光看它能发挥出的上限,也要看看下限。在此要特别鸣谢吃鸡,这款游戏火到随时抓它出来当例子,样本都足够丰富……
对于吃鸡来说正常的评测波动被计算为了非正常
这是选择“只看非正常波段”的结果
新改最大的潜在问题就是——30天内对“非正常波动”的判断是否精确,以及这个柱状图对30天以前的差评轰炸还有足够的影响力么?
对于第一个问题,我们还需要再看一个新游戏作为样本(真的,我不是为了安利这个游戏):
http://store.steampowered.com/app/554620/Life_is_Strange_Before_the_Storm/
尽管Steam官方没有公开对于“非正常波动”的算法,通过Firewatch(短期内出现了非正常差评轰炸)、吃鸡(正常波动被判定为非正常)、奇异人生:风暴前夕(它真的很棒……啊不是,30天内的非正常波动判定只有首发几天出现了密集评测),我们可以推测该算法特征如下:
1. 出现黄框的前提仅为30天内出现了密集评测,不单计算差评,且密集程度会跟游戏发售初期比较;
2. 出现黄框并且提示为非正常差评波动,不仅仅需要差评占比为短期内最高、还需要差评数量够高(因为吃鸡卖得太好导致两者都满足,才会出现误判)。
对我来说这种误差是可以接受的,相对谨慎的判定方法降低了冷门游戏被误判的几率,从而保证玩家评测的合理曝光,偶有吃鸡这种例子……它自己首先就是现象级游戏,才会出现极端情况,相信想买它的人也不会在意一两次误判。
对于第二个问题,我们再看一个例子,PAYDAY 2:
可以看到2015年10月有一个密度极高的差评轰炸
诚然,超过30天的差评轰炸已经没办法筛选掉,但是短时间的评测扭曲是可以在柱状图中直观呈现的,不但能展示了游戏的总体好评率有可能被差评轰炸拉低过,还会提醒那些真的很犹豫要不要入手的玩家去了解差评轰炸的原因——比如PAYDAY 2的一天一万篇差评,就是因为加入了开宝箱的氪金机制导致的,柱状图算侧面提醒玩家了。
这也是我认为新机制也保证了公平的原因之一:它不但降低了差评轰炸对游戏的冲击,相应的,游戏的“黑历史”也将垂名千古。
三、长远而深刻的参考价值
仅靠上述合理性,Steam这一改革只能算“信”而不能令人“服”,但官方Blog这段话则真正展现了Steam对评测系统的关注和研究:
划重点:“口碑降低是常态,游戏改动后引起的变化是另外一种影响”
对玩家来说,这段话一下子分清了很多层关系,帮助我们更全面地看待游戏评测:
1. 忠实玩家更倾向于尽早购买游戏,使得游戏刚发售时的口碑存在虚高的可能;
2. 评测系统是有动态平衡机制的,如果早期口碑虚高,使得原本观望的玩家抱持过高期待购买了游戏,差评比重会在之后的时间里逐渐平衡回去;
3. 这意味着,在游戏没有改动(一起排除打折会更严谨)的情况下,口碑在长时间中缓慢降低是常态,如果没有降低,那说明这款游戏是真的好;
4. 在游戏没有改动时不降反升的,不是神作就是发售初期出问题了;
5. 游戏每次改动都有可能引起评测数量和口碑的变化,如果玩家真的想了解最真实的游戏口碑,或者说游戏是在越改越好还是越改越差,不妨结合游戏的更新通知来对比。
从评测数到好评数都严重右肩的神界原罪2,无怪乎创造了今年硬核RPG销量奇迹了
妙啊妙,欢迎大家对号入座。
不仅如此,这段话还值得开发商、发行商们细细品味,开放了这个柱状图的意义远远不止“曝光30天内的差评轰炸”,随便举几个例子:
1. 评测数量的波动是可以侧面反映游戏销量的;
2. 评测数量占销量比的差别可以反映什么样的元素更吸引玩家写评测;
3. 评测波动可以反映什么样的游戏改动更受玩家欢迎;
4. 除了游戏改动以外,运营工作又能如何影响游戏的口碑,宣传工作又能如何影响游戏的评测热度;
5. “运作”出来的口碑能持续多久;
……
鬼知道Darkest Dungeon都经历了什么
我相信还有很多潜在的意义没有被发掘出来,但此处就又显出Steam这次改动除了有效和公平的另一特征了:妥善。高明的改革不在于能影响多少问题,而在通过很小的改革就能影响多少问题。
Steam一度不作为的态度,让我在写前几期的时候态度悲观,这次改革后,我想,大概评测系统是要开始越变越好了吧。
音之幻风 1年前
文章分析不错的。。顺便仍然很好奇最后这图是怎么做才会这样的=ω=。。
Esther [作者] 1年前
发布
fenx 1年前
所谓火不烧到自家房屋是不会着急的,除了Firewatch肯定还有一部分dota2&HL3的原因。仅仅加入一个默认折叠起来的filter,高级用户早都有诸如steamspy等工具不会太care,而初级用户更是连看都不会看的(身旁周围的现实)。言论自由就是吊。不管ALDEN团队背后做了多少备用方案,总之这次官方终于明确了一点:Steam用户评测不是评测游戏本身,而是给游戏连带着开发商发行商网络服务本地化服务等等一套消费体系的打分,哪一环出问题了**欢迎**给不推荐,随意谈吐,以帮助我们log给其他用户,让TA们也来怼。等到生产者那边费劲巴拉修缮好了游戏又有几个人还记得该去修改不推荐,而这之间发行/开发商和用户交流成本Steam并没有做出协调,依旧一副爱咋咋地的样子。反倒越来越多讨好玩家的以及spam游戏越来越多,对于层层不利的门槛不知道真正有想法的开发者们是什么感觉……
顺便…憨厚的gog则是在Review Guidelines里的第一条写道:Your review should focus on your in-game experience only. Let the game stand entirely on its own merits。另外也对Avoid noise措施以及主动移除spam评测做出了说明,风景独好,[spoiler]可惜就是没人[/spoiler]。
Esther [作者] 1年前
fenx 1年前
Esther [作者] 1年前
发布
叽咕 1年前
Esther [作者] 1年前
发布
Rico_Se7en 1年前
Esther [作者] 1年前
发布