撰写了文章 更新于 2017-08-23 16:03:52
Steam评测生态全解读#1 Steam的评测机制
旧文章发表在VG上——《是什么导致了Steam评测的乱象丛生》
http://www.vgtime.com/topic/742309.jhtml
出乎意料收到了超过400条评论,里边有不少值得反思和补充的部分,所以我决定重写一遍。这篇原文可以作为主题的参考, 但因为拆成多篇后修改和新加内容较多,所以原文也就仅作为一篇参考了。
前言
不到一年前,Steam评测还仅仅是一小撮核心用户在意的话题;而这短短不到一年里,国区Steam就经历了用户数翻倍、FM2017中文神教起源、尼尔涨价波及SE游戏全线被刷差评等各具代表性的事件,而Steam的评测、尤其是中文评测生态也就随之成了越来越多人关注的问题。
我是在2014年11月27日注册的Steam,在2015年因为《Life Is Strange 奇异人生》而开始活跃写评测,在一年的时间里写了大约100篇评测,也是在那段时期对Steam的评测环境有过比较深入的思考。后来由于工作,较少再自己动笔,但是之前的经历让我一直记得Steam评测体系对Steam游戏、开发商、发行商和玩家整体的巨大影响力,所以一直比较关注评测生态的变化。
很多朋友应该都已经意识到Steam的评测生态似乎走到了一个路口,一个一叶障目的路口,我们都知道未来不管是Steam的机制(甚至管理方式)还是玩家的习性都会迎来更多变化,但没有人清楚究竟会如何变化。或者说,我们连当下混乱的生态都理不清楚,又怎么预见未来呢?
写《Steam评测生态全解读》意在和更多朋友分享如今这个生态下一些鲜有人知的信息和理解,但我的能力还不足以给出最终的结论,只作抛砖引玉。
一、Steam的评测机制
(一)、评分二元制——非好即差
一切起源于Steam采用的二元制评分系统。尽管Steam使用“推荐”、“不推荐”作为谨慎的措辞,只要Steam一天以好评差评比来计算游戏的最终好评率,作为显现在外的“分数”,它们就和传统的好差评价值等同。
严格来说,以Steam目前对评测系统的定位,使用“推荐/不推荐”其实比“好评/差评”更加不严谨。在最终定性一样事物是好是坏时,引导人们说出主体的“我推荐/不推荐”要比说客体“它好/坏”更容易提醒大家采用主观观点,除此之外,Steam的许多其他举措也证明了他们是倾向于让玩家更多表达对游戏的主观感受的。那么问题来了——你想表达自己对一样产品的主观感受时,能有多少次明确觉得你想要【推荐它/不推荐它】而不觉得两者都有点勉强的?
“它还不错吧,虽然有点问题,但是我觉得我还能接受……可是我也不知道其他人会不会觉得这难接受。其实我也不知道我喜欢的地方其他人怎么看?”
这种代表性和分界功能的缺失是无法单靠机制的动态平衡来解决的,比如,虽然当一款游戏好评过多后会有更多玩家产生写差评的意愿来平衡,但这只能简单地平滑最极端的情况,绝大多数游戏还是处在评价失衡的状态,尽管很多游戏所承受的比较轻微。
“推荐/不推荐”的另一问题在于它比“好/坏”多了一分由我推荐的责任感。诚然,这种责任负担十分轻微,否则也不会有那么多毫无负担的抖机灵和中文神教了,但对活跃写评测的玩家来说,“评测到底该更主观还是更客观”几乎是所有人都必然会遇到的终极迷思。Steam的这一措辞非但没能起到正确的引导作用,还带来了一些不必要的迷惑性。
2016年2月,有人在奶牛关上提出了“One Finger Death Punch 为什么能有高达98%的好评率?”一问,我曾基于当时的评测环境写过一篇回答,以下为节选:
完整版见:https://cowlevel.net/question/154/answer/357
当时我认为Steam的二元制评分利远大于弊,玩家们更倾向于看具体评测(而且玩家还可以在评测里给出自己的数字评分)、商店页面能关联评测网站评分,最重要的是给了许多独立游戏出头的机会。
现在自己把脸扇肿了。
独立游戏早就不是上架一批新的就带来一批新玩法的那个时期了,玩家评测里的好评和差评也不再那么纯粹基于游戏好玩与否,二元制的弊端日渐明显。又或者说,目前这个二元制最大的问题在于时代差异,而非机制本身的问题。2016年我们还总嘲笑Steam小作坊,2017年,Steam毫无疑问已经是当前数字游戏发行平台的一头巨鳄,正如Steam Dev Days 2016上他们自己所说的一样:“我们在多年前使用的小规模、小作坊管理模式已经跟不上今天庞大的需求了。”
尽管Steam短期内不像是要改成自由数字评分或者五星评级之类的样子,至少,加个中评也能先平衡一下虚高虚低,被无中文差评也不会显得那么难看不是。
(二)、反馈三元制——赞、踩还是欢乐
最开始“欢乐”可以跟“赞/踩”兼容,也就是玩家可以给一篇评测点“赞/踩”的同时再点一个“欢乐”,改版以后就其他两者互斥且单独计算热度了。
“欢乐”独立于评测价值计分外,单独计算热度
一个槽点略大的细节是改版时,Steam追溯调整了所有旧评测,把跟“赞/踩”同时选择了的“欢乐”都归为“欢乐”,并扣除原评测中相应“赞/踩”数量——早在15年Steam加入“欢乐”选项时就有过争议,不少玩家认为Steam更该改进的是二元评分,而且,“欢乐”的加入还可能让更多玩家为了获得“欢乐”而写一些哗众取宠却没有实际参考意义的内容。(导演,给他们多加几个鸡腿!)
对此Steam的回答是我的内心毫无波动,甚至让你们的评测都欢乐喜+1,赞数悲-1。
有的评测“欢乐”数几乎跟“赞/踩”持平,而个别抖机灵的评测可能“欢乐”远高于后者
从Steam自身角度来解读其推行“欢乐”选项的决心,Steam目前对评测系统“玩家参与度”的需求远大于“参与质量”。或者说,结合 Steam决心打造无人工干扰的商店系统(算法推荐、算法投放、算法排行……)来看就能明白G胖对自家算法绝对的自信,这套系统里唯一的参与者是玩家,先尽量让所有用户都参与到各大社区模块中再考虑参与质量的问题。
再看对用户的影响, 无非大家都是小白鼠,Steam预先选择牺牲当下这部分评测用户的体验来摸索改革的方向。 先把大的算法框架架起来,哪些细节出问题了再改进算法——Steam一贯的逻辑,理性、干脆,尽管这次应用在了一块感性而人文的领域。
这种一刀切和先放任再修正的做法,简单省事富有效率,但是舍弃了公平,所有的风险和负面体验都转嫁到了玩家身上。我们没办法指责Steam这么做错了,不过,相比起强大的社区功能,Steam的管理能力确实一直都还蹲在起跑线上。
(三)、算法排序——神秘的热度算法
有了“欢乐”选项,现在我们知道为什么抖机灵那么有市场了。
一些原本不跟评测互动的玩家可能在戳到笑点后点个“欢乐”还在其次,根本在于一些在原本只有“赞/踩”来表示“是否有价值”的评测不再属于“没有价值”的范畴,进入了“欢乐”的避风港。
某不具名吃鸡游戏之前最热的两篇评测
Steam的评测热度算法一直很神秘,如今多了一个“欢乐”,估算起来就更复杂了。目前基本可以确定的只有,当评测时间等其他变量一致时:
①权重基于互动数计算,这意味着被点“踩”其实也计分
②但显然“踩”的权重较低,所以价值比率低的评测会掉到比它互动数低的高有价率游戏后,最终可能因此被沉
③评测回复数可能不计入互动数,也有可能只是权重太低
④虽然无法确认“欢乐”和“赞”的权重到底一不一样,但肯定不会低多少
另一层面,这种计算方式在根本上注定了Steam的评测生态防御不了任何一种外部因素的影响,任何一篇评测都有可能因为在Steam以外的地方引起某个话题而受到各种互动形式上的冲击。
这一点就解释了中文神教的生命力,首先“没有中文就说明你们不重视中国市场Steam给了我们差评的权利所以刷死你”的逻辑在目前不少国内群体里大行其道,所以每当新的靶子出现时这些群体就会在Steam外(主要集中在Steam外部)快速传播,一方面有人快速产出大量“没中文就差评”的评测,另一方面更多人在为这些评测点赞。最后还覆盖到了一些不在他们群体里的、对这个问题想不太明白的玩家,觉得好像挺有道理的就跟着点赞了,其中又有一些人点着点着就加入了那些群体,日渐壮大。
举个尼尔事件的衍生例子:
礼貌起见码掉了评测者信息
问题不仅仅在于玩家可能会因为外部原因写出特定评测,还在于有的玩家可能会因为外部原因而报复性地给评测者其他评测按“踩”,乃至其他恶性行为。以暴制暴虽然解气,终究是错的,都践行着对Steam评测规则的破坏。
还有一个小问题值得思考:到底怎么确定破坏规则的边界呢?
如果因为尼尔事件而来给LIS差评毫无疑问是一种破坏,那么因为有人这么做所以为了提升LIS好评率而专门去给好评的行为,又该如何定义?是Steam机制所允许的自我纠正或者说“动态平衡”吗?好像是的,就像如果一篇评测被恶意踩多了总会有另一批原本不太互动的人突然愿意点赞一样。那这种动态平衡究竟延展到哪一层才叫迈入破坏的界限呢?
我想不明白。也许症结在于,我们该学着从一开始就避免第一个错误的发生吧。
【本篇完(中文神教是题外话,在最后)】
简单的后记:
这是我第一次正式在文章里谈Steam的不足之处,我在老文章下看到一些质疑的声音问我是不是收钱了专门来黑Steam的,看得我一愣,我还真不知道怎么辩解比较妥当。欲加之罪何患无辞,这也是我那么讨厌诛心的原因,因为没办法反驳,因为对方从一开始就单方面给事情定了性。
我挺难用语言来表达我对Steam的热爱,它是一切的开始,既是独立游戏能有今天的直接原因,也是我能走到今天的根本原因,它曾经是一面标志着电子游戏自由、公平、勃勃生机的旗帜。我的游戏信仰里永远有Steam的影子。
但是我的喜爱不会影响我对它的反思,过去的、整体的好无法开脱当下的、部分的恶,咱们就事论事。
当然,我也希望大家在了解Steam走了这么多弯路以后还能喜欢它,我不敢说我还全然信任Steam能打造一个公平的盛世,但它一定还能变得更加辉煌。
另外,下次第二篇的主题为“如何理解评测机制的改革”,一起回顾评测计分标准、时效性、不足10篇不算分数等改革。
——————————————————————————————————————————
最后聊聊中文神教
“没有中文就说明你们不重视中国市场Steam给了我们差评的权利所以刷死你” 的逻辑:
1. 使用权利和滥用权利是两回事,前者合理,后者暴力。制度基础在于Steam目前还没有建立新规则来修复这种过于受外部干扰的漏洞,但就像游戏外挂一样,开发者还没BAN,不代表使用外挂的人就是有理的,尤其是在多人游戏中。
2. 关于“是否重视中国市场”的问题,作为亲手接触过本地化的前发行工作者,我可以很负责地说:本地化是一个很复杂而且牵扯到多方沟通、多方管理的过程,时间、精力、金钱的耗费都远超想象,真不是想做就能做的。
然后简单回答几个问题:
① 都有那么多民间汉化组已经汉化过了,直接把文本丢进去不行吗?
不行。因为开发者自己没有能力检验汉化质量,而专门聘请人来校对汉化质量的成本并不会比直接雇佣汉化团队汉化省钱,所以开发者不愿意直接加入民间汉化文本不是不负责,往往是因为太想要对自己的游戏负责。宁缺毋滥。
② 那就找人做汉化啊,其实那几个机翻组织的做法不是很高效吗,先机翻一遍再润色一下,很快就能出质量不错的汉化组啊?
做不到。所以那些机翻汉化组才会一直做不了商业汉化组。商业汉化组织往往有严格的汉化流程,有良心的也绝对不会做机翻了然后润色的事情。同时因为有时候开发者没办法很好地跟汉化组沟通(比如其实汉化组英文只够基本交流但是聊不清楚细节)导致流程中各种出错、返工等等,所以不但耗时很长,游戏方其实还需要有专人对接汉化问题,占用精力也很多。
③ 但是还是有的官方中文跟机翻似的啊?就这质量还好意思说很花功夫?
对,因为有些商业汉化组就是坑,不幸的是开发者们不懂中文,所以被骗了是不知道的,对方跟他们说做得很辛苦或者很花时间他们只能相信。更加不幸的是,汉化费用很高很高,就算大厂也不是能随便说给就给的,换言之,自己选错的汉化组跪着也要发布。这是商业汉化市场混乱带来的问题,短期内除非出现游戏圈的商翻巨头一统天下否则很难快速规范,我们制止不了一些人想要多捞油水的心。
④ 有的开发者自己说是怕汉化了收不回本的问题啊,国区卖那么多了还不做不就是不重视中国市场?
不完全,很可能是他们自己也缺乏对本地化工作的认知,以为有钱就能做。
首先需要有合适的汉化资源,其次需要游戏团队里有人有精力负责,同时并不是所有游戏的框架都随时支持新加入语言,某些游戏要加新的语言也许需要大量技术活,这意味着汉化工作不是随时想开始就能开始的。谨慎起见,很少有游戏团队愿意承诺还没开始做的事情,所以很多时候只是目前还没有能力做而未来有可能会做,不能一竿子打死人家说就不做了。
极少数还是会有像Darkest Dungeon那样的团队愿意提前公开“想要做中文本地化”的意愿的,瞧瞧人家的下场,转眼就被传为“出新DLC了就出中文”然后因为一个莫须有的承诺被差评刷了个底朝天。这件事情发生以后谁还有勇气提前表态?
⑤ 首发有中文不就没那么多破事了?
游戏开发是有滞后性的,这半年来国区Steam消费力猛增不代表中文化能同步响应,人家游戏早都做好了。就算是半年以后,也还有大量的游戏没时间没精力没钱首发中文,不过相应的,如果那时候游戏框架还不做得方便加新语言一点就是真傻了。
顺带一提,这个月新游戏自带中文的已经是以前好多倍了,未来会更多的。
⑥ 说这么多都在给游戏厂商洗地!难道他们就一点错也没有吗?中文神教确实让中文游戏变多了,我们就一点对都没有吗?
当然有大大小小的错,当然也有个别游戏可能就是耍流氓,就是不重视中国市场是有钱有时间有精力就不做是承诺了还不出中文,但它们不能代表所有游戏。每个游戏都是不同的个体,都可能有自己的特殊情况,逻辑不能简单套用,不出的一概都是“不重视中国市场”这种诛心之论更没必要。
对,中文神教通过网络暴力的方式激化了中文本地化的矛盾,使得各国游戏对中文化的重视达到了前所未有的高度,这么做的代价就是中国这些玩家们强制把风险和责任都推到了游戏厂商身上——刚才我们已经分析过Steam把风险转嫁给玩家的不好之处,现在我们知道了,不平衡的关系总归是会带来更多问题的,也许就在明天,也许在多年以后。
目录
Rico_Se7en 1年前
Esther [作者] 1年前
Rico_Se7en 1年前
2 “反应怎么样?啥?全是感谢?没人说质量不好?”
3 “这种质量也没人喷 这钱真好赚 继续抢下一个首发吧 谁还填坑呢”
蒋学驽 1年前
这人居然把文本写在代码里……其实是不良的代码习惯(或没经验)导致,跟只有一个程序员无关……
Rico_Se7en 1年前
发布
星一 1年前
类似的也是抖机灵,尽管有社区在,但是大多数玩家还是只看中文的……所以游戏相关的在steam内会看的大多是中文测评,互动也从社区转移到了测评,测评的功能就从单一的评价变成了一个探讨的区域。
不过到底有没有必要做出一个纯净的测评?我觉得未必吧。纯粹的测评虽然给购买带来了很大的便利,但也把很多普通玩家挡在了测评之外(因为懒,或者觉得自己相比之下没那个能力)。
说到底steam并不是一个专业评分平台,而是和消费者直接挂钩的平台,重点或许还是在大众的倾向,某种程度和您说的《我是歌手》类似……(如果我没理解错的话oao)
专业的评价可以看鉴赏家,而大众的评价我觉得要改进的还是二元评价。欢乐我甚至觉得也不用改……就算去掉了,大家也还是会为抖机灵点「赞」,与其不明白「这到底赞在哪了!」还不如看得清楚点「又是个段子啊」。不过直接把赞和欢乐归到欢乐真是够流氓的……
主观和客观真的很多启发!感谢您。
Esther [作者] 1年前
发布
Arcadia 1年前
Esther [作者] 1年前
Arcadia 1年前
Esther [作者] 1年前
发布
Harrix 1年前
Esther [作者] 1年前
发布
luckylimio 1年前
我对中文神教的感觉大概是这样的。
那种销量非常大,评分较多的热门游戏,教徒po教条,也不会在意,总归霸不了屏~
至于,喝醉了,跑一个冷门独立游戏那里,也po教条,甚至给个差评,就过分了......
还好后者也不常见~
发布