撰写了文章 更新于 2017-06-16 23:25:58
探讨游戏评分系统
评分,不仅仅对于游戏,电影、音乐、书籍、课程等等项目都避免不了这个纯量的评价方式。然而现在大部分游戏测评网站都是简单地模仿电影、书籍单一数字化的评分系统。如果需要通过指标来展示出某个作品的独特性,那么仅仅一个简单的数值无疑难以胜任——无论是游戏、电影、书籍还是其它作品。因此,不同的网站应该设计更加切实的评分系统。
评分系统仅仅是评价系统中的一部分,不过大部分评价系统的组成都是由简单的评分和文本评论组成,其中文本评论的设计几乎无差别。所以本文主要讨论评分系统。
单一分数的评分系统
IMDB的评分系统,满分为10分。图片来源:IMDB
大部分网站采用的评分系统都是使用单一分数的评分系统。比如IMDB、亚马逊。它们基本上以5或者10分为上限值,然后计算用户评分的加权平均作为该项目的评分。假设项目A的得分情况如下:
5分 | 4分 | 3分 | 2分 | 1分 |
10 | 50 | 10 | 0 | 0 |
那么项目A最后的评分即为: (510+450+3*10) / 70 = 4
这种评分方法的优点在于:
- 非常的简单直观,便于用户浏览。
- 评分方式简单,可以积累大量的评分。
- 根据调查,得分越高的商品得低评分的概率会更低。换言之,用户对 4.5 分的项目打分时,会比较倾向于给出5分或者4分的高分。
不过,弊端也很明显:
- 无法对项目评分进行清楚的排序。比如:项目A获得了100份3分评价,平均值为3分;项目B获得了两份评价,一份为5分,一份为1分,平均值也为3分,那么哪一个项目更好呢?单从评分数值难以判断。
当然,有如贝叶斯平均(如IMDB的电影排行榜)、设定需要显示评分的评价数量(如饿了么商家评分)等改进方法。但基本而言,这类方法都是通过一个简单的数字指标来衡量项目的好坏。所以这也就是这种评分方式的最大弊端:
- 仅从单一的数字指标无法得知项目在多方面的表现。
多项指标的评分系统
从课程的知识量、教师参与、趣味性、课程设计等多方面评价课程的评分系统。来源:MOOC学院
对一个项目的评价,例如游戏,可以从不同方面衡量。故事情节、玩法设计、背景音乐、游戏操作、美术绘画等等方面。一个高评分的游戏,用 VA-11 Hall-A 举例:
奶牛关目前统计的评分是 9.1 分。但是用户从这个得分中看不出游戏的价值,或者简单一点说:这个游戏的优势是哪个方面?是故事情节?还是背景音乐?还是美术绘画?如果可以给这个游戏进行多指标的评分,这款游戏可能收到一个这样的评分样本:
故事情节 | 玩法设计 | 背景音乐 | 游戏操作 | 美术绘画 |
9 | 7 | 9 | 7 | 9 |
简单地计算平均数,得到该评分样本最后的值:8.2。
这种评分系统在各类点评/测评网站上非常少见,反而在游戏中有点常用。比如游戏中人物能力的评分(武力、智力、体力、耐力、速度等),常常使用雷达图(Radar Chart)来展示,这样即体现了人物的整体能力,也突出了人物的杰出能力。对游戏的评分来说同理。
显示项目属性的雷达图。来源:rpgmakercentral.com
不过,和单一分数的评分对比,要用户对几个指标进行评分是不是有点麻烦了?经验上来说没有太大影响,饿了么就采用了这种评分系统。
多项指标的评分系统有以下优点:
- 能够直观地反映项目在不同方面的得分,给用户提供多方面的参考。
这种评分系统的问题在于:
- 当全体项目难以找到共有的多项指标时,使用多项指标评分异常麻烦。因为既然要对单一项目的多个指标进行评分,也就需要每个项目都拥有这个指标。但项目种类太多时,很有可能找不到共有的多项指标。比如亚马逊上的商品千千万万,很难找出共有的多项指标。游戏页面的说我们有几个指标,电子设备页面说我们有几个指标,难以统一。
Steam 的评分系统
Steam 的商品页面之一。来源:Steam 商店
直观上看去,Steam 的评分系统看起来似乎非常的简单,由好评程度——「好评如潮」、「特别好评」、「好评」等等简单的指标对游戏评分,就如同单一化评分系统用5、4、3等数值来评价游戏一样。但是 Steam 非常巧妙地将好评程度和标签一起使用,设计出了体现出单一分数和多项指标优点的评分系统。
首先是非常简单、直观的好评程度。
- 等同于按分数指标评价。不过 Steam 在用词上非常的巧妙——「好评如潮」、「非常好评」、「好评」,全都是好评!看起来是不是比单一分数5、4、3更有购买欲望?
- 用户对游戏评分时非常简单,只需要勾选「是否推荐该产品」即可。
Steam 上的游戏种类非常多,难设计出共有的多项指标。不过它非常巧妙的用标签(tag)方式解决了这个问题。一款游戏获得了好评如潮,再次用 VA-11 Hall-A 举例。
VA-11 Hall-A 的 Steam 商店页面。来源:Steam 商店
VA-11 Hall-A 的信息分别是:
- 好评程度:好评如潮
- 标签:Cyberpunk, Visual Novel, Great Soundtrack, Indie.
在用户看来,首先,这是一款「好评如潮」的游戏。然后标签就可以告诉用户这是一款涉及什么的游戏:赛博朋克、视觉小说、优秀音乐、独立游戏。这些标签的作用,其实就相当于多项指标的评分。好评程度与标签的信息在用户方面解读起来就是:这是一款在背景音乐、赛博朋克、独立游戏等方面「好评如潮」的佳作。再结合 Steam 提供的用户文本评论、游戏获奖信息、其它游戏测评媒体的评分等信息,可以说是一个完美督促用户赶快买买买的评价系统。
评分系统的选择
从电影到游戏,单一数值的评分系统非常的流行。很多网站都可能没有考虑清楚,仅仅是IMDB、IGN、豆瓣、亚马逊都在用,那么「我」也用这套评分系统。但是我个人认为,如果从用户的角度和网站的立意来仔细考虑,设计出来的评分系统起码应该有些许变化。对于很多游戏测评网站来说,我觉得一个很好的假设是:假如用户只对 Steam 平台游戏的进行评分,那么积累在「我」网站上的用户评分对于 Steam 上的用户评分来讲,有任何显著的差异吗?
Giligili 1年前
MoeSing [作者] 1年前
Giligili 1年前
发布