撰写了文章 更新于 2018-03-01 19:40:20
Steamspy 使用指南
本来以为这种网站数据一目了然,随便用来着,但是看了一篇文章:
https://zhuanlan.zhihu.com/p/26341317
发现好像有人用这个网站用得有点……呃。于是就写个指南吧。毕竟……是吧?
Steamspy,域名http://steamspy.com/,非Steam旗下网站,而是Sergey Galyonkin利用Steam Web API制作的一个网站,其目的是『为独立游戏开发者、记者、学生等等所有对PC游戏及其现状感兴趣的人提供帮助』。至于Sergey Galyonkin是何许人,嗯,他目前就职于Epic Games,是发行部门的老大。嗯……很有趣,吧?
Steamspy的功能是利用Steam提供的Web API每天拉取数百万个公开用户的资料,并以此估算所有游戏在整个Steam中的销量、玩家、以及地区分布等等。值得一提的是,由于Steam大量私密用户的存在、无法拉取游戏库数据,以及steamspy本身存在的误差,很多本身销量就很低的游戏在数据上会产生较大的偏差。不过好在steamspy本身就会提供一个置信区间,所以考虑到误差之后,数据也就八九不离十了。而且销量高的数据误差往往只会在1%左右——虽然无法保证100%的准确性。
值得注意的一点是,steamspy的数据更新是有周期的。网站每24h进行一次更新,对于每个程序的数据而言,数据来源于3天内的样本;特别地,对于地区数据而言,数据来源于7天内的样本。这也造成了新发售游戏的steamspy非常不准确。而且,steamspy能提供的数据,其实都是昨天统计的数据,因为今天的还在处理中。
由此可见,粗略地讲,steamspy适用于分析发售已经有一段时间、并且拥有人数过万的游戏。否则,误差率会大大增加。
Steamspy的主页下有几个标签页,如图:
依次代表:潮流游戏榜单、近期游戏榜单、即将发布的游戏、游戏时长最多的游戏榜单、YouTube观众最多的榜单,以及Steam数据的图表。
几个榜单无需赘述,也就是TOP100、TOP200、TOPX这样的排序。潮流游戏榜单应该是综合了近期销量、玩家数等等数据的综合榜单,而后面的就是各自标签为标准了。
顺带提一句,不知道某个网站天天发布的trend是基于的同样原理的API和算法,还是说跟steamspy达成了合作?毕竟数字一模一样的估算可是很少见的。而且,steamspy的数据其实是昨天的数据哦,瞎加日期可是不对的。
最后一个Steam数据比较有趣,它记录了Steam游戏数的历史,总体的Steam玩家数据,以及近期一些热门游戏的玩家分布。
侧边栏是一个目录选项,你可以通过这个功能进行筛选。
搜索框匹配的是游戏名称,如果想要找发行商什么的,请用上面的目录功能。
比如下图就是H1Z1的搜索结果。
点进一个游戏页面。嗯,就拿前面这个H1Z1: King of the Kill的页面举例子吧。
点进去是这样的:
左边一长溜的文本。最上方显示的(Steam商店、论坛、SteamDB相应页面、官网)的超链接。然后就是开发商、发行商、分类、语言、标签、目录、发布日期、售价、用户评分排名、用户评分、旧版用户评分、拥有者数量、2周内玩家数量、总玩家数、昨日最高同时在线玩家数、YouTube数据、2周内游戏时间(分为平均数和中位数)、总体游戏时间(也分为平均数和中位数)。
右边则是一系列标签,点开会有非常直观的表格。这几个标签依次是拥有人数目(以及价格变化)、拥有人数目的变化(也就是于前一天拥有人数的差值)、2周内玩家数(包括平均游戏时间和中位数游戏时间的变化)、总玩家数(包括平均游戏时间和中位数游戏时间的变化)、每日最高CCU(同时在线玩家数)、每小时最高CCU、每日Twitch数据(观众和频道数)、每小时Twitch数据(观众和频道数)、Youtube数据(观看人数和视频数)、用户评测、类似的游戏、相关的游戏(拥有该游戏用户库存里其他游戏的榜单)、地区分布(拥有者和玩家数目)、总游玩时间分布图、2周内游玩时间分布图。
判断一个游戏的近期销量走势,只需要第一个标签就可以。Steamspy会有近三个月的每日销量柱状图。
再比如,判断一个游戏的玩家活跃度如何,只许看每日的最高CCU即可。而每小时CCU则可以稍微用于判断地区的分布。
或者可以看看2周内玩家数,也是一个比较好的数据,而且还额外标注出玩家投入的时间,参考价值比较大。需要注意的是这个数据是对过去2周内玩家的统计,所以存在一定的滞后性。
至于Twitch和YouTube,不存在的,反正国内没人关心。
值得一提的是,如果你没有登录该网站的话,那么你只能获取以上这些标签距今20天内的数据。而下面这个『地区分布』,则是不登录无法看到的数据。
(幸亏我早就注册了一个如何注册帐号这么简单的事情,就不用多说了吧)
仍然是拿这个H1Z1: King of the Kill的数据做例子。我们可以清楚地从图中看到不同的国家(别数了,30个)以及剩下其他国家的拥有者和玩家数量。『拥有者』和在Steam上买了这个游戏的人数不一样,因为游戏有可能那个有零售key、众筹key等等不在Steam上销售的渠道,所以Steam销量只会比这个低。同样要注意到的是,这个数据可能是有误差的。
根据这个表,我们可以获取到很多的信息。比如那篇文章关注的国区销量,我们可以通过这个数字推算一二。
玩家数为5008296正负64858,也就是 4943438到5073154之间。那么国区的拥有者(并不能直接称为销量)为,16.16%*4943438=798859.5808和16.16%*5073154= 819821.6864之间。考虑到16.16只有四个有效数字,所以国区拥有此游戏的人数应该在79.88万-81.98万之间。
2周内玩家数为1416703正负34655,也就是1382048和 1451358之间。同理,国区2周内玩家数为(过程略)44.57W-46.80W之间。
再看看开头提到的文章,估计了三个月内国区销量增长150W套,2周内玩家数量100W。
我觉得这是有可能的。考虑到steamspy一再提到自己数字有误差,即便置信区间可能有90%甚至更高,我们不妨假设steamspy的数据出了大篓子,误差竟然达到了两倍,那么拥有者160W的数据以及2周内玩家90W这个数据。考虑到数据的浮动,就两个数据就变得非常接近了。这肯定不是巧合,而是steamspy出了错。
以后再也不用它了。垃圾。
参考资料:
Yoge 1年前
超有用der~
发布
封神冥月 1年前
厉害厉害~标题图厉害,内容也厉害
哈哈,谢谢分享,学习了~
发布
晓荼 1年前
吼,兹瓷!
发布
大黄 1年前
大概是因为国外真的很重视读图教育来着?
我是说读这些统计图表内的数量多少和变化趋势 然后进而分析出背后的原因 以及整个市场的需求及反应
考过IELTS的小伙儿们肯定都知道图表作文这个东西233333
发布
心空妙有 1年前
我只想说,看看人家的的老大。还是发行部的,简直兼顾了数据组的活了~~~~
发布
迦叶 1年前
发布
Doom Liang 1年前
发布
金不换 1年前
收藏
发布
fenx 1年前
发布
jins1018 1年前
感觉写得。。。很好玩呢,如果数据能够得到有效支撑的话,用来分析真是非常有用了。
发布
呆呆 1年前
发布