撰写了文章 更新于 2020-12-14 09:57:31
一个 UXer 眼中的音游玩法设计
由于某个契机,想聊聊音游的现状、发展历程,再尝试用交互元素去理解玩法设计。分析部门着重在触屏手游,关注音游玩法本身,涉及养成、动作等融合玩法不多展开。
本文全长 5433 字,预计阅读耗时 15 分钟。建议在 Wi-Fi 环境下浏览,便于搜索游戏案例视频对照查看。
1. 概述
音乐游戏(英语:music game,缩写MUG、日语:音楽ゲーム,缩写音ゲー)是一种游戏类型。在音乐游戏中,玩家需要配合音乐节奏、根据视觉提示做出正确的反应。通常,玩家的反应和节奏越吻合,得分越高。
根据音符和判定的区别,有下落式、出现式、单轨式三种主流玩法。
- 下落式音游:指音符/Note沿单一方向移动至判定区的音游,绝大多数音游目前都属于此类。
- 轨道/Key:指下落式音游中音符在抵达判定区前的运动区域。下落式一般是固定数量的直线轨道固定数目,如老O2Jam为定轨7K,节奏大师的经典模式为滑轨4-6K等。部分音游会出现有规律的变轨,如Tapsonic TOP中就有变轨音符;甚至还有虽然有轨道,但轨道会不规则变化的音游VOEZ。
- 无轨:指仅有判定线,而音符不会按照固定数目轨道下落的音乐游戏,如Deemo、Noah's Bottle等。
- 出现式/展现式音游:指Note在特定位置和时间点出现的音游,如Cytus系列、Tone Sphere、osu!STD、jubeat等。
- 单轨音游:指只有一个判定点,Note 大体上在单一轨道上以流水线形式排列并流向判定点的音乐游戏,一般伴随着 Note 需要以规定的方式进行击打或者 Note 有自己的想法的操作。代表作为太鼓之达人、Groove Coaster、R2Beat(QQ音速)等。
引自萌娘百科(https://zh.moegirl.org.cn)。
通过这些定义,我们可以判断「某某是滑轨下落式」「某某是出现式」。但音游为什么长这样?还是先回顾下历史吧。
2. 硬件发展和音游形态的演变
2.1 起源
实体映射、单轨式、下落式、音轨和音符、一维谱面
萌生音游雏形的上世纪 70-90 时代,大家对于玩法的想象,更多基于实体概念映射(琴键)和硬件形态。公认第一款音游——1996 年索尼在 PS 平台发行的《PaRappa The Rapper》,在类似五线谱横轴的单音轨上、把 PS 手柄上的按键当作音符敲击。这便是单轨式音游。
https://www.bilibili.com/video/BV18x411W7ks
(牛关暂时无法解析B站视频,只能大家自行跳转链接观看了)
由于个人 PC 尚未普及,音游也同其他游戏类型一样,主要载体为家用机和街机,IO 设备特征为显示器 + 定制化的少量按键。在《PaRappa》次年,KONAMI 发行街机《Beatmania》,直接采用了钢琴意象🎹,将实体键位设计成「下三白键 + 上二黑键 + DJ 圆碟」。模仿五线谱的音轨进一步优化,旋转 90° 与屏幕底部的实体按键相接,统一底部为判定区。低认知门槛、音符与按键在视觉上的亲密性,让玩家非常容易上手。mania 很快火遍全球,奠定了下落式玩法的基础,确立了 KONAMI 旗下名为 BEMANI 的音游品牌。https://www.bilibili.com/video/BV1Qs411Z738
在此阶段,音游的输出(屏幕)和输入设备(按键)是分离的,为了便于关联两者,引导信息(Key & Note)固定展示在一条轴线(一维空间)上。
2.2 异变
出现式、二维谱面、UGC 社区、类音游
掌机和个人 PC 兴起后,出现了大量或移植或新开发的音游,但是输入与输出(下称 I/O)设备分离的模式没有变化,玩法上并无突破。
直到 2005 年,任天堂在搭载了触摸屏的 NDS 上,推出《战斗!押忍!应援团!》。触摸屏将I/O二为一,判定区用逐渐缩小的包围圈表示,Note 可以不再拘泥于固定轴线,而是散落在整个平面(二维谱面),音轨的组合变化也极大丰富起来。
这便是出现式音游。硬要说缺点的话:
打地鼠一样的图形界面,玩家视线追踪的成本提高,抬高了新手门槛;
关卡制作成本大大提升。
特别第二条限制了开发普及,即便现今触屏手机成为标配,手游音游市场下落式仍然是绝对霸主地位。
值得一提的是,二维谱面的制作成本对于商业开发可能难以承受,但在爱好者社区有非常亮眼的表现。澳洲开发者 peppy 开源了类应援团玩法的 PC 程序及其谱面编辑器—— osu!。映射桌面光标的流畅输入表现吸引了大量 PC 端玩家,逐渐形成社区,有大量爱好者参与创作。目前 osu! 已拥有超过一百万张谱面,官方精选近千个曲包(每个曲包约含谱面 20 张)。
https://www.bilibili.com/video/BV1Bt411E7pQ
(混进来了奇怪的东西)《节奏天国》这种纯粹游览和打节奏的游戏属于「类音游」。后续分析着重在追求高打击频率 (BPM, beats per minute)和高准确率(ACC, Accuracy)的原教旨主义音游上。大多数核心玩家认为音游需包含明确的谱面、判定区域、判定时间、音乐节奏等要素。一些具备上述一部分要素、但不完全满足的游戏常被称为“类音游”。
引自萌娘百科(https://zh.moegirl.org.cn)。
2.3 白热化
偶像题材、无轨、触屏、滑轨、三维谱面
也许是基于谱面二维化的思路,BEMANI 系列在2008 年推出《Jubeat》,使用 4*4 透明方块按键叠在一张显示屏上,像动画制片的赛璐珞手法一样,将引导信息和输入按键叠在一起,成为街机音游首个二维谱面玩法系列。
2009 年,已经多次试水偶像和卡牌概念的 SEGA 制作了基于 V 家 IP 的 PSP 音游《初音未来 -歌姬计划-》。
采用了同《PaRappa》一致的按键输入方式,将音符直接映射为 PS 系列的「上下左右」「圈叉方形三角」,但不再固定于某一音轨上,而是配合 miku 等人的 MV,由屏幕四周飞入。
加上换装系统和 MV 观赏模式,成为第一个站稳脚跟的偶像音游系列。


https://www.bilibili.com/video/BV14s411J7eR
2012年,SEGA 推出街机《maimai》,圆形触屏以圆心为起点作 360° 下落式,判定区为圆周数个按键与触摸滑条。可能是首个出现滑轨概念的音游(未考证)。
https://www.bilibili.com/video/BV1JT4y1G7Pz
此时以触屏为唯一 I/O 设备的手机音游也开始萌芽,但多数是借鉴已有玩法的作品。2011年,一款名为《Groove Coaster》的手机音游提出了新的关卡,其特点是音轨向屏幕深处延伸的三维谱面。显示屏不存在真正的三维空间,这种关卡与玩法创新无关,本质是一条动态单轨。但这种引导视线的视觉效果有非常好的沉浸体验,也有保留乐谱意象的优点,为轨道式音游的视觉表达找到了一条新出路。
https://www.bilibili.com/video/BV1nz411B7bA/
2.4 小结
截止进入手机音游爆发期前,大部分玩法均已在街机与主机平台上通过验证(非按键输入类不在此讨论,如动捕舞蹈游戏 DDR 或 VR 音游光剑)。可以看出,玩法的变革实际是基于硬件设备的革新,主要分为两种思路:- 轨道式(I/O 分离):引导是将时间线展示在屏幕上,指定区域(判定线)映射按键;
- 出现式(I/O 合一):将屏幕视为时间线上的一个切面,引导与判定在同一区域。
- 认知成本:
- 入门阶段差别不大,出现式符合哪里亮了点哪里的直观思路,轨道式也可借助五线谱与琴键的文化实体映射;
- 但在高难度游戏中,密集音符段落背谱,轨道式记忆是一张图,出现式式却是一段视频,前者成本较低。
- 操作成本:出现式要求全屏追踪音符、大幅移动输入,对玩家的视线和精准度要求都更高。
- 制作成本:轨道式低于出现式,指定段落的切分便于复用,且布局上视觉规范统一,便于与 MV 等包装向内容分层。
3. 怎样做玩法创新?—— 找变量
到了 2014 年移动应用爆发期,手机音游也萌生了大量创意。有没有玩法上的进化呢?
3.1 游戏规则的概念单位:动作和对象
引用《Game Design Vocabulary》书中定义,游戏是由「规则」构成的,「规则」中包含「动作」和「对象」。「动作」是基于硬件物理层输入操作的活动,作用在 GUI 元素呈现的「对象」上(上一张图中列举的视觉元素)。以超级玛丽为例,核心动作是包含方向属性的「移动」和「碰撞」,作用于「怪物」「砖块」「水管」「旗帜」等敌人或场景物体。
游戏关卡中放置不同的对象,为玩家组合动作提供选择。游戏规则或称玩法的创新,也就是这两类事物变量的增减组合。
3.2 从「动作」分析
目前手机音游中「动作」的主流设置为点、按、滑三种输入操作,这是为什么?是否是最优解呢?用来组合的基础动作不宜过多。如果添加过多动作,不仅会分散玩家的注意力,也不利于挖掘动作组合的深度。音游通过高度集中注意力地高频输入,通过视听触通感获得模拟演奏的代入体验。所以音游中的动作(输入)需要:与硬件交互强关联便于高频操作、控制数量保证不造成认知负担便于快速反应。
手机音游最基础的握持是双手握持两拇指输入,已知两侧输入可重复,那么输入动作的变化就是计算 P(n,2)。
P(2,2) = 2追求高 BPM & ACC 的原原教旨主义音游中,点按滑毫无疑问是触屏设备的基础动作铁三角。
P(3,2) = 6
P(4,2) = 12
高频操作的场景中,6种已经是相当丰富的组合。
从2到6,会感到选项有明显跃升。
而6到12,收益就不那么明显了,甚至还有些混乱。

3.3 从「对象」分析:
音游中的信息流动
游戏以一段段小的可执行任务串联,这些小任务有固定的体验流程:系统的引导, 用户的输入和系统的反馈。以追求打击准确率为控制目标,把玩家看作施控系统、游戏程序为受控系统,是个基于负反馈的一般控制论模型。
以施控系统(玩家)为主视角,必需的信息有「控制目标是什么」「在哪儿输入指令」「受控系统的反馈」。在设计游戏玩法时,要怎样呈现这些信息呢?
列举完这些信息要素,与玩法紧密关联、成为重要作用「对象」的,是引导和输入阶段的「音符」「音轨」和「判定区」。
音符
由于触屏输入的「点按滑」铁三角,音符表现形式受限在对应的:单击音符、长按音符段、滑动音符,以及他们的组合(例:起点点击到终点滑动的长按音符段)。或可加入太鼓气泡(对应连击动作)、spinner (对应长按 + 滑动的动作组合)之类的长时段高强度输入,来划分乐曲章节、调节谱面节奏。
音轨
在音游类型创立的前中期,已经有了许多音轨变量组合的基础变化,一些例子:
随着运算机能提升,音轨作为最初视觉主体「对象」有了很多形态选择,轨道形态或者异形的、平面的非平面的,大体归为两种思路:
- 弱化轨道:
延续传统音游形态,除了出现式,下落式中也有不少弱化音轨的设计,如去除轨道的《Deemo》、音轨只作为辅助线参照的《Project Sekai》等。
- 优点:视觉主体让位给音符,分摊注意力到背景 MV 等丰富视觉与剧情体验;音符能够使用更多变量如宽度,制作更多样化的谱面。
- 缺点:无法追求极致 ACC,竞技性减;音符固定在平面,场景模式较单一。

- 优点:新鲜的关卡体验、便于塑造独特的世界观和代入感。
- 缺点:关卡制作成本高、新引入对象需要注意操作成本。
最典型的是 PS4 平台上的《Thumper》,完全放弃音符概念,将输出动作绑定对象为音轨上的地形,VR 体验同调率 100% 😆。其制作经验前往 B 站搜索《GDC讲座 Thumper VR游戏制作回顾》。

判定区
判定区的首要功能,是为输入时间和位置提供引导。基于受众定位,判定区的基本形态对应各家游戏对输入精度的要求:出现式[收缩圈] > 下落式[判定线] > 无指定。《Muse Dash》将整块触屏一分为二视为两个按键,对应上下两条音轨。
https://www.bilibili.com/video/BV1u4411a7hB/
到了体验环节,判定区是对输入坐标的视觉引导,指引强度:
- 判定线 > 收缩圈
- 单项 > 多项
- 固定 > 动态
对判定区的改动,务必保证足够的视觉引导!这里有两个出现式案例:
- 正面案例《Cytus》:
做加法「引入垂直匀速的判定线」,减法「限制谱面在纵向顺序出现」。
牺牲二维谱面部分自由度,实现有序的视线引导,降低了游玩门槛和关卡制作成本。https://www.bilibili.com/video/BV1kz4y1D7MP
- 反面案例《大琴师》:
将屏幕分为三列,做加法「中间引入下落音轨展示时间节点」,再做加法「输入区域分为左右两块」。
尽管初衷可能是控制出现式在触屏上操作遮挡视线的问题,但分散在三列的引导信息、以及高精度输入位置的要求,使游戏难度上下限被压缩。尽管游戏品质在线、定位宣发极具特色,直到退场,表现始终不温不火。
https://www.bilibili.com/video/BV1ts411y7fL/
判定区除了引导功能,也可能和音符关联产生新鲜有趣的谱面,但要注意多线或动态线形成的空间概念可能造成入门门槛。有两个下落式案例对照:《Arcaea》虽然是双判定线,但官方谱有注意控制双线切换和动态变化的出现频率并形成模式,相比单线但高频动态变化的《Phigros》,就显得较为友好。- 《Arcaea》双固定判定线,偶尔有些微水平倾角
https://www.bilibili.com/video/BV1wt411E7oW - 《Phigros》四处乱飞的不定量判定线
https://www.bilibili.com/video/BV1W4411U7Q6
其他
有许多输入和反馈环节的对象也会大大影响玩家体验,但此类对象并不会对关卡和玩法造成太大影响,更多关乎游戏定位,没有具体案例就不多展开了。举几个较通用的项:
- 选曲和制谱
- 判定 - 评级区间、尾判
- Fever 和连击 - 系数
- 音效 - Key 音
- 变速或尾杀
目录