最近,一款叫做《轮到你了揭秘篇》的微信创意小游戏,颠覆了我对小游戏的认知。
它的玩法类似不用说话的《狼人杀》,要求 5 名玩家根据彼此的行为推断身份,做出决策,整个游戏过程充满了复杂的博弈推理和欺骗,非常烧脑,和那些超休闲游戏的简单体验完全不同。

据超参数所说,在零买量,零推广的情况下,上线 2 个月,《轮到你了》的用户量超过 30 万,DAU 超过了 3 万,并且仍在快速增长。
他们是怎么做到的?这个品类还有多少机会?
《轮到你了》是一款怎样的游戏?
去年 10 月,超参数希望做一款能展现 AI 高级功能的产品。为了节约资源,他们打算做一款非数值玩法,以复杂博弈为核心乐趣的小游戏。
团队最先想到的是《狼人杀》这种身份隐藏类的桌游:它上手简单又不乏深度,易懂难精。在翻遍海外桌游论坛上 Top 100 的游戏之后,大家确定了《狼人杀》《阿瓦隆》《政变》《魔城马车》《矮人矿工》等几个原型备选。
很巧的是,当时 AI 负责人李宏亮也在 MIT 的一篇论文中看到了一个实验,用 AI 在《阿瓦隆》游戏中取得了不错的成果。于是团队最终以《阿瓦隆》为基础,砍掉了复杂的角色设计和发言环节,又借用了都市悬疑推理日剧《轮到你了》的包装,用 1 个月的时间研发出了玩法原型:
(1)5 名玩家会共度 5 个夜晚,其中 " 好人方 " 包括 2 位住民、1 位目击者;" 坏人方 " 包括 2 位捣乱者;


在整局游戏中,玩家无需发言,只要根据投票记录做出推理即可,单局游戏时长大概是 4 分钟。为了进一步降低门槛,团队还把新手视频从 2 分 10 秒砍到了 1 分 5 秒,把这个阶段的流失率从 50% 降低到了 20% 左右(被评为创意小游戏后流失率为 10%)。
解决了桌游玩法高门槛的问题,接下来就要轮到 AI 出马了。
如何用 2 个月打造一套 AI?
为了训练 AI,团队先找到 100 名测试玩家,积累了 2000 多局的对战数据,让 AI 模仿学习这些样本。这类似 AlphaGo 当年的第一步:研究数百万人类围棋专家的棋谱。
当 AI 对游戏有了一些理解,已经能够欺骗其他玩家之后,团队开始引入强化学习——这也是 AlphaGo 的主要算法框架。简单解释,就是让 AI 自己和自己竞技,以胜利为目标,积累经验,总结规律。
然而问题出现了:跑了几个小时,打了整整几百万把,团队却发现 AI 的水平依旧很菜,远远达不到人类的正常程度。
仔细分析之后,团队发现和围棋、斗地主、德州等传统棋牌游戏不同,在《轮到你了》中,玩家还要在不知道彼此身份的情况下,形成动态的竞争合作关系。在之前的强化学习框架中,AI 固然会复盘每个操作对胜率的影响,但更重要的是要随时预测其他人的身份,并尝试影响他们的的行为。
于是团队重新梳理了学习逻辑,在强化学习中又加入了预测学习的算法,让 AI 模拟人类的思维,不断推理其他玩家身份的概率分布——例如根据投票记录,A 是目击者的概率有 80%。果然,AI 的操作变得聪明了许多。

(1)高拟人性。这要求 AI 大部分的操作都比较常规(不能蠢得毫无逻辑),同时偶尔也会出现低级失误,或者十分精妙的操作。
(2)差异化段位。玩家段位越高,匹配到的 AI 水平就要越高。比如低级 AI 的逻辑链应该更简单,更容易失误;而高级 AI 的套路更多,推理 / 反推理能力更强。
(3)差异化风格。人类玩家的性格各不相同,因此在相同局面下,AI 要能采取截然不同的行动。同样抽到捣乱者的身份,冲锋型 AI 可能开局直接捣乱,力图快攻取胜;而猥琐型 AI 则可能连续潜水两个晚上,到最后三轮再连续捣乱。
这些要求怎么满足?AI 负责人李宏亮打了一个比方:先找 100 个人,让他们不断随机匹配,进行 5 人一局的对战,同时给每个人设立不同的目标。例如张三的目标,就是不断提升和李四、王二麻子对局的胜率。
这 100 个人最开始都是一张白纸,但因为对局经历不同,大家都会对游戏形成自己的理解。而为了打败李四和王二麻子,张三会努力分析他们的风格,找到一套克制的思路,从而形成自己的风格。

在 AI 领域,这种学习方法叫做 " 基于种群的多智能体强化 "。至此,经历了小样本模仿学习、强化学习 + 预测学习、基于种群的多智能体强化三个步骤,花费 2 个月的时间,团队终于打造出了一套合格的 AI。

根据测试数据,制作人高远也摸索出了一套 AI 的调用流程:
(1)先给新手分配 3 场对局,分别让玩家扮演捣乱者、目击者和住民,方便他们理解规则。
(2)在接下来的 8-9 局中,玩家会与行为树脚本匹配(即没有经历过深度学习的 AI),强化对游戏的理解。同时每玩 3 局,在第 4 局插入一场深度学习 AI,缓和与行为树脚本对战的枯燥体验。
(3)之后伴随玩家的段位提升,不断调整 AI 的比例,既保证中低玩家的游戏体验,又保证高段位的玩家的匹配不用等待太久。

目前《轮到你了》已经与乐逗达成了发行合作,正在考虑加入赛季、付费等外围系统。不过战略负责人陈昭翰称,赚钱不是他们的目的,证明 AI 的价值才是核心,未来的盈利也会用到产品的调优和推广当中。

桌游小游戏与 AI 游戏的未来
那么在《轮到你了》之后,还会出现更多以桌游玩法为核心的小游戏吗?在葡萄君看来,这个品类需要 3 个要素:
(1)一个合适的玩法。《轮到你了》的玩法脱胎于已经被验证的《阿瓦隆》,而且在改动之后,不需要语音也可以获得博弈的乐趣。这大幅度降低了游戏的单局时长,也更符合小游戏的场景。
(2)解决冷启动和前期的匹配难问题。但以博弈,而非数值养成为核心的桌游玩法既不适合做内购,也不容易设计广告,前期的买量投入很容易打水漂,仅靠口碑传播又很难快速吸引用户,保证种子用户的留存。
(3)或者和超参数一样,用 AI 解决问题,不过这个门槛就更高了。黄军称,行为树很难处理这种复杂的博弈,必须引入深度学习的算法。为了跑通 AI,他们花了 2 个月和几十万的计算资源。" 如果你没做过,可能半年都跑不出来。"

不过黄军说,现在 AI 在游戏中的应用还不够多,很多游戏在研发阶段也不会考虑 AI 的环境。" 比如我想做一款 FPS,那我不会从服务器端关注玩家的视角,只需要在客户端做就好了。但如果想训练 AI,服务器端也要有类似的逻辑。"
黄军说,未来他们工作室还会继续探索以 AI 为核心乐趣的玩法,看看能不能改变游戏公司对 AI 的认知,一起创造一个叫做 "AI Game" 的全新品类。" 什么时候 AI 和虚幻 4 一样,可以成为游戏的卖点,我们的使命就完成了。"