本文转载自创造一下 作者:门宇阔 如有侵权请联系删除
“这游戏我等了足足8年”,周杨颇具仪式感地打开了一个平淡无奇的瓦楞纸箱,炫耀着里面黄色封面的盒子。
早在一个月前,周杨就在淘宝上订购了英文版的《赛博朋克2077》,PS4上的实体光盘售价为378元,他觉得,对于一款精雕细琢的游戏来说,贵,才体现出它的价值。
但在试玩30分钟后,周杨脸上的笑容消失了,游戏在主机上的运行并不流畅,大量出现的bug让人出戏,甚至几次出现了卡关的现象,必须重启或读档才能继续。
有同样心理落差的玩家不在少数,差评蜂拥而来,在一些网站上,该游戏的用户评分已经跌到2.9分的低水准,开发商CD Projeket Red(CDPR)发出官方道歉,索尼更是罕见地直接将游戏从平台下架。
遭遇滑铁卢其实并不意外,《赛博朋克2077》的开发难度巨大,作为一款开放式游戏,它不仅蕴含了120平方千米可探索的空间,有超过1000名有自己生活规律的NPC,以及庞大繁复的剧本,所有这些元素都直接造成了该游戏在长达几年的跳票后依然问题重重。
高度专业化的工业文化已经深入游戏业,和好莱坞一样,游戏开发有非常规范的流程和职业细分,上百人分工合作,分别负责不同的部分,这让现代游戏可以无比精细,连抢声都经过真实模拟,可以还原在不同射击距离、不同空间下的声音效果。
不过,游戏开发的效率并没有本质上的提升,设计一款游戏背后所需的资源和人力正在变多而不是变少,疫情下的居家办公,让多工种的协作力发生断裂,即使是游戏开发中一次微小的调整,比如加入一个角色可以互动的物品,都需要耗费几天而非几小时的时间,反映在结果上就是延期和制作成本剧增。
《赛博朋克2077》的困境让产业转型再次成为焦点,如何简化流程,让游戏开发从人力密集型的生产方式,过度到更自动化的流水线生产?如何在保证游戏质量的同时,更好地缩减经济和时间成本?
游戏行业需要更具效率的开发手段,而AI可能是最好的答案。
银行劫案中的颠覆性技术
想要窥探AI在游戏开发中的革命性作用,《盗梦人》是个不错的观测点。
在这个银行抢劫案的小游戏里,除了玩家外,其余4个NPC(经理、同谋、顾客、柜员)均是AI控制的,他们会依据玩家的决策进行反应,彼此之间也会互相影响。
每个NPC都有自己的人物设定,但游戏本身不存在固定剧本的概念,玩家不同的举措会造成截然不同的结局:当玩家拿枪恐吓经理时,他可能会乖乖交出密码,玩家携款而逃;而如果玩家没表现出足够的威胁,经理可能就会揭竿而起。
《盗梦人》背后的开发公司是rct studio,他们制作该游戏的核心技术,是基于深度强化学习技术的AI引擎。强化学习的技术也是AlphaGo的核心原理,简单来说是给AI设定一套规则,通过左右手互搏,让AI自己学习出最佳的游戏模式。
银行抢劫案的场景中,rct给四个NPC赋予了不同的性格,他们中有的威猛,有的胆小,有的投机。在训练伊始,胆小性格的顾客没有学会该如何行事,他可能表现的非常勇敢,会直接冲上去殴打劫匪。但这样的行为,显然不符合他的人设,整个剧情就会被博弈掉,在经过上百万次演练后,最后剩下来的剧情中,顾客的行为便会贴近他弱小的设定,AI就会记住此人该有的行为模式。
行为模式是动态的,怯懦的顾客如果被逼急了,可能也会进行反抗,这种行为并不违背他的性格,属于“在正确的场景下,做他该做的事”。在游戏里,玩家可以帮助抢劫,可以主持正义,可以坐视不管,不同的举措会导致不同的结局,也就让游戏产生了几乎无限的剧情。
《盗梦人》中,开发者只设计了游戏场景、人设、规则等大方向,NPC的行为、台词和剧本全部都是AI来推动的。
rct创始人陈雨恒向《创造一下》透露,在这个游戏中,一个NPC大概有700多维的状态向量,用传统的方式去做,编剧和策划需要构建非常复杂的脚本和行为树,消耗大量的时间和精力。而在rct的技术方案里,只需要人为去定义其中30-40维的属性,剩下的全部交给AI。
只需人为定义几项属性,NPC会自动生成脚本和行为
负责《赛博朋克2077》NPC故事线的团队超过400人,《GTA5》有1000多人的剧本和对话策划团队,《荒野大镖客2》花掉R星公司近8亿美元。试想一下,当游戏工作室只需要设定NPC的基本性格和游戏内的物理规律,剩下的剧情和对话全部交由AI去模拟,那么节省下来的将是大量的开发耗时和时间,将重新定义一款游戏的标准开发周期。
脱身于AI公司,续写未来故事
“改变游戏产业的,不一定来自游戏公司”,陈雨恒是AI技术的笃信者,他此前曾是百度智能硬件事业部项目总负责人,负责并参与了百度智能硬件部门从设计、研发、宣传到销售的整个体系的组建与运营。
离开百度后,陈雨恒和几个老同事一同创立了rct studio,核心成员在人工智能领域的多年积累和实践让他们迅速吸引到资本的关注,并成功获得来自星瀚资本、Y Combinator和Makers Fund的融资。
陈雨恒曾致力于打造基于人工智能和新交互为基础的下一代操作系统,从这一点上来看,rct依然在续写之前的故事,并画出了更大的蓝图。
rct没有把自己局限在单机游戏,它所构想的是《西部世界》里的模样,打造极度智能的NPC和极度个性化的剧情体验,带给玩家更多的归属感和情感绑定。
“真实的人类一定有弱点,一定有缺点,但是虚拟的人可以个性化,永远可以按照你所想的那样存在,可以让你得到你所需要的东西,你不会因为他们的自我性而生气,当然如果你就是喜欢吵架,你也可以找人吵架。”
在陈雨恒看来,当线下社交被压制的时候,大家会追求虚拟世界里的社交,未来这个趋势还会不断放大,而智能NPC所提供的不仅仅是更多的剧情,它们可以提供完美的社交模式,因为它永远在线,可以按照每个人喜欢的方式相处,“如果你心中完美的女朋友是一种想象,那么在NPC那里,想象就是现实。”
要实现这一点,AI就不能一直在“左右手互搏”的状态下模拟,它需要接入真实的数据。普通游戏收集的数据,主要是用户画像和用户消费行为,比如腾讯根据《王者荣耀》用户数据,有针对性地研究要上新的皮肤和营销策略。而游戏内产生的数据,大部分都只应用于战报呈现、用户数据统计图、举报判定等有限场景。
而rct想要利用的是游戏内的个人行为特征,总结出用户的偏好,让剧情和NPC按照符合玩家的喜好去演进。
比如在一个开放世界中,一个玩家喜好探索而无心恋战,游戏就可以提供更多的惊喜剧情,并让NPC的战斗欲望降低。rct最终希望打造一个平台,让其中的用户行为数据在不同的游戏里通用,当NPC的交互能根据玩家的性格特征发生变化时,就可以真正打造出千人千面的体验。
AI的路还很长,网络无限宽广
在和rct员工的接触中,《西部世界》、《银翼杀手》、《黑客帝国》等科幻作品被不断提及,rct希望用AI颠覆产业,梦想用技术改变更遥远的未来。
不过就像rct自己的《盗梦人》所展示的那样,未来从来都是无法预知的。眼下,作为一家刚起步的创业公司,rct需要面对资本、技术、市场等多如牛毛般的现实问题。
陈雨恒承认,游戏圈和影视圈一样,是一个相对保守的行业,上下游和供应链的利益链条盘根错节,外来者很难切入,很难像滴滴那样,用单一技术打破整个产业结构和利益分配格局。
同时,和欧美相比,中国的游戏圈又更偏商业导向,充斥着质量堪忧、缺乏创意的氪金游戏。很多游戏商的首要目的就是实行资本变现,也间接导致资本市场对于一款游戏的短期回报格外迷恋,缺乏对于长期技术和耗时大作的关注和投入。
从技术上来讲,强化学习折射在NPC上的结果也并不完美。围棋AI的目标只有一个,就是赢下比赛。相比于围棋非黑即白的输赢,NPC的行为模式的标准判定要复杂很多,NPC想要保命,想要挣钱,想要实现一个梦想,它们甚至不存在明确的目标,因此最后训练出来的决策模型,可能会存在诸多缺陷。
在《盗梦人》中,被训练好的NPC依然会做出一些匪夷所思的事情,比如顾客抢夺了劫匪的箱子后,职员会主动为顾客打开保险柜等迷之操作。在AI看来,这种行为符合他的人设,可对于玩家来说,引发NPC行为转变的冲突并不够多,剧情的推进就缺乏逻辑上的合理性。在大型游戏中,剧情主线和结局可能是设定好的,但智能NPC的“反常识”行为,可能会扭曲故事的叙事走向,割裂游戏体验的完整性。
AI技术可以覆盖很多产业应用,在众多的设想场景中,AI总被给予无限期待,但产品落地往往成为横亘在创业者面前的鸿沟,其后在面对市场时,模糊的商业模式也会成为致命伤,让无数的AI畅想化为云烟。
陈雨恒表示,公司当务之急是出一个足够好的作品,让团队可以获得数据,优化算法,让游戏公司了解AI的高效率,改变上下游利益分配格局,让资本看到潜在的商机,增大投资欲望。
rct要走的路还很长,好在公司已经得到了很多业内的认可和好奇,rct是中国屈指可数的获得OpenAI API内测使用权的团队,公司与GTA 5主制作人、南京大学人工智能创新研究院等行业顶尖人才和机构保持了密切的沟通和联系,与完美世界等头部游戏公司建立了商业合作关系。
rct还正与游戏开发商悠米互娱展开合作,共同打造一款3A级开放世界MMO游戏《代号:奥德赛》。运用《盗梦人》里的技术,rct帮助悠米互娱在游戏中创造了海量的智能NPC,实现与玩家的逼真互动。
这款游戏的主题和《赛博朋克2077》相似,后者在巨额的开发成本下还是留下层层阴云,而深度融合AI技术的《代号:奥德赛》或许可以另辟蹊径,用更高的效率和更多元的玩法,为玩家勾勒出一条新的道路。
在和周杨探讨AI在游戏中的可能性时,他刚下载完《2077》里一个10G的大补丁,却对于更新后的交互体验依然非常不满。个性化剧情、智能NPC、完美社交...rct正在建造的新世界让他浮想联翩,失望的脸也终于露出微笑:“我愿意为那样的游戏再等8年。”