扫码打开虎嗅APP
本文作者:Waylon,原文标题:《AI时代游戏生态全景解析 ——挑战和机遇、应用和发展展望》,头图来自:《极乐迪斯科》游戏截图
ChatGPT火了,有人抢先体验,有人后知后觉。ChatGPT于2022年11月30日由OpenAI推出。5天后,用户数量过百万,两个多月后(2023年1月)ChatGPT的用户数超过1亿,成为增长最快的消费者应用程序。这家公司已经深耕8年,而他们也仅是AI生态中的公司之一,AI生态这个庞然大物还未真正浮上水面。
或许可以说,GPT4预示着AI生态的时代已经慢慢拉开了帷幕。
在游戏领域,“AI+游戏”有怎样的应用可能?对商业价值、用户价值、制作开发人员的价值几何?值得我们思考。
一、 AI在游戏生态中的应用
图/游戏PME飞轮
游戏方面化繁为简,可以抽象为三大模块,前两个模块为生产制作、营销触达,以及第三个最终服务的对象——玩家体验,三者构成飞轮循环。
在PME三端我们可以进一步细分,从目前主流的岗位职能角度解析AI在每个模块的具体应用场景,现阶段AI与游戏生态内容如下图所示:
图/AI生态在游戏PME端的应用
(一)P 生产制作端:增效为主,美术是第一突破口
图/炸弹少女(雷)-MidJourney
制作部分来看,当下美术是第一突破口,这次的AIGC美术浪潮不亚于照相机的发明。
目前来看,AIGC的美术资源在意向图绘制、概念设计方面表现出众,例如Midjourney,几秒钟的时间帮助游戏美术设计师尝试不同的抽象内容,一方面可以帮助美术设计师汲取灵感,另一方面可以为没有美术功底的策划等其他岗位,提供轻松制作意向图的路径,快速与美术设计同事对齐,极大降低了前期设计和对齐成本。
而在完全的标准化商业使用方面,稳定性和变化度还有明显不足。StableDiffusion更加开放的参数暴露相对表现更优。目前主要的生产方式为:
简单出图:文生图、图生图(线稿),结合不同的主模型输出,得到初稿,后续手绘修正;
姿态出图:Open pose等工具绘制姿态,Controlnet根据姿态精准输出形体,结合文本Prompt确定内容倾向,配合Lora精调例如面部、服饰、首饰等细节,或结合局部重绘工具修正,最后用SD自带的或外部的超分辨率工具输出;
专业手绘出图:精准手绘线稿轮廓,Controlnet填色绘制,得到初稿后用Ps涂大色块方式调整姿态、细节,返回用图生图等方式持续迭代;
风格切换出图:MidJourney出概念图,导入StableDiffusion重绘至指定风格,或StableDiffusion出参考图,导入MidJourney发散不同风格;
总的来说,美术通用资源部分初步具备了AIGC管线生产的能力,问题即提升空间和机会。
图/爆炸少女(金)-StableDiffusion
音频方面,笔者测试了多款AI技术工具,除变音类的(如Voice AI)较为实用外,AI生成音频,例如Amper Music、MuseNetAI生成背景音乐等,成果尚不成熟,拼凑感强烈,不能很好地通过音乐传达情绪,考虑到有信息局限,以及篇幅原因不再展开。
图/AI撰写游戏文档大纲
策划和程序方面,在一些标准化程度较高,已经有成功案例和资料的方面可以替代“重复造轮子”的工作。这里ChatGPT3.5表现一般,GPT4在多次输入,完善上下文和边界后表现不错。例如基础的数值设计、世界观框架设计、玩法方案设计,都能得到还不错的、合乎逻辑的方案,但创意性相对不足。
在基础的程序代码方面类似,可以充当较好的多种语言实现“翻译工具”,以及代码辅助工作,在小模块的功能方面能节省很多字符输入成本,测试下来仍会有较多bug,但和策划案类似,将有问题的部分返回GPT提示修正后,基本能得到正确的方案。
图/GPT4 辅助生成代码
(二)M 营销端 :自动化的分析,降低门槛
传统的舆情分析、信息采集需要通过爬虫等方式搜集海量的信息,再通过NLP情感分析、聚类分析等方式处理,并对内容进行汇总解读,相对门槛和成本较高。
大语言模型例如ChatGPT很大程度上优化了整合了上述流程,配合插件等方式完全联网后,多语种、全渠道的公开数据分析将极高效率的辅助对玩家和市场情况进行洞察,对舆情和异动情况进行有效的自动报表分析。
此外AI强大的总结、提炼语言信息的能力,在该方面卓有成效,非公开数据在投喂后进行分析、制作报表呈现、预测,提炼和总结的效率将有很大提升。同时,我们需要警惕信息的泄露问题,注意保密信息的安全。
(三)E 玩家体验:AI促进新玩法的产生,叙事类、UGC类、大世界AI玩法类将首先受益
图/《极乐迪斯科》 对话探索解密类游戏
AI bot技术中的对抗AI和社会生态AI一直是游戏行业研究和应用的重点,这次也更大程度的曝光到大众视野之中。
而人类的信息决策和“智慧”很大程度是对自然语言的接收、分析、处理,大语言模型将助推AIbot多维度呈现更为鲜活的表现。例如改变了玩家的交互方式,玩家通过自然语言交互的方式将能够传达更多、更为开放的信息,可以被AI接收处理,提升AI bot的信息收集能力。并且AI bot 通过语言输出作为反馈,打破了玩家非此即彼的交互选择。
进一步的技术提升后,可作为AI bot GOAP目标建立的依据,技术原理上类似HuggingGPT,由中枢驱动AI的行为表现更为智能,给玩家带来更生动的AI体验。
图/超参数 GAEA (图片来源于超参数官网公开资料)
目前阶段的案例,例如超参数公司最新发布的GAEA,其要点在于打造有“生命”的AI NPC,以及建立反馈机制。
反馈机制的建立笔者认为依赖三种途径:环境的标签和数值、交互行为的标签和数值(PvP/PvE/EvE),以及大语言模型(LLM)逐渐成熟后的语言交互的标签和数值,这种整体性的系统一旦耦合完成,最终的效果可能远超我们的期待。
(四)PME整合:PME和AI的全面整合,将改写游戏的生产方式,进一步可能推动生产关系的变革
PME端各部分结合泛AI后,在生产效率、标准化方面将有显著的提升机会,并促进新玩法的产生,带给玩家新的体验。可能会是新设备载体(XR)普及前最大的助力,而PME和AI的全面整合,将可能改写游戏的生产方式,进一步可能推动生产关系的变革。
举例来说,20年前建筑领域基本以手绘图纸、施工图为主,而现在基本已实现全面的数字化和信息化,现在的游戏行业生产方式可能相当于20年前的手绘时代。而这种进步和改变,使得准入门槛和生产成本极大降低,更加提升创新和思维能力的占比,UGC的游戏参与方式可能从一种“玩法方式”变为一种“生产方式+玩法方式”的融合,web3倡导的个体价值(去中心+所有权)的实现有了具体载体,UGC定义将会重塑。
二、 游戏制作中AI工具的具体运用
图/生产制作端现有AI工具
(一)策划:隐形助手
AI对策划方面的提升目前主要集中在两个方面:一是作为基础计算工具的整合,二是帮助牵引灵感,给出大的框架设计。
前者是指复杂的多软件、多数据的处理整合过程,可以交由AI处理,例如需要调整一张复杂数值表格的某些参数。其中计算实验部分很多,例如需要反复数十次的调整各项数值,达到“平衡”。可以将整体数据输入ChatGPT,清晰描绘数值调整需求,由AI给出不同的计算和调整方案,作为多方案预览,极大节约时间成本,后续再通过手动校正的方式逐步达到落地需求。
后者例如文案/叙事策划,则可以给定关键词,交由ChatGPT、文心一言、通义千问之一的大模型,由AI帮助撰写,获取灵感,然后在此基础上调整、拓展,还可将每一章节交由其提炼关键词并生成Prompt,输入到MidJourney中生成对应的插图,形成图文并茂的策划案。
(二)美术:拥抱直至成为一部分——AIGC的发展阶段
AI与美术的应用前文中有提到部分管线流程,而对于整体的发展,笔者认为有几个阶段:
第一阶段:技术突破为主,美术效果为辅。
第二阶段:“玩家共创”,前锋跑步入场,迭代完善美术效果。
第三阶段:专业化人员进入大众视野,“Prompt/AIGC工程师”,多技术融合,插件如雨后春笋,技术和品质提升全面加速。
第四阶段:深度融合,美术自训练AI模型成为标配,“请提供你的Portfolio”变为“请提供你的SD模型集”。
第五阶段:链条打通,AI 2D、3D工具完善,分化为两条路径,一是极度便利的自然语言输入,生成各类概念性、非标性美术内容,二是极度复杂,海量参数暴露的“参数化美术”专业发展路径。
目前来看(2023年4月)处于2.5阶段,着重阐述一下阶段4的模型训练原理:
我们可以类比美术师的成长训练过程,以人体为例,美术师需要对头、手、脚、躯干各部分进行“分模块练习”和“整体组合练习”,并对脸部五官、手重要部分进行“强化训练”,基本的绘制形体功能练成后,逐步对不同人物的体态、神态进行“泛化训练”,由写形逐步提升到写神,最后经过海量的数据和训练,可以达到默写,而后进行艺术创作。
这一过程无疑是以“年”为单位进行的,而AI技术的优势在于,我们将各个“部件”绘制成果一次输入多组即可,而后把对不同对象的组合、泛化交由AI操作,极大省去了协同过程中的试错和反复成本——我们将脑海中的“意象”绘制出来与“甲方”同步,“甲方”认为和其脑海中的“意象”不一致,反复调整的成本。
显而易见,AI生态的融入,很大程度上对美术这一岗位进行了一次大面积筛选,绘画功底越深、驾驭的美术风格越成熟,或者风格越独特的越能更大程度上放大自身的价值,且在更复杂的场景领域存在很多机会,通过AI的杠杆将只有“一双手”的顶级生产力扩大化。而单纯只是充当绘制劳力的人力,则面临迭代。
(三)客户端:我打败我自己
虽然AI目前无法完全代替程序员来编写复杂的游戏客户端,但它可以帮助程序员生成一部分简单的代码或基于已有的代码进行拓展。运用AI来辅助编写游戏客户端代码已经起到了不错的成效,例如GitHub Copilot工具,使用方法和步骤如下:
GitHub Copilot 是一款基于AI技术开发的代码补全工具,可以借助它来辅助编写游戏客户端。GitHub Copilot 以OpenAI的大型代码库为训练基础,能够理解大量编程语言和框架,如Python、JavaScript、Unity 和 Unreal Engine等。
使用步骤为:
准备好环境,并安装GitHub Copilot,GitHub Copilot将整合到编程环境里(如Visual Studio Code)。
编写游戏逻辑:当你在编写过程中遇到需要帮助的地方时,可以借助GitHub Copilot。只需输入一些相关的关键词或注释,GitHub Copilot就会根据其理解生成相应的代码建议。
优化代码:AI生成的代码不一定完全符合我们的需求,因此需要进行检查、修正并调整至期望的解决方案。没有百分之百完美的代码,审查与验证依然是一个重要的过程。
测试与迭代:运行客户端进行适当测试。如果出现问题修复错误并优化代码。如果是刚写的这部分出现问题,可以试着提交给ChatGPT帮助检查。
目前类似GitHub Copilot辅助编写游戏客户端代码的工具百花齐放,虽然目前无法完全单独完成编写任务,但随着技术的发展,AI辅助将在游戏开发领域扮演越来越重要的角色。
(四) AI与游戏融合带来的玩法更新
RPG/大世界玩法:
RPG的世界感知通过AI对话将被塑造得更为清晰具体,例如与NPC关系的养成、NPC对话对世界的了解、NPC交互行为的多样性丰富,RPG世界将更为鲜活,可能延伸与NPC更深度的交易、社交、对抗等玩法。例如霍格沃兹、梦幻西游。
Party 社交玩法:
鹅鸭杀类社交Party,AI对话使得AI 玩家成为可能,因传统对真人数量凑齐门槛较高,且玩家数过多使得体验可能降低。AI玩家的出现可解决该类问题,并可能延伸出更为复杂的玩法变体。
虚拟人题材:
例如汤姆猫+ChatGPT,原神角色+ChatGPT,人物、动物养成类玩法因AI对话赋予了新的交互和情感表达,催生“便携”的独立玩法,以及玩法更新。
解谜类:
以对话文本为主的解谜类,其参与方式、解谜方式、奖励方式将变得更为开放,以及可能产生千人千面的开放结局。例如极乐迪斯科类型的游戏。
剧本跑团类:
龙与地下城,目前已有初步的接入GPT版本,充当DM的角色,可以预见的是,AI对于美术资源生成方式的进化,将使得原本的文字跑团,变得画面丰富、声情并茂。玩家AI变化声音,沉浸式扮演,游戏体验将登上新台阶。
养成类:
赛马娘等养成类的养成路线可能交由AI生成,AI提供不同的交互玩法,剧情文本基于玩家的基础数据和不断的输入生成,固定与动态内容相结合,真正做到养成属于玩家自己的“偶像”。
三、AI与游戏发展展望
(一)监管相关
1. AIGC的版权
美国:对AIGC生成的内容不予版权保护,相似度过低的情况下,也不认为侵权素材来源方
2023年2月21日准许AIGC漫画《Zarya of the Dawn》的版权注册,但仅限于非AIGC的部分,即选择、协调安排的部分,该作品的版权先后经过了直接审核通过,而后美国版权局得知其为AIGC的内容后予以拒绝,最后进一步考虑后,切分了版权的保护范围。
总的来看,目前政策还处于变动期,需要我们关注的有两个方面:一是版权只能保护人类创造力的产物,在不受保护的情况下可以理解为它属于“任何人”,二是侵权的风险依然存在,AI扩散生成的训练集通常用千万张以上的图像,目前仅从相似度判定基本没有侵权问题存在,但无法忽略大规模使用后会对以后侵权方式的界定产生变化。
欧盟:四步法判定AIGC内容是否符合“作品”
欧盟委员会2020年发布的报告提出了“四步测试法”,来判断AIGC是否符合“作品”资格:1)文学、艺术、科学领域;2)人类智力活动 ;3)独创性;4)表达。
目前来看,AIGC作品基本上不满足第二和第三点,不能得到版权许可以及相应的授权保护。
2. AI大模型的数据安全和文化安全
意大利
3月31日,意大利国家隐私监管机构正式下令封禁ChatGPT,并指控OpenAI“非法收集个人数据”。
值得注意的是,该“临时禁令”将一直生效,直到OpenAI能够尊重欧盟具有里程碑意义的隐私法——通用数据保护条例(GDPR)。
中国
4 月 11 日,中国国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,主要为AI内容提供者应当承担该产品生成内容生产者的责任、个人信息保护义务。利用生成式人工智能产品向公众提供服务前,需按规定向国家网信部门申报安全评估,并对内容审核负有责任。
(二)AI生态与游戏发展展望
AI生态目前排山倒海的景象,可能还只是处在单点爆发阶段——AGI的前夜。笔者认为AI生态的发展会经历至少4个阶段:
I. 单点爆发;
II. 垂直大规模应用,以及多模态的应用;
III. 功能集成与耦合,涌现出新功能、新体验;
IV. 行业洗牌,头部独占+细分龙头。
目前我们处在I向II过渡的阶段,可以看到ChatGPT等大语言模型、MJ、SD在充分的单点爆发引燃了用户群体后,在各垂直领域有星火燎原之势,例如GPT结合的微软办公全家桶,在办公领域这一垂类仍会继续细分直至完全适配和具体痛点被打通。
GPT4已经初步展现了在多模态中图像处理功能,在之后的5/6/7版本中,将全面覆盖音频和视频的处理能力,对于多种载体形式的混合“信息”、集成输入的处理能力迈上新的台阶,显而易见,游戏这一泛文娱和集成前沿技术的领域,将会是最好的引领行业,以及最大规模被颠覆的行业。
在AI生态+游戏行业中,PME三端将会逐步迎来垂直细分的大规模应用,而在P、M、E每一个部分,例如生产制作端,策划、客户端、美术各部将会很快覆盖,从制作到对玩家体验的更新。
图/Overview of HuggingGPT(图源自arXiv论文HuggingGPT...)
这里的以大语言模型LLM(例如 ChatGPT)连接机器学习社区(例如 Hugging Face)中的各种 AI 模型以解决 AI 任务的框架已经初见成果,例如上图中微软亚洲研究院的HuggingGPT,能够覆盖众多不同模态和领域的复杂AI任务。以及近期诸多整合工具,例如BabyAGI、AutoGPT等,AGI初见端倪。
而散点的AI技术百花齐放、百家争鸣阶段,仍是以第一阶段技术的延伸、改造为主,在经历过充分的爆发后将会逐步收敛,新技术、新功能以从未被系统设计过的方式组合后,将产生涌现式的创新,这一过程像是CV、NLP等整合后带来的涌现创新,这类的突破将会带来新功能和游戏的新体验,不仅给制作者带来便利,还会真正影响每一个大众玩家。
(三)AI时代下的个人
在一个新时代来临之际,个人的态度选择尤为重要。笔者建议根据个人情况,有两种相对融入的态度:
1. 拥抱、学习
保持开放心态:拥抱AI时代首先需要保持开放和乐观的心态,不畏惧新技术所带来的挑战。AI是很好的工具,“君子善假于物也”,我们从驯服动物、制造马车、自行车,再到燃油车、新能源汽车,一直以来都在与时俱进,正如那句俗语所言:“汽车时代来了,我们应该做的是考个驾照,学会驾驶它。”
更新知识结构:在AI时代,个人需要不断更新自己的知识结构,学习跨学科的知识,特别是与AI相关的领域(如计算机科学、数据分析、统计学等)。目前的知识获取已经极度便捷,我们完全可以根据自身情况积极了解、或者掌握AI相关的技能(如基础编程、机器学习算法、应用开发等)。
跟随时代潮流,深度思考,看透本质:一方面持续关注AI领域的动态和趋势,使自己始终与时代同步,另一方面,警惕捕风捉影,深度思考需求的本质、问题的本质、价值链条的本质,以第一性原理看待潮流背后的实质。除了理工科思维和技能外,非逻辑性的洞察思维、同理心、人文素养将变得更为珍贵,这里我们最好不要用学科去定义和切入,保持“以人为本“,多从关怀和爱的角度思考,或许会有不一样的发现和收获。
2. 发现应用场景、解决具体问题,实现自我和社会价值
浸泡、深入了解所处的行业:深入研究和了解所处行业的痛点和需求,发现AI技术可以解决的具体问题,个人可以根据自己的兴趣和特长,发挥优势,实现AI技术在自己关注领域的应用与突破,例如深耕RPG品类的从业者可以考虑能否训练垂类的GPT模型,为企业和玩家带来价值。
驱动创新与发展:通过挖掘AI技术的新应用场景,比如ControlNet为斯坦福大学计算机专业的在读华人博士Lvmin Zhang开发,我们能否将其更好地应用在游戏领域,推动整个行业的创新与发展,同时也实现个人价值的提升。
普及AI,亦师亦友:作为AI领域的使用者,在熟悉掌握之后,可以选择帮助更多的人了解和使用AI技术,以解决实际生活中的问题,这对我们自己的提升也十分有帮助,“三人行,必有我师焉”。
四、总结
本文浅薄地讨论了AI生态与游戏行业的应用与未来发展展望,对游戏行业PME三端应用进行全景解析,并对P端的AI现阶段具体技术应用进行了分享,最后讨论了AI的监管和风险项,对AI生态+游戏行业发展进行展望,以及围绕个人在AI浪潮中的应对给出一点建议,仅供参考。
希望对游戏行业从业者全局了解有所帮助,或许这是一个种子,帮你在未来长出对AI+游戏研究的小苗,或许这是刺客信条翱翔的鹰眼,帮你从全局的视角,鸟瞰一眼宽阔的景象;或许这是一篇“投资报告”,帮AI生态+游戏引来一位“植树人”,灌溉一倾水,滋润行业的发展,也为社会和玩家带来价值。