扫码打开虎嗅APP
本文来自微信公众号:腾讯研究院,嘉宾:楚利彬(中国电影剪辑学会发展中心主任,观语未来人工智能研究院创始人)、陈坤(AI 影视创作者、导演、AIpai创始人)、赵天奇(北京聚力维度科技有限公司创始人兼 CEO),课题组:中国传媒大学文化产业管理学院:刘江红、杨剑飞、陈娴颖、田卉、王夏歌等,腾讯研究院:孙怡、田小军、冯宏声等,题图来自:AI生成
生成式人工智能(GenAI)正引爆一场深刻的内容生产力范式革命。从文本、图像到视频、音乐等系列惊艳应用,正在打破高质量动态内容生成的壁垒,将过去被认为是人类专属的复杂创意工作推向机器可及的范围。这种指数级的技术进步,给文化产业带来“战略性焦虑”与“机遇性渴望”并存的复杂局面:一方面,所有市场参与者都看到GenAI在降本增效、拓展创意边界上的巨大潜力;另一方面,这种颠覆性力量也带来前所未有的挑战,既有的价值链、商业模式与内容生态等正面临全面重塑,引发全行业对未来的深刻追问。
腾讯研究院与中国传媒大学文化产业管理学院合作推进的《破晓:GenAI重塑文化产业》研究项目,将聚焦 GenAI在长视频、短视频、音乐、动画、网络文学等重点领域的应用,研究文化产业在人工智能时代的系统性变革,探索文化产业智能化发展路径。
以下是访谈内容分享。
一、GenAI大模型和智能体不断涌现,逐步渗透到不同文化内容形态的生产流程中。行业普遍认为的“降本增效”具体在哪些环节实现,内容生产中的“人机协同”是否已真实落地?现有GenAI的能力边界是什么?
楚利彬:基于我多年影视从业经验,我深刻意识到此次AI技术变革与以往任何一次技术迭代都有本质不同。
许多影视创作者所持的“人机协同”观点,其前提是创作流程仍始于人类拍摄的素材,再由 AI进行辅助处理。因为本职工作原因,这几年一直在做“智能剪辑”的探索,比较清楚真正的智能剪辑在当下这个时期,还是很难实现的。因为AI对“素材”的理解能力还远远不够。要用现有算力去对500个小时的素材进行逐帧分析,且不说模型对人类文明多元细节的理解,单从上下文数据保持以及算力需求就极难实现。最重要的是,其成本和效率完全不成正比,还不如人直接剪。这就导致现在的“智能剪辑”或“人机协同成片”都难以真正实现。
然而,当前端的影像本身都不是人类创造的时候,它的后端是直接生成成片的,不再是基于人类提供的素材去理解去耗费算力后再进行“后期剪辑”,而是从零直接生成完整的成片——包括画面、剪辑、音乐、声效全部一次性生成,这套传统内容制作体系就彻底瓦解。
陈坤:关于AI在影视创作中的渗透程度,目前在前中期环节较为深入,后期环节相对较少。在前期环节,包括策划、剧本创作、分镜设计等,AI已经得到广泛应用。我们已经看到AI短剧、长剧等内容的出现,预计在未来一两年内将会出现完整的AI电影。在中期环节,传统拍摄方式正在被大模型和智能体替代,实现从文字到视频的转换,包括直接生成或通过图片中转等方式。在后期环节,AI的渗透相对较少。商业化剪辑仍主要依靠人工完成,虽然 AI 剪辑已能满足普通用户需求,但剪辑环节的应用仍较为有限。
赵天奇:我认为,未来会有2D和3D两条发展路线,相对而言,3D路线更接近工业时代的影视本质,让影视内容更有物理真实感。和3D 路线的追求不同,2D路线无法实现、也不会过于关注内容前后一致性的可控。3D路线的难点在于,高质量的表征数据太难获得。3D路线需要的数据表征非常复杂,包括三维、点云、网格和骨骼等多模态表征。当前2D路线拟真性已经很好,画质和自由性都很高,但已经接近它的能力边界。3D 路线会继续推动技术突破和应用创新,达到传统工业级影视的水平。
还有,AI对于内容加工处理的决策支持仍有难度,因为AI会忘记和乱想。比如,目前使用AI工具的编剧,需要自己将工作拆解成分散、分阶段的工作交给AI完成。我刚开始研究AI解决影视问题时,直接采访传统影视行业的人,询问哪部分需要被AI颠覆,他们会基于当前的生产流程提需求,但这些需求往往无法颠覆当前的生产流程。一旦更换生产力,旧的流程就会被打破,但是又不能彻底打破,需要尊重创作本身,创作的内核不能被颠覆。
我们提出了“剧本-分镜—预演成片(生产一体)”的工作流。大家不愿意做的枯燥且费力的、成本较高的工种,都尽量使用AI去代替,但创作这件事本身还需要尊重其本质。AI打破了从预演到成片之间的关系,但前面的创作本身不能打破。
二、如何理解AI原生内容?AI原生内容的价值在哪里?
楚利彬:完全AI原生内容的出现,就意味着AI不再是一个简单的视频生成工具,而会演变为一个能够深度洞察并主动塑造用户心理的“超级有机体”。其底层商业逻辑将发生根本性转变,核心是从“争夺用户注意力”转向对用户“潜在需求与情绪”的精准筛选与创造。
AI可以通过人类所做的每一次内容变体(每一次提示词的内容生成),形成一种微观察,AI能侦测到每个人的潜在偏好。有些是用户自己都不知道的情感需求和审美可能性,但是由于自己的各种操作,尤其是特别细致的操作,AI就能够生成出来潜意识里边特别想看到的影像,这是人类创作者影像创作所实现不了的。我们在大量观看、搜索自我偏好的AI生成影像,以及生成影像输入、修正的过程,其实就是在为数据飞轮贡献数据,模型能够以此识别出我们更深层次的情绪感受。
AI满足的不再是所谓注意力被动响应。它会变成一种主动塑造,对从满足需求变成创造和引导需求。这意味着,AI内容不仅可以匹配您当前的状态,更能主动生成内容,将您引导向某种它认为您更需要的情绪“程序”中。这种“深度理解—生成无法抗拒的内容—获取更高质量数据—更深层次理解”的循环可以不断强化,从而建立起一种当今任何人类创作者主导的平台都无法企及的用户依赖和生态壁垒。这才是未来内容形态真正颠覆性的变化所在。
陈坤:在我看来,目前并不存在真正的AI原生内容。当前所有AI创作或人机协同创作的内容,传统影视都能完成,AI只是在传统影视基础上实现降本增效。人类的价值在于定义方向和情绪,目前还没有看到AI完全自主创作的内容。我认为使用AI达到真实临界点并非终极目标,那只是追平传统影视的水平。
真正有价值的是超越传统影视的能力,这需要探索传统影视做不到、而AI能做到的新领域。未来也必然会出现超越传统影视的内容,这首先会体现在技术层面的超越,这些新内容形态将带来新的分发方式、平台和商业化模式。比如实时影像生成,甚至是交互式内容生成。传统影视最快的方式是现场直播,而未来AI可能实现生成速度快于观看速度,能够根据观众的反应实时调整内容,创造出全新的平行宇宙或空间体验。
近期我们看到Sora的新功能,实现了内容的可迭代和可生长。传统影视作品完成后表达就结束了,而AI技术可以让内容在发布后继续生长、延展、修改,从一个小点子发展成庞然大物。传统的内容互动形态是树状或网状结构,本质上是预设路径的选择。而真正的交互式内容,就像现在文字端已经实现的,用户与大模型的交流可以实时生成内容。影像内容的目标是将文字交互高质量地视觉化。
赵天奇:我认为,目前2D路线的AI可以制作短视频,或者制作对前后不一致要求较低且不敏感的、包容性较强的内容视频品类。它的逻辑在于拥有AI加持下,产生的内容更多,成本更低,观看的人更多,这种视频2D路线非常擅长,所以现在出现了AI漫剧、“动态漫”等爆火的内容形态。2D 路线存在穿帮问题,但是剧情本来就比较癫,天马行空的,正好能够和画面对得上,这样这两者就算吻合。还有人对漫画形态的容忍度较高,不需要绝对前后一致,不用特别流畅、细腻、复杂和交互性的动作。目前2D路线制作动态漫画,一分钟的制作成本和同时长的真人剧两者之间确实存在一定的量级差距。
然而,我们必须清醒地认识到,2D路线的本质,是在“低成本”与“低一致性”之间达成的一种妥协。它并未真正实现“低成本、高效果、高回报”的技术红利,更像是在现有技术约束下开辟的一个细分市场。它的天花板清晰可见:无法胜任要求角色、场景严格统一的长线叙事,无法提供细腻、复杂的表演,更难以支撑需要沉浸感的影视级内容。因此,它无法从根本上撼动传统影视工业的核心价值链。
而3D路线的使命,正是要打破这一天花板。3D路线可能让原本需要大团队、专业人员、投入巨量资金和超长时间才能做出的让人沉浸式观看的影视剧集,改变为个人、海量个人、低成本、快速完成。这样就有可能催生出一个全新的职业,以及在商业中的一个行业出现。
三、GenAI赋能个人创造后,是否会产生新型的内容生产者?传统内容生产者会发生什么变化?
赵天奇:会,我将其称之为“视频作家”。视频作家这个词是由刘慈欣提出的,出现职业视频作家将成为这条道路上的一个重要标志。我认为人的能力主要分为两个方面,第一个是故事创意能力,第二个是文笔。其中故事创意能力与导演的能力较为相同,第二个能力则是用笔写作还是用视频创作,就是表达的形式。之前有人询问我,未来编剧和导演谁会被淘汰,我回答是这两个行业可能会合二为一。我认为最被颠覆的是导演层面上的画面能力和编剧层面上的文笔能力。相对创作来说,它是一个更容易被AI取代的能力。
陈坤:目前在AI影视创作领域也出现了一些“超级个体”,本质上是AI技术带来的影视话语权下放。影视AI大模型和智能体,能够帮助创作者从创意开发到最终成片完成全流程工作。由此带来的影响,一是降低了视听语言的专业门槛,创作者可以更专注于创意和故事表达;二是降低了技术门槛,帮助创作者更便捷地使用各类AI大模型和智能体。传统影视时代也存在超级个体,比如导演,但他们仍需团队协作。而在 AI 时代,超级个体或小型团队能够完成原本需要大型团队才能完成的工作,个人创作者将能完成更完整的叙事作品。从另一方面讲,即便AI在语义理解和执行精度等方面足够强大,精细化的分工仍会存在,比如专门的数字人表演模型或视觉表达模型。就像传统影视发展历程一样,从混沌状态逐步走向细分领域,仍需组织协作来完成更高要求的影像制作。只有在 AGI 时代,整个行业才可能被彻底颠覆。
楚利彬:作为深度应用AI的研究者,我感受到AI技术正在促使我之前所有的认知体系和知识结构发生根本性的重构。这要求我们必须打破固有的思维框架,将认知维度提升数个层级之后重新审视创作本身。在我看来,过去所依赖的经验和工作流程几乎无法直接迁移到当前的 AI语境中,若强行沿用,反而会阻碍对AI真正潜力的释放。我现在做一个福建仙游非遗数字化项目,就用AI重构了生产流程、实现"一人+AI"的极简操作。我们将复杂的木雕工艺拆解为标准化的数据采集流程,通过编写详细手册让当地工人就能完成专业采集,颠覆了传统需要专家驻场的重模式,后续AI去完成。这是AI原生工作流的本质:将复杂任务拆解为可量化的标准化模块,通过AI工具链实现流程智能化,最终以极简配置取代传统重型作业模式。这种“用魔法创造魔法”的方式,正是跨越从0到1的新型工作范式。
四、GenAI时代版权、授权和收益方式会发生什么变化?文化产业的商业模式如何变革?
陈坤:我认为版权概念可能会发生根本性变化。版权是因商业利益而产生的,目前 AI 影视的版权界定还很模糊,法律通常是后置的,需要先出现问题才能制定规范。未来可能会出现内容不由单一机构或个人拥有的状态,实现“参与者即版权拥有者”的新模式,这需要新的规则和法律来规范。
楚利彬:在AI驱动的未来生态中,商业体系将发生根本性重构。当内容生成平台积累亿级用户时,其核心商业模式将从显性广告转向欲望按需生产。系统通过数据飞轮精准识别用户的潜在需求,与品牌方协同生成完全个性化的产品概念,这些“IP”可能仅存续十几天完成短期销售目标后就自然消退。这种瞬时IP模式将颠覆传统消费主义依赖长期品牌积淀的逻辑,形成“需求识别-内容生成-消费满足”的零时差闭环。同时,物质极大丰盛可能使商业本质从“卖货”转向体验经济,传统的IP价值评估体系、版权规则乃至商业模式都需要重新定义。在这个过程中,无痕的内嵌式营销将成为主流,而现有基于稀缺性的消费文化将面临深刻挑战。
五、消费者对AI内容的接受度如何?消费者是否愿意为AI生成内容和服务付费?
楚利彬:作为频繁参与行业评审的观察者,我注意到当前AI生成内容确实处于追赶人类影像标准的阶段。这种“追赶”本质上取决于两个核心因素:首先是美学驯化水平——若模型使用高质量电影素材进行训练,其产出自然会具备专业影像的构图、光影等视觉规范。其次是物理模拟真实度。观众觉得AI内容“假”,是源于模型对物理世界规律模拟的不足。当某个平台能通过世界模型实现对重力、材质、运动轨迹等物理属性高度 拟真的模拟,再结合前述的美学控制,就会自然形成精品AI影像——它既符合人类对“高级感”的审美认知,又具备以假乱真的物理合理性。
陈坤:对大多数消费者来说,他们并不关心内容是否由AI生成,只关注内容是否打动自己。就像短剧发展历程一样,最初被认为是低质内容,随着政策支持、资本投入和创作者涌入,内容形态和商业模式都在升级,吸引更多受众。AI内容也是同理,普通观众不会刻意关注“含AI量”,只在乎内容本身的吸引力。目前有些人对AI内容反感,主要是因为AI能力尚未完善,在表演细腻度、场面调度、动作流畅度、一致性等方面还存在瑕疵,影响观感。
赵天奇:我认为目前主要矛盾是人们生活中对好影视作品的需求,没有被满足,生产力难以满足他们的需求。影视产业一直生产力不足,到现在依然没有彻底颠覆。影视行业实际上没有那么多好内容,生产力低下才是问题根本。作为一名从事技术工作的人的使命,是打破从“不能”到“能”的局面。至于能了以后,有没有用好,值得很多人研究解决。我不认为AI会导致内容同质化,能力有了之后还是为人服务的,当人们需要多样性时AI自然生产出更多样性的产品。如果同质化那说明AI的力量不够强,导致同质化。人类不会因为是AI内容而想看,人类就是想看好的东西,这也意味着AI必须达到人类所需要看到的作品的水平。首先是拥抱价值,满足人类需求这是第一位。
六、对AI内容爆发式增长是否存在隐忧?
赵天奇:我始终认为生成式人工智能的能力不足才是应该担忧的问题。作为技术发明者,我们更多关注的是哪个能力不足,需要继续努力,从不能变成能的事情。
陈坤:目前最大的担忧是,在AI热潮中很快会陷入极其残酷的价格战。由于AI成本远低于传统影视,如果单纯按市场逻辑判断,可能会出现大量同质化、低质内容冲击优质内容的情况。虽然这不可避免,但随着AI技术发展,当出现传统影视做不到、AI 能做到的内容时,行业会出现拐点。在此之前,可能都会陷入卷价格、卷效率的竞争。
楚利彬:我感觉时间太宝贵了,每天都在“狂奔”。这种狂奔,不在于要去追赶某项具体的技术,而是我觉得自己的认知提升速度太慢了。如果要对过去的“智能”做一个模拟性总结,那就是我们用了大量的能量,去将一件事情“确定化”,这个过程就叫智能。我认为未来的整个智能发展,关键就在于我们这一代人,如何将它推送到一个“可控”的世界里面去。
本文来自微信公众号:腾讯研究院,作者:破晓访谈