扫码打开虎嗅APP
本文来自微信公众号:林华(ID:gh_4d992808ffdf),作者:林华,原文标题:《AI文生内容的版权战争:从个案到根本逻辑》,题图来自:视觉中国
一、AI文生视频第一案开播
(一)第一案背景
AI大模型引发的新热点和新争议必然从技术席卷到产业、社会和法律,AI相关版权纠纷从出现到爆发都是可预见的趋势。北京互联网法院2023年底判决国内首起AI文生图版权侵权纠纷案(2023京0491民初11279号),2024年5月15日就升级到开庭审理AI文生视频(有独创性的视频对应版权法中的视听作品)侵权首案。
综合在开庭前后的多项报道[1],北京互联网法院新近公开审理这起AI大模型文生视频侵权案原告是《山海奇镜》预告片作者“闲人一坤”(陈坤),被告是抖音账号“文刻创作”。作为一位专业导演,原告主张《山海奇境》预告片是自己结合多种AI工具创作,融合山海经等多类元素生成的动画,以“闲人一坤”署名在短视频平台发布后广受关注。原告并主张被告以抖音号“文刻创作”名义对《山海奇镜》预告片进行修改,生成与其高度相似的侵权动画。
原告认为被告完全复制原告预告片的文案、配音、音乐,并通过AI工具对预告片的镜头进行修改。侵权动画在镜头内容、形象造型、色彩搭配、画面布局等整体视觉效果以及画面局部细节特征,均与原告作品一一对应并具有高度相似性。被告抄袭原告作品且声称侵权作品为其原创,删除原告署名并篡改来源。
(二)三个争议点拆解
本案预告片绘制历经提示词优化、概念图生成到图转视频的多个环节,每个阶段需要使用不同AI工具接力绘制。原告描述在视频生成阶段使用PixVerse工具,这是一个提供包括图生视频及文生视频功能在内的多模态输入AI。各方报道都表述本案为首起文生视频纠纷,应该是在使用PixVerse生成视频的环节同时利用了前道工序生成的图片视频化,至少两道工序涉及使用文生内容。
《山海奇镜》预告片引起的AI文生视频首案虽然引起不少关注,但目前还没有看到有专家评论支持胜算在原告。估计这不但是新类型纠纷裁判容易产生不确定性,也和本案被诉侵权视频没有直接搬运预告片原作的镜头,而是以其为基准做了重绘(可以肯定也是使用AI工具)有关。北京互联网法院裁判文生图版权纠纷案后,很多专家坚持以指令提示词方式使用AI文生图工具生成的内容不应受版权保护,也是影响媒体对文生视频首案结果预判的重要原因。
我认为本起AI文生视频版权侵权纠纷的裁判结果应当对原告有利。本案法律争点和基本观点可以分为三点:
1. 提示词驱动的AI生成内容是否可受版权保护。对这个问题,我的观点是肯定的;
2. 不考虑AI因素,只适用传统版权侵权判断标准是否可以确认被告构成侵权。我的意见同样是肯定的;
3. 原告针对法理依据上的障碍,证据组织和理由论述是否有效。本题答案依然选R。
对第1个问题,即提示词驱动AI生成内容的可版权性,本文会连同版权归属问题在稍后部分具体展开。本部分专门论述仅适用现行版权侵权判断标准分析被告行为,以及原告举证和论述中足以支持自己主张的部分。
(三)依据现行版权侵权标准
排除视听作品形成过程所需的剧本、脚本等后台内容,只以动画视频最终呈现形态而论,也是集成音乐、台词、配音、美术等多个独立单元/作品有机组合的整体作品。整体作品可以和作为集合作品构成元素的独立作品相互分离。即使不论本案涉及动画预告片整体是否构成作品,被告全盘照搬预告片独创的文案、配音、音乐,就足以认定对上述单元构成侵权。
先不考虑本文稍后会集中分析的AI参与生成内容独创性问题,预告片作为整体作品,保持其主线及具体情节不变,而对作为作品外观的美术部分进行针对性修改,也类似游戏侵权中的换皮抄袭。
参考《山海奇镜》案原告在诉讼和采访中的表述以及截图证据,和游戏换皮侵权可能适用反不正当竞争法规相比,本案被告直接抄袭预告片文案等基本元素,并针对视觉表达逐帧进行模仿性替换,都适合径直认定侵害改编权。
(四) 原告合理举证和论述
由于很多版权法学者主张,即使是人类用户通过提示词方式利用AI文生图工具生成内容也不受版权保护,本次文生视频案原告主动规避对AI创作环节的论述,着重强调人类作者在创作过程中的主导地位和决定作用。
根据原告在媒体采访时的陈述和提供的创作流程图,原告除了将AI在创作中的作用解释为纯工具,并强调由自己提出创意及在多种AI工具配合下反复优化,将创意依次具象成可执行脚本、概念图和视频,最终由人工完成后期配音和剪辑。
1. 创意设立阶段流程图:通过专属AI agent将创意和灵感转化成视频脚本。
2. 文生图示意图,配合使用Midjourney和Dall-E 3生成概念图,写出更专业的prompt后再使用Midjourney生成优化后的图。
3. 图生视频示意图,通过视频生成工具PixVerse将图片转化为高清视频。
4. 剪辑阶段,基本通过人工完成视频的配音和剪辑。
原告在媒体采访中反复强调“AI只是一个工具,前期和后期依旧依赖大量人工”,主张“即便AI工具提高了效率,但背后依旧是以人为主导进行的操作”。原告表述显然是主动规避对AI模型生成内容独创性的争议,将创作的重心固定在受人类作者控制的流程中。
原告有针对性的组织证据材料和主张,绕开理论争议的陷阱,有助于案件审理集中在人类作者对视频生成结果做出创造性贡献的事实中,为赢得裁判支持做了不错的铺垫。就本案个案而言,我认为法院有充分事实和法理依据支持原告对认定被告侵权的诉请。
二、提示词对AI文生内容有独创性贡献
(一)AI模型生成内容的独创性
《山海奇镜》案的相关事实以及材料组织有利于原告,但个案中的具体事实受法理上的原则问题影响,如同分子受到分母限制。尽管中国司法系统在北京互联网法院审理的首起大模型文生图案判决后,文生内容类型案件已对AI作为创作工具形成一定共识,但学术界对2023京0491民初11279号(文生图案)判决的集火式批评仍然是本案裁判需要面对的,尽管判决实际上可以选择正面回应或和原告主张一样回避障碍。
我认为提示词驱动的AI生成内容是否可受版权保护,可以分为AI大模型生成部分是否有独创性,以及人类用户的提示词对生成内容是否有独创性贡献这两个问题来分别论述。通俗点解释,AI根据提示词生成的内容如果具有独创性,问题就成为独创性来自大模型还是人类使用者的提示词。虽然“分析版权独创性问题难度之高,犹如应对鳄鱼在水中绞杀猎物的死亡翻滚”,但拆分出的两个问题对法律变革产生的冲击和影响完全在不同的量级。AI模型是否具有独创能力问题,甚至会动摇伦理学和社会基本制度,雷区之广远超法学一域。而人类给定的提示词对模型生成内容是否有独创性贡献的问题,即使对当下法律也不会产生特别的影响。
事实上,北京知识产权法院在去年对文生图首案的审理中,就有意把裁判重点集中在冲击不太大的提示词的独创性贡献问题上,对AI模型是否具有独创能力的争议,只粗略给出对现有理论冲击最小的保守答案。和法院解决具体争议为导向的务实做法相比,研究版权法理论的学者大多执着追求一步到位完美解决AI大模型的版权争议,试图同时咬住AI生成的独创性分析以及提示词在AI生产结果中的独创性贡献两个问题。但结果是很多论文同时做错这两道题。
(二)AI内容版权《登记指南》:提示词生成内容并不是版权保护的禁忌
美国版权局(US Copyright Office)2023年3月发布《含AI生成内容的作品版权登记指南》(下称《登记指南》),同样试图一次性解决AI大模型版权争议,对大模型和人类提示词的独创贡献分别做了分析和规定。在影响广泛的《太空歌剧院》(Théâtre D’opéra)AI作品版权登记案行政裁定(以下称裁定)中[4],美国版权局和版权复审委员会正是按照《登记指南》的规定,两度驳回申请人主要利用绘图大模型Midjourney通过提示词生成的获奖美术作品《太空歌剧院》的版权登记。
虽然美国版权法也承认作品自完成时自动产生无需以登记为条件,但美国法和中国法规则差异巨大的是未登记作品无法进入联邦司法程序(17 U.S.C. § 411 - Registration and civil infringement actions),所以USCO是否接纳登记决定(美国人的)作品版权登记具有很强的实际意义。
美国版权复审委员会对《太空歌剧院》的裁定在中国版权学术界得到广泛支持,尤其成为每篇反对AI生成内容受版权保护论文都重点援引的依据。考虑到这一点,本文集中针对裁定意见与《登记指南》,就AI文生内容可版权性的核心问题展开论述。本章针对分析裁定和《登记指南》对提示词,关于AI大模型是否有独创能力将在本文下一章讨论。
虽然《太空歌剧院》版权登记案的基本剧情,是人类作者艾伦(Allen)在至少使用624个提示词并多次调整,才完成最终生成内容的情况下仍然被驳回登记申请,此处仍值得指出裁定和《登记指南》都没有一刀切,排除对AI生成内容得到版权保护的可能性。
从《登记指南》来看,指南在第III部分“人类作者身份”中明确规定对包含AI生成内容的版权登记审查需进行个案审查(necessarily a case-by-case inquiry),且版权局接受“......包含人工智能生成材料的作品也将包含足够的人类作者创作元素来支持版权主张”。例如,人类可以以足够创造性的方式选择或排列人工智能生成的材料,“最终的作品作为一个整体构成了原创作品”。
裁定同样并未以申请人使用提示词控制AI为由直接驳回登记申请。裁定披露驳回申请的理由是:“尽管申请人Allen主张其输入至少624个文本提示并进行了大量修改,才得到最终获奖的申请登记作品,但因申请人以‘具体提示和输入是秘密’为由拒绝披露任何具体提示,使委员会无法评估申请人提示本身是否具有足够的创造性”。(Mr. Allen declined to disclose any specific prompt on the grounds that “specific string of prompts and inputs are confidential.” ...... Nor could the Board consider whether the prompts themselves were sufficiently creative to be independently protected by copyright since Mr. Allen has not disclosed them)[5]
康奈尔大学James Grimmelmann教授在2024年1月一次生成式人工智能研讨会上对“太空歌剧院”案裁定也给出类似解释:“尽管在案中,一幅包含600多个指令并获得大奖的AI生成作品被美国版权局驳回申请,但创作者并未披露这些指令的具体内容,也没有披露AI生成的原始草图。美国版权局和法院正在鼓励创作者积极披露自己的参与程度,否则就会因为证据不足而无法获得版权保护[6]”。
事实上,美国版权局对通过AI完成的整体作品予以版权保护登记的案例并非只有版权界熟知的漫画《Zarya of the Dawn》登记案,美国退伍女兵Elisa Shupe使用ChatGPT完成小说AI Machinations: Tangled Webs and Typed Words后被USCO拒绝版权登记,在布鲁克林法学院提供的专业支持下通过行政复议获得对小说整体版权的登记。结合指南与案例[7],即使对AI版权登记要求严苛的美国版权局也没有锁死AI作品登记的大门,而很多中国学者包括律师对提示词生成内容的可版权性一概反对。
(三)提示词对AI生成结果的独创性贡献实证
通过提示词使用AI进行创作,尤其生成结果的形式和提示词的文本形式不一致例如文生图和文生视频情况下,AI使用者输入的提示词对最终生成内容是否有独创性贡献存在争议。我认为创作是否具有独创性是事实问题而不是法律问题,不能仅因为事实问题会产生法律效果就混淆问题的属性。对事实问题应该由相关人士做客观的专业判断而非法学的有限逻辑进行判断。法学家如果在非法律问题的判断上也不存在专业隔离,场景就类似医生认为当事人活着而法官摆手说不,他已经死了。
很多中国学者认为人类用户通过在生成式AI输入提示词方式生成内容不属于创作,《登记指南》也认为纯粹使用提示词的方式不能证明人类对生成内容有创造性控制。鉴于安排在本文后半部分阶梯展开对控制理论的分析,此处只总结USCO和大多数中国学者都认为单纯提示词对AI生成内容不具有创造性影响,而这和北京知识产权法院在文生图首案判决中的观点有差异。在这个问题上我则是完全认同法院在判决的分析。
我在《妥协是渐进的艺术》一文中已经对从文化史、案例访谈和实证角度对提示词在AI生成内容中的独创性,即文字向美术等内容形式转化中的互通关系做了详细论证。本文从艺术创作规律和美术实践等角度做部分补充。
1. 艺术创作规律
文字作品和美术作品之间的审美和独创性不能互相转化是很早就有的观点。不但有人认为文字的独创性不能和美术作品通约,也有主张美术作品无法用文字进行表达,而这些观点本质上都只是被作品物理形态固化的感官偏见。对想象力和理解力的自我阉割成为这种错觉的代价。
美学家阿恩海姆针对视觉和语言不能互相描述的观点有专门反驳:
“在这种种的偏见中,有一种声称说,视觉事物是决然不能通过语言描述出来的......当然,语言并不是我们的感觉同现实接触的通路--它仅仅是给那些看到、听到成想到的事物赋以名称。但对于描述和解释视觉对象来说,语言却并不是一个生疏的或不合适的媒介......我们的视觉分析系统还能够进一步地得到发展,并且还可以唤起能够‘透视’事物的那些潜在能力。而这些潜在能力的发挥,又能帮助我们弄清那些不能够分析的事物的本质”[8]。
2. AI美术实践和专业方评价
在我对游戏行业的访谈中,动画师和技术美术师(AI专家)对提示词水平与大模型生成结果之间的关系都给出手眼一致的观点,要求越专业越复杂的AI美术对提示词的水平就要求越严,模型输出内容和画师能力必然是线性关系。北京邮电大学人机交互与认知实验室主任/博导刘伟评价大模型绘画工具时也认为“这些软件(大模型)都有一个共同特点,就是‘欺软怕硬’——你的水平越高,它给你的东西越好;你的水平越低,它就泛泛而谈”[9]。
中信出版集团在出版商务周报的一篇报道中介绍了使用大模型为一套屡获大奖的引进版经典科幻丛书(“血与锈”)进行翻译和生图的具体操作[10]。设计师首先从插图入手,“......我们根据(图书)文本先提取关键场景,总结画面场景、主体、视角等提示词,利用Stable Diffusion工具,再根据生成的画面风格进行调试”。最终定稿如下图:
设计师在书封绘制中,“.....以《海洋之神》的书封为例,根据文本关键词先生成基础底图,再通过调整画面色调、主体位置和利用AI图片扩展功能,一键生成了书封全景图,最后排版完稿”。定稿这张乌云密布的海上幻境见下图:
从游戏美术师访谈到技术专家总结以及一线设计师的实操介绍,AI绘画相关专业的意见和实践都证明在文生内容过程中提示词的设计对最终生成内容的决定性影响。不论中美,如果法学家相信用(自己的)法学逻辑能推演出比客观事实更正确的结论,这里只想借一个段子:真正的冷不是你冷,是你妈觉得你冷。
(四)错判可版权性对内容行业的负面影响
OpenAI在2024年2月15日刚发布革命性的文生视频工具Sora,CCTV-1在当月26日就播出中国首部AI文生视频动画片系列《千秋诗颂》。好莱坞导演和制片人泰勒·派瑞也在目睹Sora震撼发布后立即意识到道具、布景、编辑、剪辑等影视行业原本不可或缺的基础设施和岗位将被AI取代,第一时间取消自己高达8亿美元的影视制作基地投资计划。
AI文生内容正在迅速改变全球媒体制作的流程和基准。尽管影像艺术作为人类创造力的一座巅峰必然需要相对缓慢的过程被技术所逐步改变,但无可否认AI已经以各种方式渗透在概念、角色设计、建模、贴图与纹理、特效、UI/UX、渲染等绝大部分美术生成环节。
奇酷游戏吴渔夫在媒体访谈中举例开发一款轻度休闲对战游戏把地图和人物、技能效果外包给画图公司可能要花8-10万,但“AI的成本基本上可以忽略不计了,是1000元与10万元的对比”,“我们现在能改的全部都用AI来做了,都不需要美术刻画,直接文生图了”。我自己的判断是在2-3年内所有美术相关的内容创作企业都会不同程度接纳甚至依赖AI作为创作工具,和伽马数据一份新报告对“超过99%的受访者所在的公司(游戏企业)或部门已引入AI技术和工具”观点基本吻合。[12]
AI生成音乐同样引起了娱乐行业和公众的强烈关注。新音乐产业观察在一篇报道中提到众多音乐人联名反对AI生成音乐,同时指出:“讽刺的是,签署了反对AI生成音乐公开信的制作人Metro Boomin,为了挤兑Drake制作了一首名为《BBL Drizzy》的Diss Track,歌里无意中采样了一首AI生成的歌曲”。与此同时“音乐人自己本身也乐于使用AI,音乐人服务平台Ditto Music面向独立音乐人做了一个调查,结果显示有59.5%的独立音乐人在使用AI辅助创作”。用报道中的一个小标题总结,“AI时代已经到了,人类已无法绕道。”[13]
AI创作高发必然伴随侵权增长,从《山海奇镜》预告片的侵权诉讼到前不久360发布会使用第三方AI生成图片做公开演示的纠纷。
大模型文生内容侵权纠纷数量以显见的速度攀升。当AI成为内容规模化生成的标配工具而学术界还在努力论证文生内容不受著作权保护,历史性谬误将对整个内容产业的正常进化产生负面影响。
三、工具与控制论:从经典到幻觉
(一)工具论是AI版权理论的进步
在分析利用AI文生内容的可版权性过程中,中国和美国发展出非常接近AI工具论或者控制论的判断方法。以AI使用人对生成内容是否具有控制能力的判断方法,事实上等同判断AI在创作过程中是否作为工具角色。一些论述增加对AI使用人预见能力的判断本质上是判断控制能力的辅助方法,因为可预见是可控制的当然前提。所以AI工具论和控制论可视为从不同角度表达的同一概念,而预见能力是工具论/控制论展开的具体分析方法。
USCO《登记指南》第III部分明确表示对于包含人工智能生成材料的作品的版权登记判断标准包括:“本局将考虑人工智能贡献是否……代替作者自行原创构思……,特别是人工智能工具如何运作以及如何使用它来创作最终作品”;“在所有情况下,重要的是人类对作品表达的创造性控制(the extent to which the human had creative control over the work’s expression)以及‘实际形成’传统作者身份元素的程度”;“......人类可以以足够创造性的方式选择或安排人工智能生成的材料(select or arrange AI-generated material),‘最终的作品作为一个整体构成了原创作品’”。
北京互联网法院第2023京0491民初11279号判决书在论述AI文生图的可版权性认定标准时表示:“人们利用人工智能模型生成图片时......本质上仍然是人利用工具进行创作,即整个创作过程中进行智力投入的是人而非人工智能模型”;“原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。......其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断”。
根据《登记指南》和北京法院AI文生图首案判决书来看,美国和中国都认可AI生成内容在人类使用者对创作具有控制能力情况下可享有版权,该种情形下实际创作者被认为是人类使用者,而AI承担工具角色。在指南规定和中国法院裁判实践中,AI使用人对AI文生内容的选择、安排、调整都属于人类用户对结果的控制。
(二)指南的矛盾、幻觉与崩溃
如前所引,美国版权局《登记指南》规定人类用户可以通过对AI生成材料进行选择或安排的方式使最终完成的作品作为整体获得独创性以及对应版权保护。在这一层面,中国和美国的法律实践几乎踏在同一节拍。由于《登记指南》未加上述规则加以任何限定,其当然覆盖AI文生内容的场景。
但矛盾的是《登记指南》又表示“根据版权局对当前生成人工智能技术的理解,用户对AI系统如何理解(用户)提示词及生成内容没有最终控制权(ultimate creative control),相反,这些提示更像是委托艺术家的要求——系统识别提示者希望描绘的内容,但机器决定如何在其输出中实现这些指令”。以上意见表明USCO不承认文生内容场景下人类用户对生成内容的实际控制,以实际是否认提示词对AI生成内容独创性的贡献。
为了说明是由AI而不是人类使用者决定和控制文生内容的结果,《登记指南》表示:AI根据提示词生成复杂的书面、视觉或音乐作品作为响应,“作者身份的传统元素”是由技术而不是人类用户确定和执行的。《登记指南》对“作者身份的传统元素”解释为“文学、艺术或音乐表达或选择、安排等元素”,这显然和表述的字面含义一致,落入版权法对独创性的要求。
《登记指南》阐述登记申请评估时表示:(主管部门)首先询问“作者身份的传统元素”(traditional elements of authorships)是由机器构想和完成。对于包含人工智能生成材料的作品,主管部门将考虑人工智能贡献是否是“机械复制”的结果,或者代替作者“本人原创构思”(own original mental conception)......;“如果作品作者身份传统要素是由机器产生的,则该作品缺乏人类作者身份,并且主管部门不会对其进行注册”。值得补充说明的是,英语中“独创性”就对应“originality”(即版权法中的独创性),所以本处“original mental conception”翻译成原创构思是准确的。
以上规定清晰证明,美国版权局为了限制文生内容形式生成内容的版权登记,将人类用户的提示词解释为委托,而将文生图等形式下AI生成内容的独创性贡献划归AI。正是这个安排直接导致指南的逻辑崩溃,因为指南是以AI不具有法律主体资格、不可以享有版权为制度前提,但却承认在文生内容场景下AI正是实际创作者,而人类用户却不可以享有版权。
我曾在《妥协是渐进的艺术》中批评《登记指南》的AI版权不可能三角悖论,“即同时承认AI技术可以生成符合作者传统身份要素(有独创性)的内容,否认AI可以成为版权人,否认人类可以提示词方式控制AI生成作品”。美国版权局不愿意直接承认AI生成的独创能力同时不否认AI文生内容具有独创性,但又不愿承认人类使用者对文生内容享有版权,这就像绅士关注领结而忘了穿衬衫,陷入自相矛盾的幻觉。
否认人类提示词可以对AI生成内容具有独创性贡献,不但使人类自己面临应有权利得不到承认的风险,而且使USCO创造出与独创性等义的所谓“作者传统身份”来分析AI独创能力。结果《登记指南》如同盗梦空间,不同表述撕裂在不同的梦境空间。
事实上文生内容中的提示词,可以根据具体情况区分独创性类型。简单及抽象的提示词实质是命令,例如“画一个钢琴师”,其具象过程完全在于AI。这类场景下不认可AI使用人的版权也有其合理性。虽然USCO裁定和美国学者解释中都可以看到对《太空歌剧院》版权登记申请的驳回是基于申请人未充分披露提示词设计,但以生成结果显示的专业水准和审美上的复杂度,结合申请人对仅提示词就使用至少624个的陈述,足以证明提示词对生成结果具有决定性作用,应当承认人类作者享有版权。
(三)从单纯工具到人机双打
《登记指南》的一个重大失误是首先生硬创造出“作者传统身份要素”代替独创性,然后把文生内容的独创性归于AI,却又坚决不承认AI可以成为版权主体。大模型是否具有独创能力是重要且敏感的事实问题,USCO没有能力解决承认大模型独创能力对法律体系带来的压力,却选择掩耳盗铃的方式间接承认,翻车就势在必然。
实际上USCO在《登记指南》以及对《太空歌剧院》裁决中的逻辑崩溃是完全可以避免的。在利用AI进行文生内容的场景中,承认人类使用者提示词的可版权性和AI工具论并不冲突,因为本质上文生内容的创作过程不是传统的人类单打,而是人机混合双打。
工具是可以区分类型的。比如在弹钢琴过程中,钢琴师的白手套不发生任何变化,这是最初级的工具;钢琴根据预制的设计,对不同琴键和节奏的弹奏做出不同反馈,这是纯机械但可以表现出一定变化的进阶版工具;文生内容过程中的AI模型和钢琴与键盘之类工具又有所不同,模型对提示词具有积极和能动的反馈。至少对发展到GPT4时代的大模型,已经是具有相当思考判断能力的主动型工具,这是人类前所未见的。
人类用户使用大模型进行文生内容,从提供提示词到AI的理解与展现,人和机器共同影响和决定最终生成内容。在提示词具有充分独创性的条件下,文生内容作品同时包含人类和AI各自的独创性,形同人机混合的双打。在形成人机混合双打的场景下,无论使用人还是AI都不是单方决定生成内容的原创性。在文生内容场景下如果还要求人类使用者对最终生成内容有完全控制或预见(即对内容的单方决定权),本身就违背人机双打的基本事实。
USCO绕着弯承认AI具有独创能力但并没有意识到AI文生内容过程实际是一场人机混合双打,错误低估了提示词对最终生成内容的独创性贡献。不幸的是USCO的这个错误在中国得到相当支持和发扬,以致学界倾向于全面否定AI具有独创能力这个客观事实。
四、告别人类中心主义
(一)偏见与傲慢
人工智能发展到大语言模型阶段,发展曲线越来越接近挑战人类在智慧阶梯中独一的高位。人类一方面在技术上加快发展AI,一方面在制度上防止AI和人类过于靠近。在不少对人工智能低估和片面的分析中,本身就隐含了为人类保卫龙脉的潜意识。
既往全部历史都在证明人类是最高灵性和唯一能创造复杂工具动物,于是人类本能产生出人类作为万物灵长的固化直觉。人类中心主义的自我神话越来越坚固。抛开宗教化塑造释人类中心主义,如果我们把所有主义都当成科学,那么在卡尔波普的科技史观中证伪是比证实更重要的科学工具。既往对人类中心主义再多的证实也可以被哪怕一次可确认的事实推翻。
1. 人工智能的法律主体地位
在全球主流国家法律体系中,虽然很多并未直接规定人类是唯一法律主体,但基本都在法律实践中通过法律解释的方法对此予以确认。USCO《登记指南》表示:“宪法和版权法中使用的‘作者’一词排除了非人类。……在有关作者身份的重要案件中(leading case on authorship),联邦最高法院在解释国会向‘作者’提供对其‘作品’的专有权的宪法权利时使用了排除人类以外的表述”[15]。中国、日本等国在AI相关版权和专利司法实践中对人工智能主体资格的态度与美国一致。
AI法律地位的成文法和判例依据不难检索,我认可通说。但问题到此并未结束,这里有两关键心问题很少被提及和展开:
关于第一个问题,人工智能是否有独创能力是客观事实,而人工智能能否取得主体资格是法律事实。两个事实的判断互相影响但各自独立。
就第一个问题稍做展开,USCO在《登记指南》中表示“版权众所周知只能保护人类创造力生成的材料”,同时多次拐弯抹角表示AI生成内容可以有创造力,这种矛盾态度的深层正是源于USCO意识到AI生成内容是否有独创性与版权归属是两个可以分开讨论的议题。
英国现行版权法(CDPA,<Copyright, Designs and Patents Act 1988>)第178条规定“计算机生成作品”是没有人类作者(no human author of the work)而由计算机创作(generated by computer)的作品;CDPA第9条第3款规定计算机生成作品的版权由对该作品创作进行了“必要安排”的人享有(the author shall be taken to be the person by whom the arrangements necessary for the creation of the work are undertaken)。英国版权法把独创和版权的判断条件以及两者归属都做了区别安排,这种独特的立法例可能在立法当时也大概率无法预见到会给未来的通用人工智能作为参考。
关于第二个问题,人工智能能否取得主体资格不是纯粹逻辑判断的理论问题,更重要的是利益判断的法政策问题。逻辑判断属于应然,而政策影响下的立法是实然。
就第二个问题推进一步,法政策可以为价值观左右,也为实际利益所定制,但和事实或趋势相违的法政策终将改变。贤如美国联邦最高法院,1857年在斯科特诉桑福德案(Dred Scott v. Sandford)判决中也裁定黑人不能拥有美国公民身份且无权在联邦法院提起诉讼。随即而来的南北战争为历史迅速翻过这一页。1908年颁布的大清《钦定宪法大纲》总纲第二条规定大清皇帝统治大清帝国万世一系永永尊戴,后面发生的事情人类都知道。
刚才是站在逻辑和应然的角度分析,下面我们站在人类而非纯技术的角度思考法律制度的建构与进化。人工智能是否具有独创能力的证明放在下文继续讨论,为分析方便此处先假定(虽然我个人确实如此认为)人工智能实际具有独创能力,那么我们是否要为人工智能建立专门的法律主体地位呢?
面对新问题探索应该积极,制度建构需要谨慎。主体制度影响的不单是版权,而是整个法律及其之外的伦理和政治。人类法律制度不论在其全部历史还是在设计原点上,都没有考虑过人类以外的第二选项。所谓拟制人,实际上不论国家还是企业的法人组织背后都是人的意志,但AI一旦从思考发展到自我意识,必然和人类在主体和意志都相互分离。
当下法律制度不具备容纳人类以外的独立主体,贸然改动法律底层结构的这一个受力点就可能动摇用几千年建构的法律大厦地基。在人工智能法律建构的观点上,如果保守是对手,那么激进可能是敌人。保守的错误还有机会治疗,激进的代价可能更加巨大。人工智能法律主体地位的研究需要积极探索谨慎建构,在理性中保持自然演进。
2. 自由意志条件是对独创性判断的加戏
之所以会有对AI独创能力的种种错误观点,一个相当重要的原因是在潜意识中修改判断条件,尤其是在自己可能都没有意识到的情况下悄然加戏。
一种广为流传的否认AI具有独创能力的观点是生成式大模型还不具备自由意志,因此没有独创能力也不是法律主体。如前文所述,我认为是否具有独创能力和是否成为法律主体分别是客观事实判断以及法政策制定的不同问题,对实然和应然问题不做区分无法导致正确结论。
对是否具有自由意志的规定,在版权独创性构成条件中是从来不存在的。中国著作权法第十一条对法人作品的规定即为“由法人或者其他组织主持,代表法人或者其他组织意志创作,并由法人或者其他组织承担责任的作品,法人或者其他组织视为作者”。法人作品创作和完成所代表的意志是被“视为作者”的法人,而不是实际创作的作者,自然人创作者在版权法上不存在自由意志。
生成式技术发展对认知科学带来的挑战要比对语言科学的挑战大的多。生成式大模型在结构上也依赖仿脑神经的多种神经网络,但和人类大脑遵循以符号定义和逻辑为核心的符号主义下形成认知,而大模型的自学习路径纯粹依靠数学。在智力生成过程上,人类从诞生开始沿着产生自我意识->积累知识->形成思维能力的结构,而人工智能的智力生成是沿着知识->能力(如推理)->意识的过程。
换言之对人类而言意识是先天本能,思维能力是智慧形成的最高一阶。对人工智能而言思维能力通过预训练中的涌现就可以主动形成,但意识却是AI技术发展要克服的最后一座巅峰。意识和智慧是两个不同的问题。人工智能独创能力判断和思维能力(智慧)形成阶段有关,但独创能力和意识产生在法律和事实上都无关系。
3. 放弃单方宣布的胜利
为了证明人工智能没有思维能力和独创性,很多智者发掘了多姿多彩的理由,但事实上人类连自己的思维能力如何产生也并不清楚,在这样前提下就断言人工智能使用数学方式不能产生思维能力有违逻辑。
丹尼尔.丹尼特在《自由的进化》中通过对包括著名的Benjamin Libet实验所做深入浅出的辨析,证明即使是最基础的自由意志其实充满争议,对人类意志涉及的复杂心理和生物过程现有研究并不能给出明确的答案;丹尼尔·利伯曼在名著《贪婪的多巴胺》中非常有说服力的阐述了属于生理范畴的内分泌对属于心理范畴的欲望、动机、创造力和决策的关键作用;道金斯在多个科学领域都堪称殿堂级的《自私的基因》则把基因操控的遗传冲动作为影响思考和行为的底层动因,这似乎是跨时代和跨学科的回应叔本华的本能意志观点。
很多法学和社会学论文坚信AI不会思考,没有创造力。以上论文在否认AI具有思维能力时都会主张大模型生成过程的实质是拼凑。对这个观点在我之前文章以及本文中都有直接反驳,本处只增加一点提示,即USCO《登记指南》也将审查中所确认人工智能在生成内容过程中的“机械复制”或“原创构思”作为两种不同情况。
动漫大师宫崎骏对人工智能绘画的批评曾一度成为主张AI只会拼凑和生成内容低劣的有力证据。宫崎骏确实在看过AI动画短片演示后表示对动画深感沮丧,认为AI缺乏对生命和情感的尊重也无法取代人类的创造力。但这个故事原出2016年11月播出的纪录片《宫崎骏--永不停歇的人》,2016年的图像AI和当下领先技术如Sora相比存在从前膛枪到海玛斯的技术落差,拿来做判断依据不错才是不可能的。
硬上也是一种拉低AI的思路。曾见到一位评论家认为人和人工智能相比真正可爱的地方恰好是人会犯错误而程序不会。比如苏轼地理不及格,写赤壁赋居然认错了地方。但我既不知道《赤壁赋》文笔绝妙和地理错误有什么因果关系,也想提示AI其实和人类一样会犯错,而且AI胡编乱造时的幻觉比醉驾都生猛。
《三体》有句名言说:弱小和无知从来都不是生存的障碍,傲慢才是。人类中心主义的硬伤并不在逻辑而恰好在傲慢。
库克(Tim Cook)2017年在参加麻省理工学院毕业典礼演讲时曾说不担心机器越来越像人,更担心人越来越像机器。尽管这句金句实际是呼吁人类不能只考虑实现目标而要更多考虑价值观以及行为后果,但AI法律制度研究中出现的很多过分保守和机械的观念,倒在从一个未曾意料的角度证明库克的担忧。
(二)独创能力在技术角度的简述
技术圈固然也有“随机鹦鹉”的支持者,但像Yann Le Cun和马勇这样顶尖的深度学习专家批评生成式技术却总是明显出于同行相煎。两位大师不论给什么样的理由,最后都会落到只有我家正在研究的技术才能为AI建构世界模型,或者所有支持严格监管AI的人都是企图垄断技术这样阴谋论的放飞。
至于“随机鹦鹉”这样和真实世界明显脱节的观点我在之前的文章已有充分反驳。有很多专业论文也专题批驳所谓鹦鹉理论,例如《自然》期刊网站一篇《ChatGPT 如何“思考”》就通过多层测试指出尽管模型通过学习概率来表达(补充:这是随机鹦鹉理论的核心),“但大模型还展现出推理和其他令人吃惊的类似人类的能力”。[16]
一个更简单的研究方法是直接和人工智能对话来进行测试。当然基于不同AI之间巨大的水平差异,只推荐和GPT-4及其以上版本实验。以下提供两张对其创造能力的问答截图。
深度学习之父Hinton对大模型智能生成原理、现有AI进行创造性思考的实际能力以及未来发展趋势公开做过多次详细论述,有案例有解释,建议有兴趣可以检索。
补充一个本文写作中获得的案例。在检索海外人工智能生成内容可版权性论文时查到一篇对中国AI相关版权纠纷审判的报道。报道的题图使用了复杂的混搭元素,法院庭审背景中站在画面最前的小女孩,女孩身后的机器人,背幕大屏展示的中国国旗。因无法猜测这副显然是AI绘制的报道图,我尝试让新版GPT-4o以报道图为基础写一个故事。
截图请忽略右上角提问时输错的“毕竟”(原意为背景),但这也正好证明大模型具有出色的容错与猜测能力。
事实上GPT给出的这个答案在故事与图片的关联性、想象力、情节性甚至主题深度上都远远超过我对结果的预期,足以终结对人工智能独创能力的种种质疑。
[1] 参见周小燕:《他用AI,抄袭了我的AI作品》,https://mp.weixin.qq.com/s/vHrMMDixGr10YbAHOtdR8w
[2]《妥协是渐进的艺术——从中美案例与规则看AI生成内容的版权逻辑》:https://mp.weixin.qq.com/s/59nOmI36Wo5_5v-KZhqLOg
[3] USCO: <Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence>, https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence
[4] Copyright Review Board: <Re: Second Request for Reconsideration for Refusal to Register Théâtre D’opéra Spatial (SR # 1-11743923581; Correspondence ID: 1-5T5320R)>
[5] 同上,见裁定注释第8点
[6] HKUCCL :《生成式人工智能治理高峰对话系列——知识产权》,https://mp.weixin.qq.com/s/7bM-TaaCZ6HTKLrl2CNfcA
[7] KATE KNIBBS,<How One Author Pushed the Limits of AI Copyright>,https://www.wired.com/story/the-us-copyright-office-loosens-up-a-little-on-ai/
[8] [美]鲁道夫·阿恩海姆 著 滕守尧 朱疆源译:《艺术与视知觉》,四川人民出版社1998年3月第1版,引言2-3页
[9]周雯 等:《生成式人工智能与电影》,转载自《当代电影杂志》,https://mp.weixin.qq.com/s/gO39dS_8-iYWZo3s85-FQA
[10]《AI是“纸老虎”还是“真利器”?我们跟它合作出了一套书》https://mp.weixin.qq.com/s/0SNAfaLLXYNu6qzMHkeZvw
[11]海斌访谈 第一财经:《大厂程序员AI惊梦:步游戏画师后尘?》https://weibo.com/ttarticle/p/show?id=23093505014472384446501
[12] 伽马数据:《新质生产力报告:七成游戏企业技术投入显著增加 AI应用率99%》,https://mp.weixin.qq.com/s/EPzaG4gL9v4x--mNatDDXw
[13]亦思 新音乐产业观察:《反制AI,音乐圈行动起来了》,https://mp.weixin.qq.com/s?__biz=MjM5MzA0MDQ2NQ==&mid=2653581734&idx=1&sn=a8c7aa989c3ae72994692aba88844c1c&chksm=bd43c0988a34498ea31b20cd82a25b6ea81628a1995fece874b6d31121ecc7add09352218b2c#rd
[14] 同2
[15] <Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence>, https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence
[16] Matthew Hutson: <HOW DOES CHATGPT ‘THINK’?>,https://www.nature.com/articles/d41586-024-01314-y
本文来自微信公众号:林华(ID:gh_4d992808ffdf),作者:林华