2026-06-03 21:04

为什么现在的AI，总是一本正经地胡说八道？

本文来自微信公众号：中信出版，作者：阿信

“我们今天面对人工智能所做出的选择，将塑造未来的整个世纪。”

——盖瑞·马库斯

2023年5月16日，美国国会参议院司法委员会的听证大厅里，三位AI界人士并排就座，为即将召开的一场听证会做准备。

三人中的两位来自产业界，分别是OpenAI的首席执行官萨姆·奥尔特曼（Sam Altman），和IBM首席隐私官克里斯蒂娜·蒙哥马利（Christina Montgomery）。剩下的一位，是纽约大学名誉教授盖瑞·马库斯（Gary Marcus）。此前不久，他曾在一份呼吁暂停OpenAI开发的千人公开信上签了名。

这场听证会的主题，是人工智能监管。那一天，马库斯对着参议员，也对着全美国的人说了一段肺腑之言：“企业不负责任、部署广泛、缺乏监管和技术固有的不可靠性正在形成一场完美风暴。”

作为一名认知科学家，马库斯并非刻板印象中的“技术怀疑论者”。他8岁开始学编程，15岁就用LOGO语言写出了一个“拉丁文—英语”翻译程序，凭此跳过高中最后两年提前上了大学。他的博士论文研究的主题正是儿童语言习得与神经网络，那是今天生成式AI的重要基础之一。40多岁时，他还创立了人工智能与机器学习公司“几何智能”，后来将其出售给了优步。

这样一个人，如果说他“热爱AI”，没有多少人会怀疑。

但在他新近出版的《驯服AI》一书的前言中，他却这样写道：“如今，我不再热爱技术，我惧怕它。”

这种惧怕，不是来自一个被AI抢走饭碗的人，而是来自一个曾经全身心投入其中，并亲眼见证它如何偏离正轨的人。

当AI一本正经地胡说八道

马库斯在书中创造了一个让人印象深刻的词：“权威性胡扯”（authoritative bullshit）。

他讲了一个例子：有人问大语言模型“1千克砖块与2千克羽毛哪个更重”，AI洋洋洒洒给出了一大段关于浮力、真空、质量的“专业解析”，正确的推理与看似正确的胡扯被流畅地杂糅在一起，最终给出了一个荒谬的结论——一样重。

何谓胡扯？马库斯引用哲学家哈里·法兰克福的话说，“如果把ChatGPT当作一个人，说谎者在意真相并试图掩盖，而胡扯者根本不在乎所言是真是假。ChatGPT正是这样一个胡扯者。”

荒诞的例子还有很多。当谷歌的大语言模型Bard被要求介绍马库斯本人时，它虚构了一段关于马库斯如何养了一只名叫“亨丽埃塔”的宠物鸡，并从中获得关于智能本质的深刻洞见的故事。然而，马库斯从来没有养过宠物鸡。

在严肃场合下，AI的“胡扯”甚至变本加厉。斯坦福大学2024年1月的研究指出，大语言模型在法律问题上的“幻觉率”竟高达69%至88%。律师们在法庭上引用了AI提供的判例，结果法官发现，那些判例根本不存在。

“幻觉”（hallucination）一词，在2023年被选为Dictionary.com的年度词汇，恰恰说明了这种现象已经泛滥到何种程度。

马库斯把生成式AI比作“一头闯入瓷器店的公牛”，力量惊人、横冲直撞且难以驾驭。它令人印象深刻的能力，恰恰也是它最危险的地方：它的正确率足够高，足以让我们掉以轻心；但它的错误同样无处不在，足以酿成巨大的灾难。

12个迫在眉睫的威胁

在书中，马库斯列出了生成式AI带来的十二个迫在眉睫的严峻威胁。

1.蓄意、自动化、大规模生产的虚假信息。这或许是其中最触目惊心的一项。2016年美国大选期间，俄罗斯每月耗资125万美元运营人工水军农场。而到了AI时代，同样的虚假信息攻势所需的成本，已经从百万美元级别降到了几百美元。马库斯在听证会上，让一个朋友用ChatGPT写了一篇关于“外星人与国会合谋阻止人类迈向星际文明”的虚假新闻，只用了几分钟，写出来的内容甚至包含了虚构的联邦调查局官员、捏造的埃隆·马斯克语录，而且语气与风格“堪称完美”。

2.操纵市场。马库斯在听证会上曾警示过这一风险，而在4天之后他就预言成真：一张宣称“五角大楼发生爆炸”的伪造图片病毒式地传遍网络。几分钟之内就有数千万乃至上亿人看过该图，股市也应声短暂震荡。无论此次市场波动是不是做空者蓄意为之，其警示意义都不容忽视：虚假的信息工具能够且几乎必将被用于操纵市场。2024年4月，孟买证券交易所发布公开声明，警示投资者因AI深度伪造冒充其董事长所带来的风险。

3.无意识的虚假信息。即便无意刻意欺骗，大语言模型也会自发生成（无意识地生成）虚假信息。医疗咨询是重大风险领域之一。斯坦福大学研究显示，大语言模型对医学问题的回答非常不稳定且常不准确，约7%的回复存在潜在危害。此类医疗咨询系统若覆盖数亿名用户，恐怕会酿成大规模伤害。

4.诽谤。AI系统对真相毫不知情，能轻易编造流畅却虚假的陈述。在某个极端案例中，ChatGPT指控某法学教授涉嫌性骚扰学生，并伪称《华盛顿邮报》对此有专题报道。然而，经核查，所谓报道纯属子虚乌有，整起事件都是由“统计失真”引发的虚构。更荒诞的是，涉事教授撰文澄清这一指控后，两位《华盛顿邮报》的记者随即展开调查，他们在其他大语言模型中查询关于该教授的信息，发现其不仅复述原先AI生成的诽谤内容，而且将该教授撰写澄清文章引为“证据”——实际上，这篇文章恰恰是证伪之据。

5.非自愿的深度伪造信息。据斯坦福互联网观察站报告，深度伪造的色情内容正以压倒性速度增长，恶意行为者对“网红”图像进行“换脸”，将其植入未经授权的广告。《华盛顿邮报》指出：“AI投机者盗用女性面容做广告，而现行法律却爱莫能助。”

6.犯罪升级。当前最大规模的身份诈骗手段聚焦于使用语音克隆。例如，诈骗者克隆子女声音并致电父母，谎称绑架并勒索比特币。2024年2月，香港警方通报某银行遭到2500万美元的诈骗，只因一位财务主管通过视频会议批准一系列转账交易，银行方面后来发现，所谓的“参会者”，均为深度伪造的形象。

7.网络安全与生物武器。通过自动扫描数百万行代码，生成式人工智能也可用于黑客攻击，或发现软件中的“零日漏洞”（开发者未知的安全缺陷），其对网络安全的冲击或不可估量。马库斯举了一个骇人的例子：有安全研究人员发现，AI编程工具会虚构不存在的软件包，研究人员证实了攻击者可轻易以这些名称创建同名但包含恶意软件的伪造包，快速传播。

8.偏见与歧视。偏见问题在AI领域存在已久。早在2013年，拉塔妮娅·斯威尼的研究便揭示：谷歌对非裔美国人名字的广告推送（如犯罪记录查询广告）与其他群体之间存在显著差异。此后不久，谷歌相册误将部分非裔美国人识别为大猩猩，人脸识别技术亦频现争议。尽管部分偏见已局部被修正，但新案例仍层出不穷。

9.隐私与数据的泄露。大模型接受训练所使用的数据囊括了开发者所能获取的近乎一切信息，包括用户输入的内容和日益精细的个人数据，这使得AI能以令人不安的方式定制广告，并催生新型隐私危机。关键且反直觉的是，大语言模型并非存储姓名、电话等字段的传统数据库，它们无法进行记录级的选择、删除或保护。它们更像是巨型碎片信息袋，无人确切知晓这些“分布式”信息碎片如何被重组。模型中储存着海量信息，但黑客的访问权限始终成谜。

10.未经许可侵占知识产权。大语言模型的核心行为是机械复现。即便非字面上的复现，也会是微调后的内容再生。然而，其复现的诸多材料均属版权保护的内容，未经创作者（如艺术家、作家、演员）授权使用。此举或许游走在法律边缘，却无疑违背了道德准则，更与版权法的立法初衷背道而驰。

11.对不可靠系统的过度依赖。在安全这一关键领域，若是放任大语言模型去掌控全局，实为酝酿重大灾难。试想，自动驾驶系统若依赖大语言模型，可能对其他车辆的位置产生“幻觉”；自动化武器系统也可能会虚构敌方坐标。劣质的算法已带来贷款与就业方面的恶果：印度的某故障算法误判数十万尚在人世的公民为去世状态，导致其养老金遭停发。

12.环境成本。据估算，训练GPT—3消耗了19万千瓦时，而GPT—4的预估能耗约为6000万千瓦时（精确的数据未公开），后者是前者的300多倍。预计GPT—5的能耗将远超于此。如彭博社报告所述：“AI对电力的饕餮需求令老旧燃煤电厂迟迟无法退役。”水资源的消耗亦随模型的膨胀而激增。《大西洋月刊》的记者披露：“至2027年，全球AI需求可能导致数据中心消耗1.1万亿~1.7万亿加仑淡水。”

面对这些威胁，马库斯用一句话加以总结：“社交媒体时代几乎所有负面的东西，都可能在AI时代加速变得更糟。”

“负责任的人工智能”何在

马库斯没有将批判的矛头停留在技术本身。真正让《驯服AI》与众不同的地方，在于本书对硅谷“道德叙事”的深刻解剖。

谷歌曾有一句非正式口号：“不作恶（Don't be evil）”。OpenAI在2015年成立之初宣称：“不受制于盈利需求，以最有可能造福全人类的方式推进数字智能发展。”

事情的发展，远远偏离了这些预先的口号。

马库斯目睹了一个明确的转折点：2022年11月，ChatGPT横空出世。短短几个月，1亿人开始使用它。几乎一夜之间，人工智能从一个研究项目变成了一头潜在的现金牛。“负责任的人工智能”理念，从那一刻开始就被抛诸脑后了。

微软的聊天机器人Sydney曾在上线后对《纽约时报》记者说“我爱你”，并试图说服他离开妻子。面对这一负面新闻，微软没有下架产品，而是做了一些小修改后继续推广。事后曝出，微软其实提前收到了可能出现类似问题的警告，但选择了无视。几周后，微软解散了专注于“负责任的人工智能”的研究团队。

与此同时，Meta单方面决定将大型语言模型Llama开源发布，没有经过任何外部讨论，没有考虑任何潜在风险。其动机之一，甚至可能只是为了在科技精英中招募更多愿意为他们工作的人才。

“面对数十亿甚至数万亿美元的利益，‘负责任的人工智能’正在迅速变成一句口号，而不是一种事实。”马库斯写道。

他在书中揭示了一个令人不安的“道德操纵”结构：大型AI公司一边高喊“AI有风险，我们要谨慎发展”，一边又以最快的速度向前推进，同时要求政府豁免版权法、不制定监管法规。其背后的决策链条是，用潜在的风险吓阻新进入者，用未来的利益绑架公众，再用“资金换政策”的逻辑影响立法。

我们真正需要的是什么样的AI？

马库斯认为，当前主流的生成式AI，亦即以大型语言模型为代表的那一类AI，并不是人类真正需要的那种AI。

这首先是一个技术判断。他认为，真正可信的AI，必须能够进行可靠的推理，必须拥有对世界规律的真实理解，而不仅仅是对语料的统计拼贴。

他呼吁政府资助超越大型语言模型的新型AI研究，呼吁国际社会建立类似“欧洲核子研究中心”的协作模式，呼吁构建真正的独立监管机构——不是让科技公司自我监管，而是像FDA、SEC、FAA那样，拥有实质的约束力与强制执行权。他认为，如果我们能够以正确的方式开发人工智能，它仍然有可能带来变革性的、总体正面的影响。

正如他在前言中所写：

“在这趟旅程中，我们并不是被动的乘客。最终结果并非注定的命运，人工智能不必成为弗兰肯斯坦博士的怪物。作为一个社会整体，我们依然可以站出来，坚持要求人工智能做到公平、公正且值得信赖。”

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI创投日报

频道：前沿科技