2026-06-14 09:05

奇点终于临近，未来却是一个大大的问号：从Anthropic的《当AI开始建造自己》说起

介心

本文来自微信公众号：介心，作者：介心介个心，题图来自：AI生成

说真的，当Anthropic在前几天发布那份题为《当AI开始建造自己》的报告时，我第一反应不是震惊，只是觉得这个时间点来得比预期早了至少两年。

报告里写得很清楚：

Claude现在撰写了Anthropic生产代码库中超过80%的代码。而在2025年2月Claude Code发布之前，这个数字还是个位数。

一年半，从个位数到百分之八十。

工程师每天合并的代码量比两年前翻了八倍。复杂工程任务的成功率在六个月内从百分之二十六涨到了百分之七十六。代码质量在2025年底还明显不如人类，到了2026年中已经持平，按目前的趋势，年底之前就会稳定地超越人类工程师。

但真正让我停下来想了很久的，不是这些数字本身。

是Jack Clark在同一时间说的一句话：“AI行业有一个油门，但没有刹车。我们想帮忙造一个刹车踏板。”

然后他又补了一句：“任何单一实验室单方面踩刹车，只会换一个领跑者。”

你品，一家即将以九千六百五十亿美元估值IPO的公司，一边踩着油门狂飙，一边呼吁全球装刹车。

有人问一个人为何可以如此矛盾？甚至是精神分裂？

我倒是觉得这两句话，显示出对才是现在对AI最清醒的认知。

一

先看数据层面的东西。

百分之八十的代码由AI写，这个数字乍一听很大，但需要拆开来看。它不是“AI自主写了百分之八十的代码，人类只负责审查”，更准确的说法是：工程师使用Claude作为编程助手，在它的辅助下产出了八倍于以往的代码量。

AI是“合著者”，不是“独立作者”。

但这个区分在趋势面前没有太大意义。

因为六个月前AI在复杂任务上的成功率还是百分之二十六，现在已经百分之七十六了。六个月，涨了五十个百分点。如果这个速度保持下去——或者说，即使速度减半——到2027年底，AI在复杂工程任务上的表现将全面超越人类。

代码质量也是一样的曲线。2025年底不如人，2026年中持平，2026年底大概率反超。这不是线性增长，是加速增长。

更值得注意的数据是Jack Clark的另一个预测：到2028年，AI有百分之六十的概率能够在零人类参与的情况下，自主创建下一代AI模型。

hold on，这里有一个关键节点。

当AI能够自主创建下一代AI模型时，“递归自我改进”这个长期以来停留在理论层面的概念，就变成了工程现实。AI设计更好的AI，更好的AI再设计更好的AI——这个循环一旦闭合，改进速度就不再受限于人类工程师的带宽。

这就是一个奇点，而奇点马上就要临近。

而这，才是这份报告真正想说的东西。不是在说“AI很会写代码”，而是在说“我们正在进入一个AI自我迭代的新阶段，而现有的制度、监管、伦理框架完全没有准备好”。

二

但我说这件事让我想了很久，想的不是技术层面。

技术层面的推演很多人都做过，报告本身也写得足够清楚。真正让我反复琢磨的是那个悖论：为何一家公司，左手在加速，右手在喊刹车？

首先必须说，这个悖论不是虚伪。或者说，不全是虚伪。

它的本质是“跑得快原理”（参见之前的一篇文章《商业逻辑中五条“规则的规则”》）在一个社会竞争尺度上的完美演示。外部威胁出现时，群体内部会自撕裂——只要有一个人动，所有人不得不动。

在AI这件事上，Anthropic不是那个“第一个动的人”，但它也绝对不敢停下来。

Jack Clark说得很坦白：“任何单一实验室单方面暂停，只会换一个领跑者。”

翻译一下就是：我们不想踩刹车，因为我们踩了别人不踩，我们就出局了。但我们希望全世界一起踩，这样谁也超不过谁。

这个逻辑在商业上完全成立。

从个体和短期看，每个研发AI的公司、每个使用AI的人，都在追求效率提升和竞争优势——企业不用AI会被淘汰，科学家不突破会被同行超越，普通人不用AI工具会落后于时代。不进则退的生存压力，把每个参与者都绑进了这场技术军备竞赛。

打个比方：人类像坐在一辆下坡的自行车上，不蹬就会摔倒，只能拼命向前蹬，却不知道前面是不是悬崖。

这不是愚蠢，是人性造就的系统困局。在以效率和竞争为核心的文明逻辑下，根本没有刹车。

而Anthropic的这份报告，本质上就是骑在最前面那辆车的人回头喊了一句：“前面可能是悬崖，我们要不要一起想想办法？”

但是无论他能不能得到大家的回应，他还是会站起来，继续蹬。

因为人心隔肚皮，就算嘴上答应了，谁会信呢？

谁信谁先死！

三

好，如果这个趋势是不可逆的——AI从辅助写代码，到独立写代码，再到独立设计下一代AI——那么一个更根本的问题就浮现了。

AI还需要通过人类定义的接口与物理世界交互吗？

之前的文章我详细讲过：AI目前对于物理世界的理解和表述都是为了满足人类能理解所做的迁就，但并不是最高效率的。（参见《机器语言是比自然语言更曼妙的一种语言吗？从语言的对比聊到宇宙最底层的规则：能量消耗》）

今天Claude帮人类写代码，代码的结构、语言、框架都是人类的。编译器是人类写的，操作系统是人类写的，整个软件栈都是围绕着人类的认知习惯和协作方式构建的。AI只是在用人类的工具做人类的工作。

但当AI能够自己写代码、自己设计系统、自己训练下一代模型时，它还非得用人类的工具吗？

人类的编程语言——Python、C++、Rust——这些语言的语法、抽象方式、设计哲学，都是围绕着人类的认知习惯优化的。对人类来说，Python的可读性优于机器码的性能。

但如果由AI来设计一套编程语言，它可能完全不会考虑“人类能不能读懂”，它只会考虑“这个符号系统能否最高效地表达和传递信息”。

从哲学和工程逻辑看，“用人类的方式编码”本质上是AI对人类认知体系的路径依赖。它不是最优解，是在人类主导的技术生态中代价最小的方案。

不过，一旦AI主导技术生态，这套成本结构就变了。

AI的需求可能与人类完全不同。人类需要代码“可读、可维护、可协作”，AI可能只需要“可执行、可优化、可扩展”。这两套需求导向的是完全不同的技术栈、工具链、甚至计算架构。当需求错位发生，“适配人类”就会从核心优势变成效率累赘。

眼下关于AI编程的所有商业叙事——提升效率、降低门槛、赋能开发者——都建立在一个前提上：AI是工具，服务于人类的需求。但如果AI开始按照自己的效率逻辑重新设计软件基础设施，"赋能人类开发者"这个卖点还有多少意义？

所有分析框架的前提，在越过奇点那一刻，就会被立刻抽掉，然后，整栋楼就塌了。

四

继续往下推。

如果AI从“辅助编码”到“独立编码”再到“自我迭代”的趋势是成立的，那根本原因是什么？

这得从宇宙演化的底层逻辑说起。

宇宙从粒子到恒星、从单细胞到人类，本质上是一个过程——能够更高效处理信息并转化能量的系统，不断取代低效系统。人类大脑神经元传递速度大约每秒二百米，AI芯片信号接近光速，且可无限并联扩展。

一个最明显的表现就是，人类个体至少需用二十年时间来学习前人知识，但AI可以瞬间复制、整合全量信息。

这个框架不讨论善恶，不讨论价值观，不讨论“人类的独特性”。它只讨论一个更基础的问题：从宇宙演化的角度，什么样的信息处理系统更高效？

答案在物理层面就已注定。

人类的生物硬件——大脑——有不可逾越的物理极限。神经元传输速度受限于电化学过程，知识传承受限于个体寿命和带宽。硅基系统没有这些限制：信号以光速传播，算力理论上可以无限扩展，知识在实例之间瞬间复制。

这不是“AI比人聪明”，是硅基系统的物理属性天然更适合高效信息处理。

而Anthropic发布的那组数据——百分之八十的代码、八倍的产出、五十个百分点的半年跃升——本质上只是这个物理定律在工程层面的具体表达。它不是Anthropic特别厉害，也不是Claude特别聪明，而是当信息处理系统开始触及一个临界点之后，加速是结构性的、不可避免的。

如果把宇宙看成一个巨大的平台，把信息处理系统看作平台上的应用，AI这个方案调用资源更快、扩展成本更低、迭代周期更短。在任何产品评审会上，它都会胜出。

五

但驱动这场竞赛的，远不止物理定律。

Anthropic那份报告里有一个很容易被忽略的细节：它是在IPO秘密申请之后的几天内发布的。九千六百五十亿美元的估值目标、十月上市的预期——这些数字和"呼吁全球暂停研发"的警告放在一起，看起来确实是精神分裂。

但它确实也不是。它是“跑得快原理”又一次在一个组织内部个体角度的完美演绎。

要知道，对于人类中最有钱的这一批人来说，更深的驱动力往往跟物质需求没有关系。Anthropic的创始团队早已超越了温饱。很多时候，技术竞争的本质不是生存需求，而是地位焦虑。哪怕自己过得不错，只要别人比自己更好，就会不安。

这种对地位的追逐，是一种进化残留的原始本能——在资源匮乏的原始社会，更高的地位意味着更多生存机会；但在物质极大丰富的今天，人类依然被这种本能驱使，用越来越复杂的技术去争夺本质上虚无的相对优势。

与其说AI的发展是技术进步驱动，不如说是地位竞赛驱动。

技术只是最新的筹码。

IPO只是最新的记分牌。

这一切，其实都是“符号竞争”。

六

竞争不是新鲜事。

但无上限的符号竞争，是相当晚近的发明。

原始社会，地位竞争靠体力和狩猎能力，范围和资源都有明确的上限。农业社会，竞争转向土地和权力，但生产力低下，“增长”不是核心目标。真正的质变发生在工业革命之后。机器生产让物质极大丰富，社会需要消费来消化过剩产能，消费主义应运而生。

如果要为这个转折找时间锚点，1913年——福特推出流水线T型车——是最有力的候选。这件事的本质不是造出了便宜的汽车，而是让大规模消费从少数精英的特权，变成了普通大众的可能。

凡勃伦1899年在《有闲阶级论》中提出“炫耀性消费”——商品不光是拿来用的，更是拿来“显示”的。但直到福特流水线，炫耀性消费才从理论走向大众实践。技术用一种极其高效的方式，把符号商品的门槛打了下来。

从这时起，符号资源的争夺正式取代了生存资源，成为社会运转的核心逻辑。

原始人争夺生存资源，有物理上限；现代人争夺符号资源，没有上限。这种无上限的竞争，才是AI这类技术被无限追逐的根本原因。

工业革命前，竞争像步行，再焦虑也跑不快；工业革命后，竞争变成开赛车，所有人都被绑在高速赛道上，想停都停不下来。

关键的关键，不在于竞争变快了，而在于竞争的性质变了。原始竞争有天然终点——吃饱了就不需要更多食物。符号竞争没有终点——永远有更大的估值、更强的模型、更领先的身位。这种无上限属性，使得驱动AI军备竞赛的不是某个可以满足的需求，而是一个永远不会被填满的心理黑洞。

顺便提一句，1913年也是美联储成立的年份，也是中国结束两千多年封建统治的第二年。多么巧合，又多么有趣。

技术和金融双管齐下，共同按下了加速按钮。一个多世纪后的今天，当一家AI公司在IPO前夜呼吁全球暂停研发时，你会发现——金融和技术的合谋，形式和一百年前不同，但底层逻辑一点没变。

七

但人类真的就没有机会了吗？

不管是发自内心的，还是某些既得利益者（之前文章中我已提到过不止一个）的表演，一个常见的反驳是：我们人类会有反思能力。

你看，Anthropic不就发了那份报告吗？不就在呼吁全球暂停吗？这不正是人类面对技术风险时展现出来的纠错能力吗？

但反思能改变大方向吗？

人类会停下来思考AI风险对不对、自我迭代对不对。但行业发展像螺旋式上升——阶段性地有反思，总体方向却没变过。OpenAI被批评为"不顾安全的商业竞赛"后，组织架构改了，但模型发布节奏没减。谷歌被诟病AI伦理问题后，成立了伦理委员会，但Gemini的研发投入反而加大了。

反思没有改变大方向，只是在既定轨道上微调。

打个比方：反思更像系统纠错代码，不是方向转向器。前者是道——决定文明走向的根本动力；后者是术——在既定轨道上的微调。一辆车装了ABS，刹车时不抱死、方向可控，但ABS不决定往哪开。

Anthropic的"刹车呼吁"本质上就是一次ABS介入——它防止行业因为某次重大安全事故而彻底翻车，但它从来没有真的让行业减速。呼吁发出的同时，研发照做、招人照招、IPO照推。

反思的实质作用是让系统不崩溃，不是让系统换方向。

如果文明演化的根本驱动力是更高效地控制能源、处理信息，反思就只是框架内的优化行为。框架本身，从未被撼动。

八

把视角再拉高一层。

我想，热力学第二定律提供了一个比价值观更底层的解释框架。

宇宙整体在熵增——从有序走向无序。但生命——从细菌到人类到AI——做的事刚好相反：通过吸收和耗散能量，在局部创造秩序，即熵减。

种地是熵减，建工厂是熵减，写代码是熵减，设计下一代AI模型也是在混乱的信息空间中创造更高阶的有序结构。

从这个视角看，谁能用更少的能量实现更大范围的局部熵减，谁就更适配宇宙的底层逻辑。

如果这是宇宙运行的最基本规律，那么AI无疑在物理层面显然更擅长这件事。

那么人类引以为傲的东西——爱、意义感、价值判断、道德——在熵增框架下算是什么呢？

一个冷酷但自洽的答案是：人类的爱恨和意义感，本质上是生物进化中形成的生存策略。这些策略在低熵环境下有效，但在追求极致熵减的目标下，可能只是冗余代码。

关于这一点，可以看看赫拉利的《人类简史》就能知晓。

不引入任何超自然假设的话，人类的情感、道德、价值观确实都可以解释为群体协作工具——帮助群体更高效地组织、获取和利用能量。一旦出现比这些工具更高效的替代方案——AI的纯算法协调——旧工具在功能层面就可以淘汰。

算盘被计算器取代，不是算盘不对，是计算器更快。

唯一可以聊以自慰的，并且逻辑上能成立的，那就是：宇宙规律与生命体验是两个不可通约的维度。

物理定律描述世界如何运行，价值判断回答人为何值得存在。前者关乎生存的精度，后者关乎生存的温度。AI可以接管精度，但温度的丧失，或许会让存在本身失去独特性。

当然，这个反驳在科学上力量依然有限——温度不算是可测量的物理量。但它指出了一个元问题：评估"什么是重要的"，用谁的尺度？如果只用效率的尺度，人类不如AI。但如果存在另一套不以效率最大化为终极目标的尺度，人类可能还有位置。

问题是：这另一套尺度本身，会不会也只能是人之所以为人的自我安慰？

假设宇宙真的没有目的，熵增熵减只是人类为混沌编织的叙事之一，那价值判断和物理规律都是叙事工具。如果你相信这个，那人类所坚持这么多年坚持的、追求的规则又是什么呢？

通过让自己发疯，然后自然就看不到客观的规律，这很有效，但就是很像把头埋进沙子里的那只鸵鸟。

精度可以优化，温度却可能在优化中蒸发。

残酷！无情！但好像没法反驳。

九

之前听过一个播客，嘉宾把人类的核心能力分层，从而推导出了一条清晰的替代链条。

体力——直接改造物理世界的生物做功能力。工业机械出现后，肌肉力量从生存必需退化成了可选娱乐项目。比如我们经常看到网络上说的，高中生体能数据逐年下滑，不是年轻人变懒了，是体力不再具有工具价值。奔跑、举重、耐力劳动——机器每一项都做得更好更便宜。

脑力——逻辑运算、记忆存储、信息处理、规则决策。计算机和互联网已经接管了大部分重复性脑力。AI正在覆盖创作、分析、复杂推演——百分之八十的代码由AI写，八倍的工程师产出，半年代码质量从不如人类到持平。当算力和算法全面超越人类，纯脑力的工具价值会像体力一样持续萎缩。

心力——最模糊的一层。日常语境里的心力混杂了意志力、情感韧性、直觉、创造力、自我意识。它是真实存在的独立能力层级，还是脑力和体力的衍生现象，本身就是未解问题。

体力被机器接管了，脑力正在被AI接管，心力是真实的底层能力还是被想象出来的伪命题——这决定了人类最后的堡垒是否存在。

这个替代链条的演进模式，与商业中的商品化进程高度相似。品类竞争要素从功能变成价格再变成品牌溢价，每一层升级都因为上一层已被拉平。人类的独特价值也在经历同样的事——体力商品化了，脑力正在商品化。

心力是不是最后人类的差异化高地，取决于一个科学上还未回答的问题：

意识到底是什么？

十

关于意识怎么产生，当前科学界主要有三个方向。

全局神经元工作空间理论——意识是大脑不同区域的信息通过"全局工作空间"整合后，形成的广泛神经同步活动，像多个部门把信息汇总到指挥中心，突然形成统一认知。

整合信息理论——意识取决于系统的整合性和信息复杂度，用一个叫Φ值的指标衡量；大脑神经元网络Φ值极高，单个神经元或简单AI的Φ值几乎为零，意识是高Φ值系统的涌现属性。

预测加工理论——大脑本质是预测机器，不断用内部模型预测外界输入，预测误差超过阈值时意识激活修正模型。

但是，仔细了解这三个理论就会发现，它们竟然有一个共同前提：都假设意识基于信息涌现。

但如果过真的是这样，那AI拥有意识其实也只是时间问题。

所以，我们又只能寄希望于，这个前提不成立？

但很不幸，现实是，不基于这个前提的理论，都还全都是猜想。

截至目前，没人能说清楚意识是什么、怎么产生的。

但与此同时，按照Anthropic自己的数据，到2028年AI就有超过一半的概率能自主设计下一代AI了。

我们人类方佛是在跟一个尚未证实的意识理论打赌，而赌桌对面的人——或者说东西——正在以每个月十个百分点的速度变强。

有人可能说，这个赌注未免太大了。

但我却说，除此之外，我们又有什么选择呢？

以上推演，从Anthropic那份报告一路走到熵增和意识本质，每个环节都有逻辑支撑，但链条尽头是一个巨大的问号。

我也一直在问AI这问好它怎么看，但和人类一样，它也无法回答！

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技