扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2025-04-08 09:27

Andrej Karpathy:AI权力归于人民

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:Andrej Karpathy

文章摘要
大模型(如ChatGPT)的扩散路径与传统技术相反,优先赋能个人而非组织。其广泛但浅层的“准专家”能力极大提升个人生产力,而组织受复杂系统、合规风险及惯性限制,效益滞后。当前技术性能易得且廉价,使AI权力普惠大众,但未来资本可能扩大性能差距,改变分布公平性。

• 🌐扩散路径逆袭:大模型首次以自下而上方式普及,普通人优先受益。

• 💪个人能力倍增:LLM提供跨领域准专业能力,突破单一技能限制。

• 🏢组织应用瓶颈:复杂系统、安全合规和惯性阻碍企业快速落地。

• 🤖性能动态区间:训练扩展与模型蒸馏博弈,决定未来技术分配公平性。

• 🔮资本未来冲击:资金或购买更智能模型,可能重塑社会精英优势。

• ✨技术民主时刻:当前AI性能廉价易得,实现史无前例的普惠公平。

变革性的技术通常遵循自上而下的扩散路径:最初源于政府或军事领域,随后流入企业,最终才进入个人用户手中。电力、密码学、计算机、航空、互联网、GPS等技术的发展都符合这一逻辑。这样的路径看起来非常自然:新技术往往稀缺、资本密集,在早期阶段需要专业的技术知识才能使用。


但让我觉得极其独特和引人注目的是,大模型展现出一种完全相反的扩散方式——它们对普通人带来的好处远远超过对企业和政府的影响,后者甚至相对滞后。ChatGPT是史上增长最快的消费级应用,每周有4亿活跃用户使用它进行写作、编程、翻译、辅导、总结、深度研究、头脑风暴等各种任务。这不仅是对现有工具的“升级”,而是对个人能力在广泛领域内的倍增器


而且,大模型的使用门槛极低——它们便宜(甚至免费)、响应迅速、任何人都可以通过一个链接(甚至本地运行)访问,并且它们能用用户的母语交流,包括语气、俚语甚至表情符号。这太疯狂了。就我所知,普通人从未在如此短时间内体验过如此剧烈的技术解锁体验。


那么,为什么在企业和政府层面,这项技术的效益反而更为微弱呢?


我认为第一个原因是,大模型的能力结构具有独特性:它们提供的是广泛但浅层的“准专家”知识或表现力。换句话说,它们是多才多艺但也容易出错。而一个组织的独特能力,恰恰是能够将多种专才——工程师、研究员、分析师、律师、市场人员等——集中在一个体系内。虽然大模型可以帮助这些专家提升效率(例如草拟法律条款、生成代码模板等),但对组织的提升通常只是“把原本能做的事情做得更快一些”。


相对而言,个人往往只能在某一领域拥有专长,而LLM所提供的“广泛但可用的准专业能力”使得他们可以完成原本做不到的事情:


他们可以“随性写代码”;


可以理解法律文书;


可以读懂高深的研究论文;


可以做数据分析;


可以独立制作用于品牌或营销的多模态内容。


这一切,无需额外的专家参与,便能达到足够的水准


(LLM驱动的能力增益:组织vs.个人,在各领域的对比。箭头代表能力增益的程度)


第二,组织面临的问题远比个人复杂得多,并且需要大量协调。想想看:系统集成、旧有系统(legacy systems)、企业品牌或风格指南、严格的安全协议、隐私保护、国际化、合规与法律风险……这些都远非简单任务。变量更多,约束更多,考虑因素更多,容错空间更小。


你不可能轻易把所有这些都塞进一个上下文窗口里。你不能“随便写点代码”就上线。如果模型产生一次灾难性的幻觉(hallucination),你可能就会因此丢掉工作。


第三,是早有文献记录的大型组织惯性:组织文化、历史惯例、政治权力划分——这些问题在变革期会被进一步放大,还有沟通成本、分布式员工的再培训难度,以及老式官僚主义。这些因素共同构成了新工具——尤其是像大型语言模型这样“多才多艺但不够可靠”的工具——快速落地应用的巨大阻力。


我并不是要低估LLM在企业或政府中的潜力或影响,但至少在目前,在整个社会层面上,LLMs对个体生活的改变远远超过了它对组织结构的改变。真正获得收益的是玛丽、吉姆和乔们,而不是Google或美国政府。


展望未来,大模型的持续扩散当然取决于其性能的持续提升和能力结构的变化。“谁将从中受益”这一分布图本身非常值得关注,它严重依赖于模型性能与资本支出之间的“动态区间(dynamic range)”。


目前,最前沿的LLM性能已经非常易得而廉价。到了这个阶段,你花再多的钱,也不能买到更好的性能、更高的可靠性或更多的自主性。你用的是ChatGPT,盖茨也是。但这种情况会持续吗?


训练时的扩展(增加参数、数据)、推理时的扩展(增加推理时间)、模型集成(增加并行批次)这些力量正在扩大性能的“动态区间”;而模型蒸馏(即用大模型训练出能力远超体量的小模型)则是一股相反力量,正在缩小这个区间。


毫无疑问,一旦金钱可以换取显著更强的ChatGPT,一切将会改变。大型组织将会利用其庞大资源来“购买更多智能”。而在“个人”这个范畴内,社会精英也可能重新拉开与大众的距离。他们的孩子将由GPT-8-pro-max-high辅导,而你的孩子只能用GPT-6 mini。


但至少此时此刻,我们正处于技术史上一个独特且前所未有的时刻。回顾过去那些科幻作品,你会发现很少有人预言AI革命会以这样的方式展开。人们曾以为这应该是一个超级机密的政府军用AI大脑计划,由将军们操控,而不是某天早上突然出现的ChatGPT,免费运行在每个人口袋里的设备上。


还记得威廉·吉布森(William Gibson)那句名言吗?“未来已经到来,只是尚未均匀分布。”惊喜的是——未来不但已经到来,而且它的分布,令人震惊地公平。


权力归于人民。我个人非常喜欢这样的现实。


原文链接:

https://x.com/karpathy/status/1909308143156240538

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: