扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-01-05 13:31

没想到2025年AI 领域爆发最猛烈的居然是它

本文来自微信公众号: MacTalk ,作者:池建强,原文标题:《没想到 2025 年 AI 领域爆发最猛烈的居然是它》


如果你经常看Leaderboard(大模型排行榜),能看到最重要的两个榜单是Text和WebDev。


Text指的是模型的文本能力,它体现了模型在通用文本任务上的能力,包括语言的准确性、表达的自然度,以及对不同文化语境的理解与适配。


Text能力是所有大模型的基础,放到首位无可厚非。第二位是WebDev,其实就是编程能力。为什么大模型的编程能力也这么重要呢?程序员有那么多吗?


想回答这个问题,我们先来理解一下大模型的编程能力和场景的变化。


1、大模型非常适合编程这个场景。


编程其实就是通过编程语言和机器对话,而编程语言比咱们日常聊天规矩多了。大模型在海量代码和自然语言里学习过之后,懂了语法、语义和常见编程模式,你用人话描述需求,它就能给你拆解成一串串能run的代码和程序。


代码世界有两个特点:一是重复多、风格稳定,统计学习在这里特别吃香;二是反馈清晰,IDE会用报错、测试、日志告诉你哪里不对,这就是很好的“反馈回路”。再加上检索和函数调用,模型能查库、读文档、调用工具,查漏补缺。大模型能把这一切给你搞的妥妥当当。


在要求明确、接口稳定、测试可验证的编程场景里,它显得异常可靠与高效。


2、大模型一旦介入编程领域,这事就泛化了,场景变了。编程不再是专业程序员的事儿,而是大家的事。


大模型不仅能够通过类似Cursor、Claude Code这样的工具帮助程序员把活干得又快又好,还能通过AI Agent的方式——比如Replit、TRAE的Solo,MiniMax Agent,秒哒、灵光等——帮助普通用户完成程序的构建和运行。这形成了一个巨大的市场。


再过三年五年,编程能力很可能像媒体一样被平权。你做个App的时间,可能和我写这篇文章的时间差不多。


正因为如此,2025年1月估算AI编程领域的营收规模,还只是几亿美金,到了年底再看,这个领域已经发展成了百亿美金规模(100亿ARR)年化营收的新市场。一年实现了10倍左右的增长。


看趋势,WebDev这个榜单的竞争非常激烈,排名更迭别Text还频繁。应用产品和用户在选型时,除了模型的实际能力,还会把这份榜单作为一项随时间变化的参考指标。我司CTO大师就会隔一段时间试试其他模型,哪个顺手用哪个。



目前排名前十的模型,一共就五家公司,分别是美国的Anthropic、OpenAI和Google,对应的模型系列分别是claude、gpt和gemini。另外两家上傍的是中国公司MiniMax和智谱。不得不说,面对海外顶级模型,这俩中国AI创业公司还是非常能打的,他们的开源模型在海外被很多公司采用。巧合的是,两家公司都在IPO的进程中。


其他的中国模型,DeepSeek、Kimi、Qwen等紧随其后,竞争激烈。


根据市场预测,全球软件开发市场总量约为1500亿美金,目前AI编程的渗透率还不足10%(约100多亿美金),因为AI实在是太适合编程了,未来几年内这一渗透率有望达到30%到40%,甚至更高。总盘子也可能持续增长。


头部公司的表现非常好:像Cursor(Anysphere)这样的公司增速非常快,年度经常性收入(ARR)已突破10亿美元,而Replit的ARR也已达到2到3亿美金。


国内比较亮眼的应该是字节的TRAE,这款IDE刚刚发布了开发者报告,用户600万,月活160万,也是不错的成绩。


现在我们来回答,AI编程的发展为什么这么猛呢?


1、AI编程不仅在赚小白用户和开发者的钱,还在赚企业的钱。AI编程不再仅仅是辅助写代码的工具,而是开始实现端到端的劳动力替代,也就是说,好多活AI都能给你干了,于是它开始直接赚取原本属于程序员的“工资预算(Salary Budget)”,而不仅仅是软件购买预算,。


2、在当前的预训练和强化学习范式下,AI模型在编程任务上的表现已经比绝大多数初级或中级知识工作者更聪明、更便宜。在硅谷,初级程序员确实已经面临严重的就业挑战,因为AI的产出更具经济价值。


3、领先的模型公司(比如Anthropic)选择了差异化竞争,这家头部编程模型公司战略性地放弃C端通用市场,转而深耕Coding和Agent领域。这种对特定编程数据进行的深度优化,使得模型在处理复杂、长程编程任务时变得极其可靠。


AI编程的潜力显然不止于此,还可以做出很多增量价值。比如:


AI有可能重新发明新的编程语言和操作系统,把历史代码、设计文档、社区讨论一股脑吃下来,按既定约束给出新的方案,自动跑测试、做回归,创建新的技术图谱,保持可验证,也许新的技术栈就出来了。


在科学发现领域,找室温超导材料、攻克疑难疾病等等,本质都是跨学科的计算与实验循环。AI会写代码、会查文献……这些高价值产出将进一步推高其市场估值。


还有,目前预训练和强化学习/后训练都遇到了瓶颈,大模型开始进入Online Learning(在线学习)的第三范式。Online Learning指的是,模型在与用户交互的过程中持续吸收新数据并更新行为的学习范式。如果2026年这方面有所突破,AI将具备实时记忆和自主学习能力,能从与开发者的交互中“越用越聪明”,彻底解决泛化性问题。


也就是说,AI的编程能力将更强、更普惠,足以支撑更多普通用户独立构建各种各样的应用。站在2026年的起点,我的判断是:这条赛道仍然在加速。如果你是国内互联网大厂的决策层,会不会相应加快研发与商业化实践呢?


我想,在AI对话助手(ChatGPT,Gemini,豆包,千问等)之外,AI编程应该是另一个下重注的领域。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜