2026-06-14 11:22

GLM5.2：给国产模型追赶Anthropic 又提了一口气

本文来自微信公众号：硅星人Pro ，作者：董道力，原文标题：《GLM 5.2：给国产模型追赶Anthropic 又提了一口气｜附实测》

开源，曾是美国科技产业最值得骄傲的发明之一。

1984年，麻省理工学院人工智能实验室里，一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了，厂商却不肯交出源码。他一气之下辞掉体面的工作，写下GNU宣言。Richard Stallman或许不会想到，这份带着理想主义怒气的檄文，会在接下来的四十年里，重塑整个软件世界的权力格局。

美国曾经是开源运动最肥沃的土壤。1991年，一个芬兰学生在Usenet上发布了一段操作系统内核代码，但真正让Linux从极客玩具变成全球互联网基础设施的，是美国企业的接力和背书。IBM投入十亿美元，Red Hat靠它上市，Google用它跑起了搜索帝国。

然后，时间来到2026年6月11日。

一封来自美国商务部长的信，寄到了Anthropic CEO Dario Amodei的案头。信件内容很短，语气却不容置疑：以国家安全权限为由，暂停所有外国人对Fable 5和Mythos 5模型的访问。限制范围极广，不仅包括境外用户，也包括身在美国境内的外国人，甚至包括Anthropic自己的外籍员工。没有公开技术细节，没有申诉窗口，48小时内执行。

两天后，6月13日，智谱发布声明：GLM-5.2，将于下周正式开源。它支持100万token上下文，是智谱目前最强模型，采用MIT协议，无任何地域限制。

官方声明里这样写到：

“在一些前沿模型突然变得不可用的时刻，我们选择了另一条路：前沿智能不应只属于少数人，也不应被少数规则随时收回。它应该开放、可用、可构建，并服务于每一位开发者。”

来自中国的开源模型，已经成了这一轮AI浪潮里，开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人，而现在是时候更加高举高打和更激进的推动这件事了。

当然，宏大叙事归宏大叙事。GLM-5.2到底好不好用，最终还是要靠实测说话。

以下是我们第一时间的实测。

1 测试1：动态月相时钟

PlainText请用HTML/CSS/JavaScript写一个复杂的纯SVG动画，不使用Canvas，不使用外部图片。主题是“机械天文钟”。要求：SVG中包含至少5个同心圆层级：外圈刻度环、星轨环、齿轮层、月相层、中心指针层。至少有6个齿轮，其中相邻齿轮旋转方向相反，转速不同，齿轮必须有真实齿形，不要只画普通圆。外圈要有60个分钟刻度和12个小时刻度，刻度必须用程序生成或结构化生成。星轨上有若干光点沿椭圆轨道运动，运动路径要平滑。月相盘需要周期性变化，至少表现新月、半月、满月之间的过渡。中心有三根指针，分别以不同速度旋转。加入hover交互：鼠标移到不同环层时，该层高亮并显示简短标签。加入控制面板：暂停/继续动画、调节速度、切换日夜主题。视觉上要精致，有渐变、阴影、发光或滤镜，但不能影响可读性。代码要结构清晰，避免重复，动画性能稳定。最终输出一个可直接运行的完整HTML文件。

GLM5.2以单HTML文件完成了一座机械天文钟，约925行纯前端代码，零外部依赖。技术栈越薄，视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆，全靠SVG path一笔笔算出来，没有贴图，没有Canvas兜底。

它没有走"挤牙膏"式的增量开发，第一发就一口气写完整整900行骨架：五层同心SVG、七颗齿轮、60分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通，首版打开即转。

随后它自己review了一遍代码，挖出三个真bug并逐一修复。

最值得一提的是，GLM5.2不堆屎山，发现错了敢整段重写。

以月相为例，第一个版本GLM5.2用的是mask配一个位移缩放的阴影圆，函数里还留着多行被注释掉的试错推导，半月时分界不是直线，新月时压根遮不住。它没有继续在mask上凑手感，而是直接推倒，换成terminator双弧path。改完不靠感觉验收，而是拿四个边界相位打表验证：新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆，全部吻合。

但GLM5.2生成的时钟，颜值上就很有进步空间了。

1 测试2：互动点球大战

Plain Text写一个单文件HTML，用Three.js+Cannon.js做3D互动点球大战游戏。场景：-逼真的球门和点球点，球场草地，后方看台有模糊的观众剪影-3D足球（带纹理），守门员（简化骨骼模型或人形）站在门线上玩法：-射门阶段（玩家）：-鼠标拖拽控制射门方向（左右+上下弧线），拖拽距离决定力量-松开鼠标射门，足球按物理轨迹飞行（初速度+旋转引起的马格努斯效应弧线）-显示瞄准辅助线（虚线抛物线预测轨迹）-扑救阶段（AI）：-守门员根据射门方向实时判断扑救方向-AI难度可调：简单（扑救延迟0.3s）、普通（0.15s）、困难（几乎瞬发但有5%失误率）-五轮制，每轮交替玩家射门和AI射门（AI射门时玩家控制守门员左右移动+起跳扑救）视觉效果：-足球旋转时纹理清晰可见-射门力量大时镜头轻微震动-进球后：球网物理摆动（Cannon.js软体模拟或顶点动画），观众席粒子欢呼特效，比分牌翻转-扑出后：守门员做出扑球动作，球弹出底线计分板：左上角显示玩家vs AI比分，射进/射失统计输出：完整可运行的单HTML文件（Cannon.js CDN）。

GLM5.2生成的游戏内容相当完整：五轮攻防、三档AI难度、拖拽射门配马格努斯弧线、AI预判扑救、加时赛一应俱全。视觉上，草地是程序生成的，足球用真五边形拼接而成，1400个观众剪影批量渲染。

值得关注的，是GLM5.2的开发思路：先让游戏能玩，再慢慢打磨。

第一步就把完整骨架搭了起来：射门、扑救、判定、回合切换全部跑通。后续遇到问题，每次修复都遵循一套清晰流程：发现问题→挖根因→给方案→调数值→跑语法检查。

举个例子。CapsuleGeometry在老版本Three.js里并不存在，GLM5.2直接诊断出r128的LatheGeometry是ES6 class、不能用.call()借调，于是改用extends+super，然后逐个验证：构造成功、形状正确、node--check通过。

GLM5.2还会根据语言特性做针对性设计，像个有经验的老手。比如守门员被刻意不放进物理引擎，而是手写距离检测，巧妙避开了Cannon.js那种鬼畜弹跳，彻底解决了"球穿门将"的bug。

最值得一提的，是它做动画优化的方式，直接找专业文献。

门将扑救动作的早期版本很僵硬：先是"起跳"，再改成"横飞"，还是不够自然。GLM5.2没有凭感觉硬调，而是去查了Ibrahim et al。（2019）等关于西甲精英门将扑救生物力学的研究，直接从论文里提取出真实的时间参数——对侧腿蹬地发力0.12秒→重心横移0.18秒→手臂鞭打伸展0.25秒。

据此，它把动画拆成三阶段重写：身体压缩蓄力→躯干弹射横移→手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过，确保脚、腿、躯干、手始终成一条直线、朝着球飞去。

我把GLM5.2引用的每个数据源都打开检查过，一个也没有瞎编，都是真实存在的网页。

1 测试3：做一个迷你Excel

这个项目主要让GLM5.2做一个零依赖、单文件HTML的简化版Excel，可在浏览器中直接打开运行，具备核心电子表格能力：网格编辑、公式引擎、撤销重做、剪贴板、CSV导入导出等，是一个比较综合的项目。

GLM-5.2跑了一小时，把Excel桌面端核心体验——用浏览器还原。

可以实现完整的编辑功能，单击/双击/Enter切换状态，方向键、Tab、PageUp/Down、Ctrl+Home全套快捷键等。用TS实现公式引擎，递归下降解析+相对/绝对/混合引用+30+函数。常用的工具栏，像加粗/斜体/对齐、5种数字格式、60步撤销重做。

参考这个项目来看，GLM-5.2并非没有问题，它在架构设计上有相当扎实的工程能力，但执行节奏严重失衡。比如14分钟过去，可见产出还停留在"设计讨论+零散代码片段"，从未真正写出可运行的HTML文件。

换句话说，GLM-5.2是一个想得很多的模型。三思而后行是优点，但如果最后没把功能跑出来，再深的思考也只停留在原地。

我在使用的时候，经常会怀疑是不是模型卡住了，忍不住让其暂停，再输入继续指令。

1 写在最后

客观来看，GLM-5.2与Claude等国际顶尖模型相比，仍然存在差距。它的界面审美有待提升，复杂任务中有时会长时间思考，迟迟不输出可运行代码。

但重要的是，它证明了另一件事：国产大模型已经具备了实实在在的工程能力。

GLM-5.2能在无外部依赖的情况下，一次生成900多行可运行的SVG机械钟代码；能在发现自身bug后主动推倒重写；能在Three.js和Cannon.js的技术坑里自主定位问题；也能花费一小时，在纯浏览器环境中复刻Excel的核心体验。

更关键的是，智谱选择了一条稳定开源的路线。

GLM-5.2让“能用的国产模型”从口号变成了可运行的代码。用户不需要申请特殊权限，不必担心某天清晨醒来发现API被突然掐断，也不需要在阅读文档前签署一份出口合规声明。

它在此前已经是国产模型coding最强之一的GLM-5.1基础上，又有明显进步，整体变得更加能打。

在Anthropic和OpenAI最近的模型眼看又要拉开和其他模型差距的时刻，GLM-5.2的出现的确能给所有国产模型提一口气。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技