
本文来自微信公众号: 硅星人Pro ,作者:董道力,原文标题:《GLM 5.2:给国产模型追赶Anthropic 又提了一口气|附实测》
开源,曾是美国科技产业最值得骄傲的发明之一。
1984年,麻省理工学院人工智能实验室里,一位留着大胡子、眼神倔强的程序员彻底被激怒了。打印机坏了,厂商却不肯交出源码。他一气之下辞掉体面的工作,写下GNU宣言。Richard Stallman或许不会想到,这份带着理想主义怒气的檄文,会在接下来的四十年里,重塑整个软件世界的权力格局。
美国曾经是开源运动最肥沃的土壤。1991年,一个芬兰学生在Usenet上发布了一段操作系统内核代码,但真正让Linux从极客玩具变成全球互联网基础设施的,是美国企业的接力和背书。IBM投入十亿美元,Red Hat靠它上市,Google用它跑起了搜索帝国。
然后,时间来到2026年6月11日。
一封来自美国商务部长的信,寄到了Anthropic CEO Dario Amodei的案头。信件内容很短,语气却不容置疑:以国家安全权限为由,暂停所有外国人对Fable 5和Mythos 5模型的访问。限制范围极广,不仅包括境外用户,也包括身在美国境内的外国人,甚至包括Anthropic自己的外籍员工。没有公开技术细节,没有申诉窗口,48小时内执行。
两天后,6月13日,智谱发布声明:GLM-5.2,将于下周正式开源。它支持100万token上下文,是智谱目前最强模型,采用MIT协议,无任何地域限制。
官方声明里这样写到:
“在一些前沿模型突然变得不可用的时刻,我们选择了另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”
来自中国的开源模型,已经成了这一轮AI浪潮里,开放普惠的代表。他们在努力提供紧跟前沿闭源模型的能力给所有人,而现在是时候更加高举高打和更激进的推动这件事了。

当然,宏大叙事归宏大叙事。GLM-5.2到底好不好用,最终还是要靠实测说话。
以下是我们第一时间的实测。
1
测试1:动态月相时钟
PlainText请用HTML/CSS/JavaScript写一个复杂的纯SVG动画,不使用Canvas,不使用外部图片。主题是“机械天文钟”。要求:SVG中包含至少5个同心圆层级:外圈刻度环、星轨环、齿轮层、月相层、中心指针层。至少有6个齿轮,其中相邻齿轮旋转方向相反,转速不同,齿轮必须有真实齿形,不要只画普通圆。外圈要有60个分钟刻度和12个小时刻度,刻度必须用程序生成或结构化生成。星轨上有若干光点沿椭圆轨道运动,运动路径要平滑。月相盘需要周期性变化,至少表现新月、半月、满月之间的过渡。中心有三根指针,分别以不同速度旋转。加入hover交互:鼠标移到不同环层时,该层高亮并显示简短标签。加入控制面板:暂停/继续动画、调节速度、切换日夜主题。视觉上要精致,有渐变、阴影、发光或滤镜,但不能影响可读性。代码要结构清晰,避免重复,动画性能稳定。最终输出一个可直接运行的完整HTML文件。
GLM5.2以单HTML文件完成了一座机械天文钟,约925行纯前端代码,零外部依赖。技术栈越薄,视觉的担子越重——齿轮齿形、月相明暗线、星轨椭圆,全靠SVG path一笔笔算出来,没有贴图,没有Canvas兜底。
它没有走"挤牙膏"式的增量开发,第一发就一口气写完整整900行骨架:五层同心SVG、七颗齿轮、60分钟刻度、椭圆星轨、月相盘、三速度指针、控制面板全部搭通,首版打开即转。
随后它自己review了一遍代码,挖出三个真bug并逐一修复。
最值得一提的是,GLM5.2不堆屎山,发现错了敢整段重写。
以月相为例,第一个版本GLM5.2用的是mask配一个位移缩放的阴影圆,函数里还留着多行被注释掉的试错推导,半月时分界不是直线,新月时压根遮不住。它没有继续在mask上凑手感,而是直接推倒,换成terminator双弧path。改完不靠感觉验收,而是拿四个边界相位打表验证:新月亮区恰好为零、上弦右半圆、满月整圆、下弦左半圆,全部吻合。

但GLM5.2生成的时钟,颜值上就很有进步空间了。
1
测试2:互动点球大战
Plain Text写一个单文件HTML,用Three.js+Cannon.js做3D互动点球大战游戏。场景:-逼真的球门和点球点,球场草地,后方看台有模糊的观众剪影-3D足球(带纹理),守门员(简化骨骼模型或人形)站在门线上玩法:-射门阶段(玩家):-鼠标拖拽控制射门方向(左右+上下弧线),拖拽距离决定力量-松开鼠标射门,足球按物理轨迹飞行(初速度+旋转引起的马格努斯效应弧线)-显示瞄准辅助线(虚线抛物线预测轨迹)-扑救阶段(AI):-守门员根据射门方向实时判断扑救方向-AI难度可调:简单(扑救延迟0.3s)、普通(0.15s)、困难(几乎瞬发但有5%失误率)-五轮制,每轮交替玩家射门和AI射门(AI射门时玩家控制守门员左右移动+起跳扑救)视觉效果:-足球旋转时纹理清晰可见-射门力量大时镜头轻微震动-进球后:球网物理摆动(Cannon.js软体模拟或顶点动画),观众席粒子欢呼特效,比分牌翻转-扑出后:守门员做出扑球动作,球弹出底线计分板:左上角显示玩家vs AI比分,射进/射失统计输出:完整可运行的单HTML文件(Cannon.js CDN)。
GLM5.2生成的游戏内容相当完整:五轮攻防、三档AI难度、拖拽射门配马格努斯弧线、AI预判扑救、加时赛一应俱全。视觉上,草地是程序生成的,足球用真五边形拼接而成,1400个观众剪影批量渲染。
值得关注的,是GLM5.2的开发思路:先让游戏能玩,再慢慢打磨。
第一步就把完整骨架搭了起来:射门、扑救、判定、回合切换全部跑通。后续遇到问题,每次修复都遵循一套清晰流程:发现问题→挖根因→给方案→调数值→跑语法检查。
举个例子。CapsuleGeometry在老版本Three.js里并不存在,GLM5.2直接诊断出r128的LatheGeometry是ES6 class、不能用.call()借调,于是改用extends+super,然后逐个验证:构造成功、形状正确、node--check通过。
GLM5.2还会根据语言特性做针对性设计,像个有经验的老手。比如守门员被刻意不放进物理引擎,而是手写距离检测,巧妙避开了Cannon.js那种鬼畜弹跳,彻底解决了"球穿门将"的bug。
最值得一提的,是它做动画优化的方式,直接找专业文献。
门将扑救动作的早期版本很僵硬:先是"起跳",再改成"横飞",还是不够自然。GLM5.2没有凭感觉硬调,而是去查了Ibrahim et al。(2019)等关于西甲精英门将扑救生物力学的研究,直接从论文里提取出真实的时间参数——对侧腿蹬地发力0.12秒→重心横移0.18秒→手臂鞭打伸展0.25秒。
据此,它把动画拆成三阶段重写:身体压缩蓄力→躯干弹射横移→手臂直线伸展够球。每一帧的旋转方向都用数值方法验证过,确保脚、腿、躯干、手始终成一条直线、朝着球飞去。
我把GLM5.2引用的每个数据源都打开检查过,一个也没有瞎编,都是真实存在的网页。


1
测试3:做一个迷你Excel
这个项目主要让GLM5.2做一个零依赖、单文件HTML的简化版Excel,可在浏览器中直接打开运行,具备核心电子表格能力:网格编辑、公式引擎、撤销重做、剪贴板、CSV导入导出等,是一个比较综合的项目。

GLM-5.2跑了一小时,把Excel桌面端核心体验——用浏览器还原。
可以实现完整的编辑功能,单击/双击/Enter切换状态,方向键、Tab、PageUp/Down、Ctrl+Home全套快捷键等。用TS实现公式引擎,递归下降解析+相对/绝对/混合引用+30+函数。常用的工具栏,像加粗/斜体/对齐、5种数字格式、60步撤销重做。

参考这个项目来看,GLM-5.2并非没有问题,它在架构设计上有相当扎实的工程能力,但执行节奏严重失衡。比如14分钟过去,可见产出还停留在"设计讨论+零散代码片段",从未真正写出可运行的HTML文件。
换句话说,GLM-5.2是一个想得很多的模型。三思而后行是优点,但如果最后没把功能跑出来,再深的思考也只停留在原地。
我在使用的时候,经常会怀疑是不是模型卡住了,忍不住让其暂停,再输入继续指令。

1
写在最后
客观来看,GLM-5.2与Claude等国际顶尖模型相比,仍然存在差距。它的界面审美有待提升,复杂任务中有时会长时间思考,迟迟不输出可运行代码。
但重要的是,它证明了另一件事:国产大模型已经具备了实实在在的工程能力。
GLM-5.2能在无外部依赖的情况下,一次生成900多行可运行的SVG机械钟代码;能在发现自身bug后主动推倒重写;能在Three.js和Cannon.js的技术坑里自主定位问题;也能花费一小时,在纯浏览器环境中复刻Excel的核心体验。
更关键的是,智谱选择了一条稳定开源的路线。
GLM-5.2让“能用的国产模型”从口号变成了可运行的代码。用户不需要申请特殊权限,不必担心某天清晨醒来发现API被突然掐断,也不需要在阅读文档前签署一份出口合规声明。
它在此前已经是国产模型coding最强之一的GLM-5.1基础上,又有明显进步,整体变得更加能打。
在Anthropic和OpenAI最近的模型眼看又要拉开和其他模型差距的时刻,GLM-5.2的出现的确能给所有国产模型提一口气。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。