2026-06-18 10:35

GLM5.2、Kimi2.7、DeepSeek V4、MiniMax M3最佳搭配清单，你可以直接抄

夕小瑶科技说©

速览

本文来自微信公众号：夕小瑶科技说，作者：丸美小沐

最近，Kimi 2.7 Code和GLM 5.2接连发布，一周双发，国产模型又崛起了。

加上DeepSeek V4和MiniMax M3，国产阵营一口气凑齐了4个能用的选择。

大模型进化到现在这个阶段，早就不是看榜单的东西了。榜单的综合排名当然有参考价值，但是对于日常使用来说，远远不够。

作为AI博主，我用AI的场景可太多了，上午要写稿子，中午要拆产品需求，下午要写代码，晚上还想把一堆资料丢进去做个判断。

我自己的体感，模型之间的差异特别具体，有的模型特别会写、有的模型推理很猛、有的模型开发项目很顺手。

当然我也有来回切换模型的苦恼。

就像桌面上摆了一排工具，螺丝刀、剪刀、美工刀、电钻，各有各的长板和短板。

GLM5.2、Kimi2.7、DeepSeek V4、MiniMax M3，这几个我会按我自己的使用场景来聊，什么任务我会优先用谁，什么场景我踩过坑，什么组合现在看起来最省心。

不保证绝对正确，至少是我真的会这么用的一套组合。

我先用最简单粗暴的方式——按人群分。

如果你不写代码：

包括写文章、改稿、做方案、写脚本、写周报、整理访谈、提炼观点、做选题、写营销文案的人。

推荐DeepSeek V4 Pro，直接用免费的网页版即可，而且做文案非常适合。

但如果你还要处理多模态的资料，像做产品、运营、咨询、市场、教育、投研、销售支持、行政、人事的人。

你的资料经常混着截图、PDF、扫描件、表格、音视频、会议记录。

优先考虑用MiniMax M3。

推荐理由是它原生多模态强，1M长上下文，对资料很杂的人特别友好。

如果你写代码：

昨天刚上新的GLM5.2就不错，如果能买到GLM 5.2的token plan，就用GLM 5.2主力coding。实在买不到就用Kimi K2.7 Code，它速度更稳定、服务不怎么挂，适合当编程的替补选手。

要是做自动化流程、批量内容生产、批量分类、信息抽取、格式转换这种高并发任务，就外接DeepSeek V4 Flash和MiniMax M3的API来处理，它们价格更合适。（这种任务不能用token plan，并发根本不够的）

以上是文字版总结，下面一张图概括。

价格从低到高：DeepSeek→MiniMax M3→Kimi K2.7→GLM 5.2。

体感上，几家有coding plan的花费是固定的，我都是中档的套餐，400多块钱一个月，用于三五个小项目的日常维护、更新，完全够用。

外部调用deepseek也很便宜，处理500份长文档大约花费一块钱，M3稍微贵一点点，一块钱处理大约200份大文件，根据用量的不同会有波动。

◈每个模型具体怎么样

◽DeepSeek：开源、便宜、脑子活。

DeepSeek是那种你天然想站它的模型，很多人说它有时候像Grok，会给你一些意料之外的灵光一闪。

这个确实，它能给我一些新思路。

不过，我日常用DeepSeek跑批量任务比较多，尤其是大量文本处理、数据清洗、格式转换——这些活它干得又快又省钱。

但我又不太敢把长任务交给它。

因为短任务里虽然是好搭子，但到了长任务里它会不会又变成演员？我还没攒够信心去验证。

不过在便宜耐用这件事上，DeepSeek已经是国产模型里最让人放心的选择了。

◽Kimi K2.7 Code：相对稳定一些。

我对Kimi的Coding plan体感不错，没有限购、没有变化规则那么多幺蛾子。不过从近期的社区反馈体感上，它的模型能力上相比GLM 5.2应该差一些。

我之前的OpenClaw小瑶机器人接的是Kimi 2.6，不过那时候它模型能力还不太足，有点笨，不太会用工具，执行力一般，有幻觉，胜在价格和稳定性。

2.7 Code出来之后，情况改观了一些。

我现在把它接在Claude Code里面当编程替补，特别稳定，别家崩的时候可以拿来稳稳补位，但也仅限于此，再更复杂的长任务我对它还是很谨慎的。

社区的风评也贬褒不一，有不少人说它是小号Gemini。。

◽MiniMax M3：被低估的多面手。

MiniMax M3是这四个里面最让我意外的。

虽然风评相对没那么好，但它的原生多模态能力真的不错——图、PDF、视频都能处理，而且有1M的长上下文，用起来很方便。

而且，永久半价后价格也划算。

比如那种复杂的前端任务，要根据一大堆各种格式适配风格的，我都会交给MiniMax M3，比让Claude在后台写脚本逐个解析方便很多。

但它刚出的时候有个问题：慢。丢一个长文档进去，它要想很久才回。

但现在，MiniMax的速度明显快了不少，而且现在还永久半价，性价比高了很多。

如果你的工作场景要是经常要处理截图、表格、扫描件、音视频这种多模态资料，M3值得认真试试。

◽GLM 5.2：编程能力最强，但不太好买到

GLM 5.2是这四个里面编程能力最强的。

社区好评也多——coding能力强，长上下文扎实。不过幻觉率不低，而且没有多模态。

我实测效果也很不错——现在，我已经信任到敢把它拿过来协助删库了。。

很适合平替主Agent的主模型。

不过唯一的缺点可能是不好买到，它家的Coding plan要在每天早上十点整排队抢购，而且相当难买，我蹲了好久才终于买到。（确实好用，以至于供不应求了）

而且，编程套餐给的并发量一般，所以大规模多线程用起来可能有点慢，高峰期速度也慢。它的API价格也不太适合拿出做批量任务。

◈说完结论，说说心里话

现在回头想想，之前写代码同样是翻车，Claude、OpenAI我经常会自动给它们找补——会觉得是不是我prompt没写清楚，或者上下文给得太乱。

但国产模型翻车，我脑子里第一反应经常是——果然。

这话说出来有点伤人，但我猜不少人心里都有过类似的瞬间。不是不想支持国产模型，也不是没看到它们这两年的进步——有过几次不好的体验之后，就很难再轻易托付。

我想了想，原因可能不在模型参数里，在关系里。

一路走来，Claude和OpenAI陪我走过太多真实工作流了。很多时候，我知道它们不完美，但它们确实帮我扛住了活。这种东西会变成一种很隐形的信任余额。

国产模型更像一个早就认识的一般朋友，一直没有留下特别突出的印象，即使现在已经比以前强很多了，但它以前有过一次不好的印象，再加上周围总有人传它的绯闻，我还是会心存芥蒂。

更麻烦的是，当我们真正拿国产测试时，往往不是从一个干净的小任务开始，而是直接把它塞进Claude和OpenAI已经推进很远的复杂长任务里。

而且在这种场景里，它一旦出错，我们依旧会把它直接归类成不靠谱。。

阻碍我信任国产模型的，现在看来不是能力差距了。能力上的短板，国产模型正在一点点地补。而且前端能力普遍都很强，做出来视觉效果非常好看。

真正还在慢慢补回来的是用户信任。能力是入场券，信任才是留下来的理由。

国产模型需要更多的时间、更多的场景。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI创投日报

频道：前沿科技