2026-06-18 10:35

GLM5.2、Kimi2.7、DeepSeek V4、MiniMax M3最佳搭配清单,你可以直接抄

author_path 夕小瑶科技说©
头图

本文来自微信公众号: 夕小瑶科技说 ,作者:丸美小沐


最近,Kimi 2.7 Code和GLM 5.2接连发布,一周双发,国产模型又崛起了。


加上DeepSeek V4和MiniMax M3,国产阵营一口气凑齐了4个能用的选择。


大模型进化到现在这个阶段,早就不是看榜单的东西了。榜单的综合排名当然有参考价值,但是对于日常使用来说,远远不够。


作为AI博主,我用AI的场景可太多了,上午要写稿子,中午要拆产品需求,下午要写代码,晚上还想把一堆资料丢进去做个判断。


我自己的体感,模型之间的差异特别具体,有的模型特别会写、有的模型推理很猛、有的模型开发项目很顺手。


当然我也有来回切换模型的苦恼。


就像桌面上摆了一排工具,螺丝刀、剪刀、美工刀、电钻,各有各的长板和短板。


GLM5.2、Kimi2.7、DeepSeek V4、MiniMax M3,这几个我会按我自己的使用场景来聊,什么任务我会优先用谁,什么场景我踩过坑,什么组合现在看起来最省心。


不保证绝对正确,至少是我真的会这么用的一套组合。


我先用最简单粗暴的方式——按人群分。


如果你不写代码:


包括写文章、改稿、做方案、写脚本、写周报、整理访谈、提炼观点、做选题、写营销文案的人。


推荐DeepSeek V4 Pro,直接用免费的网页版即可,而且做文案非常适合。


但如果你还要处理多模态的资料,像做产品、运营、咨询、市场、教育、投研、销售支持、行政、人事的人。


你的资料经常混着截图、PDF、扫描件、表格、音视频、会议记录。


优先考虑用MiniMax M3。


推荐理由是它原生多模态强,1M长上下文,对资料很杂的人特别友好。


如果你写代码:


昨天刚上新的GLM5.2就不错,如果能买到GLM 5.2的token plan,就用GLM 5.2主力coding。实在买不到就用Kimi K2.7 Code,它速度更稳定、服务不怎么挂,适合当编程的替补选手。


要是做自动化流程、批量内容生产、批量分类、信息抽取、格式转换这种高并发任务,就外接DeepSeek V4 Flash和MiniMax M3的API来处理,它们价格更合适。(这种任务不能用token plan,并发根本不够的)


以上是文字版总结,下面一张图概括。



价格从低到高:DeepSeek→MiniMax M3→Kimi K2.7→GLM 5.2。




体感上,几家有coding plan的花费是固定的,我都是中档的套餐,400多块钱一个月,用于三五个小项目的日常维护、更新,完全够用。



外部调用deepseek也很便宜,处理500份长文档大约花费一块钱,M3稍微贵一点点,一块钱处理大约200份大文件,根据用量的不同会有波动。


◈每个模型具体怎么样


◽DeepSeek:开源、便宜、脑子活。


DeepSeek是那种你天然想站它的模型,很多人说它有时候像Grok,会给你一些意料之外的灵光一闪。


这个确实,它能给我一些新思路。


不过,我日常用DeepSeek跑批量任务比较多,尤其是大量文本处理、数据清洗、格式转换——这些活它干得又快又省钱。



但我又不太敢把长任务交给它。


因为短任务里虽然是好搭子,但到了长任务里它会不会又变成演员?我还没攒够信心去验证。


不过在便宜耐用这件事上,DeepSeek已经是国产模型里最让人放心的选择了。


◽Kimi K2.7 Code:相对稳定一些。


我对Kimi的Coding plan体感不错,没有限购、没有变化规则那么多幺蛾子。不过从近期的社区反馈体感上,它的模型能力上相比GLM 5.2应该差一些。


我之前的OpenClaw小瑶机器人接的是Kimi 2.6,不过那时候它模型能力还不太足,有点笨,不太会用工具,执行力一般,有幻觉,胜在价格和稳定性。



2.7 Code出来之后,情况改观了一些。


我现在把它接在Claude Code里面当编程替补,特别稳定,别家崩的时候可以拿来稳稳补位,但也仅限于此,再更复杂的长任务我对它还是很谨慎的。


社区的风评也贬褒不一,有不少人说它是小号Gemini。。


◽MiniMax M3:被低估的多面手。


MiniMax M3是这四个里面最让我意外的。


虽然风评相对没那么好,但它的原生多模态能力真的不错——图、PDF、视频都能处理,而且有1M的长上下文,用起来很方便。


而且,永久半价后价格也划算。


比如那种复杂的前端任务,要根据一大堆各种格式适配风格的,我都会交给MiniMax M3,比让Claude在后台写脚本逐个解析方便很多。


但它刚出的时候有个问题:慢。丢一个长文档进去,它要想很久才回。


但现在,MiniMax的速度明显快了不少,而且现在还永久半价,性价比高了很多。


如果你的工作场景要是经常要处理截图、表格、扫描件、音视频这种多模态资料,M3值得认真试试。


◽GLM 5.2:编程能力最强,但不太好买到


GLM 5.2是这四个里面编程能力最强的。


社区好评也多——coding能力强,长上下文扎实。不过幻觉率不低,而且没有多模态。



我实测效果也很不错——现在,我已经信任到敢把它拿过来协助删库了。。


很适合平替主Agent的主模型。



不过唯一的缺点可能是不好买到,它家的Coding plan要在每天早上十点整排队抢购,而且相当难买,我蹲了好久才终于买到。(确实好用,以至于供不应求了)


而且,编程套餐给的并发量一般,所以大规模多线程用起来可能有点慢,高峰期速度也慢。它的API价格也不太适合拿出做批量任务。


◈说完结论,说说心里话


现在回头想想,之前写代码同样是翻车,Claude、OpenAI我经常会自动给它们找补——会觉得是不是我prompt没写清楚,或者上下文给得太乱。


但国产模型翻车,我脑子里第一反应经常是——果然。


这话说出来有点伤人,但我猜不少人心里都有过类似的瞬间。不是不想支持国产模型,也不是没看到它们这两年的进步——有过几次不好的体验之后,就很难再轻易托付。


我想了想,原因可能不在模型参数里,在关系里。


一路走来,Claude和OpenAI陪我走过太多真实工作流了。很多时候,我知道它们不完美,但它们确实帮我扛住了活。这种东西会变成一种很隐形的信任余额。


国产模型更像一个早就认识的一般朋友,一直没有留下特别突出的印象,即使现在已经比以前强很多了,但它以前有过一次不好的印象,再加上周围总有人传它的绯闻,我还是会心存芥蒂。


更麻烦的是,当我们真正拿国产测试时,往往不是从一个干净的小任务开始,而是直接把它塞进Claude和OpenAI已经推进很远的复杂长任务里。


而且在这种场景里,它一旦出错,我们依旧会把它直接归类成不靠谱。。


阻碍我信任国产模型的,现在看来不是能力差距了。能力上的短板,国产模型正在一点点地补。而且前端能力普遍都很强,做出来视觉效果非常好看。


真正还在慢慢补回来的是用户信任。能力是入场券,信任才是留下来的理由。


国产模型需要更多的时间、更多的场景。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。