2026-06-07 06:56

AI圈都在说的新词harness，没你想的那么神秘

凯莉彭

速览

本文来自微信公众号：凯莉彭，作者：凯莉彭

如果你关注AI，那么你最近也许会老听到这么一个词：Harness Engineering。

打开推特、刷公众号，到处都是它。OpenAI发文章、Anthropic跟进、HashiCorp的创始人在博客里推、Martin Fowler在专栏里写。两个月之内，这个词从无人知晓变成了AI行业的核心词汇。

我看到的第一反应是：又一个我没跟上的概念。

老实说，我对这种感受已经有点免疫了。AI这两年特别擅长造词：Prompt Engineering（提示词工程）、Context Engineering（上下文工程）、Agent（智能体）、RAG（检索增强生成）、MCP……

每隔一段时间，就冒出来一个新名词，配着一句潜台词："如果你不懂这个，你就落后了。"

研究完Harness Engineering之后，我想跟你说：

这个词没有那么神秘。事实上，你大概率早就在做这件事了，只是你不知道它叫这个名字。

今天这篇文章，就来详细聊聊这件事。

01 先把这个词

翻译成人话

Harness这个词，英文原意是马具，指的是给马套上的那一整套装备：缰绳、马鞍、嚼子、笼头。

马的特点是什么？有力气、跑得快。如果你放它自己跑，它会冲进邻居家的菜地、跑丢、撞墙。但套上马具之后，就可以让它精准地拉着马车走在你想走的路上。

把这个画面记住，因为AI圈现在就在用这个比喻。

行业里大家越来越喜欢用一个公式来描述现在的AI系统：

一个真正能干活的AI助手=模型本身+围绕模型搭建的整套控制系统

模型就是那匹"马"。比如GPT、Claude、Gemini，它们提供的是智力，是推理和生成的能力。

而Harness则是那身"马具"，也就是套在模型外面的一整套东西。规则、检验机制、可用的工具、可查的资料、出错时的反馈回路。

它告诉AI什么可以做、什么不能做，让AI知道自己做得对不对，在AI出错时让它能自我纠正。

模型负责"会做"，Harness负责"做对"。

❝

模型负责"会做"，

Harness负责"做对"。

@凯莉彭

打个更接地气的比方：模型像一个非常聪明、但完全不熟悉你公司情况的实习生。Harness就是你给这个实习生准备的"员工手册+工作规范+自动检查清单+出错就响的报警器"。

光有聪明的实习生没用，因为他不知道你们公司的规矩、不知道哪些事不能做、做错了也没人提醒他。你得给他套上一整套规则，他才能真正帮你把活干好。

02 一句话定义

铺垫完了，用一句话来定义一下：

Harness Engineering：你不在"让AI这一次做对"上花力气，而是在"让AI下一次、下下次、永远都不再做错这件事"上花力气。

或者用更精确一些：把AI犯过的某次错，永久写进它的运行环境里，让同样的错从机制上不可能再发生。

这个定义里有三个关键词，缺一不可。

一，它针对的是反复发生的问题，不是一次性的小失误。

二，解决方式是修改环境、规则、工具，不是重新跟AI说一遍。

三，效果是永久的、机制性的，不是这次说对了下次还得再说。

03 一个判断标准

你随时可以用

下次你跟AI互动时，如果它做错了某件事，试试多问自己一个问题：

"我是在治这次的病，还是在断这个病的根？"

治这次的病=在对话里重新解释、重新提示、让它重做一遍。这不是Harness。

断这个病的根=修改它的工作环境，让它从此不会再犯。这就是Harness。

讲到这里，我猜你已经隐隐有点感觉到了，这个动作我好像做过？

是的。下面这四个场景，你看看是不是似曾相识。

场景一：你给某个AI工具写过指令文件

你建过ChatGPT的自定义指令、Claude的用户偏好、或者Cursor的项目规则文件，里面写了"用中文回答""代码变量用英文""回答简洁不要废话""不准用emoji"……每次AI启动都先读一遍。从此它再也不会忘。

这就是Harness。你不是每次都临场提醒，而是把规则写进了它的工作环境。

场景二：你给AI配了专属知识库或者专属工作流程

你在某个AI工具里上传了一份公司文档、产品手册、风格指南，让它每次回答都基于这份资料。或者你在自动化工具里搭了个流程，让AI输出之后自动经过一个检查步骤再发给你。

这也是Harness。你不是每次都把资料贴一遍，不是每次都人工审一遍，而是把"喂资料"和"自动检查"做进了它的运行管道。

场景三：你写过skill，或者创建过”智能体“、”专家顾问“

这是Harness中最完整的一种形态。每一次模板更新，本质上就是在调整你的"马具"。把一次教训永久固化进AI的工作环境，让它下次不再犯。

场景四：你被AI坑过，然后做了点什么让它不再坑你

最朴素的版本是这样的：AI老是把你的中文引号改成方头括号「」，你在对话里说了三次"必须用弯引号"，它没用。后来你直接把"所有引号必须是中文全角引号，禁止用其他形式的引号"写进系统提示词。

这也是Harness。从"每次提醒"升级到"写进环境"，这就是Harness Engineering的核心动作。

所以你看，你不是不懂Harness，你只是不知道这个名字。

05 这个词为什么

突然就火了

时间线挺有意思的。

2026年2月，HashiCorp的联合创始人、Terraform的创造者Mitchell Hashimoto在他的个人博客发了一篇文章，叫《我的AI使用之旅》。

文章里他用了Harness Engineering这个词，描述他自己摸出来的一个工作习惯：只要AI犯一次错，他就花时间工程化一个解决方案，让它永远不会再犯同样的错。

不是每次报错就重新喂提示词、祈祷它这次做对，而是把这次错的教训永久写进环境里。

朴素吗？极其朴素。但这句话戳中了所有做AI应用的人的痛点。

两周之内，OpenAI、Anthropic、LangChain全都跟进发文。一个原本只在工程师私下用的小词，突然变成了行业共同语言。

它火得这么快，有三个原因。

第一，它命名了一件大家早就在做、但一直没有共同语言去描述的事。

你回想一下前面那四个场景，所有做AI工作流的人都在做这些动作，但过去没有一个统一的词来概括。现在这个词出来了，所有人都找到了语言。

第二，"写好提示词"这件事的红利期已经过去了。

过去两年大家都在卷"怎么把提示词写得更精妙"，但现在最贵的AI应用已经不靠单次提示词决定成败了。

它们的成败完全取决于外围环境搭得好不好。编程助手、研究助手、能自主跑数小时的工作流……都是如此。

第三，有一个让人记得住的数字。

斯坦福和清华大学的联合研究发现：同一个模型，因为外围环境（也就是Harness）设计不同，性能差距能拉到6倍。

模型没变，只是脚手架变了，结果从"几乎没用"到"接近人类水平"。

6倍。全在模型外面。

06 这意味着什么

它意味着AI行业正在发生一次重心转移。

从"比谁的模型更强"，转向"比谁的Harness搭得更好"。

过去你说"我用GPT-4/我用Claude"是一种身份。以后大家用的模型都差不多，价格越来越便宜、能力越来越接近、可替换性越来越强。

真正拉开差距的，是你给模型套的那身"马具"。

模型本身越来越像一个公共资源，谁都能用。但Harness是你私有的、能拉开差距的东西。

一个公司、一个团队、一个一人公司的核心竞争力，慢慢从"我用了什么模型"变成了"我围绕模型搭了什么样的工作环境"。

而这件事，任何一个用AI工作的人都可以开始做。不需要会写代码，不需要懂模型原理。你只需要做一件事：

下次AI犯了同样的错两次，可以停下来想一下，这个错该怎么解决掉，而不是再纠正一次？

Harness Engineering听起来是个新词，但它在做的事，其实是一句普通人的老话：

同样的坑，别让我踩第二次。

唯一的区别是，过去这句话是讲给自己听的，你自己学会经验、自己记住、下次自己留心。现在你要把这句话讲给AI听。

也就是说，你要把"经验"用一种AI能读懂、能自动应用的方式，写进它的工作环境里。

提示词工程教你怎么问。

Harness Engineering教你怎么让AI不用你每次都问。

❝

AI时代最大的效率提升，

是让AI不再重复犯同样的错。

@凯莉彭

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技