2026-06-14 10:12

Codex和Claude Code负责人都不写提示词了,AI 圈爆火的Loop到底是什么

author_path AppSo
头图

本文来自微信公众号: APPSO ,作者:发现明日产品的


要不说AI圈都是造词大师呢,回看过去这一年,都已经造出了多少个新词了。


提示词工程火了,火完之后Harness工程,现在又轮到了循环工程。以前是把提示词写好最重要,模型的能力体现在我们喂给它什么样的提示词。后面是Harness重要,要想模型产出稳定的结果,给它套一个马鞍,让它在框架内运作很重要。


再到现在,Loop Engineering,循环工程,写提示词、写Harness都比不过写好一个循环。



龙虾之父在X发文,不要在Coding Agent类产品里面写提示词了,我们应该设计一些循环来使用这些Agent。Codex负责人Tibo也很快转发了这则推文,问网友是否已经开始写嵌套循环了。


Codex的对家,Claude Code产品负责人Boris Cherny也在接受播客采访时提到,「不跟Agent对话,跟loop对话,让loop替我来prompt」。


Claude Code的负责人Boris Cherny,和产品负责人Cat Wu在Claude官方回顾Claude Code第一年的节目上,聊天过程中两人都表示很喜欢loop,认为Loop是下一个Leap(飞跃)


和loop对话?所以loop到底是什么。仿佛还没有看到所谓的Loop Engineering到底给一个项目带来了什么改变。例如用控制变量法,一个采用循环工程,一个不使用,两者最后的产出会有什么区别吗?


这些术语就莫名其妙地出现在了社交媒体上,有人说不用管「loop工程」是什么,它本质就是一种炒作和营销的手段。


一个正在使用Agent的用户,自然而然就实现了所谓的loop工程,而不是专门有一套流程,符合那套标准,需要被单拎出来,才可以被叫做是Loop Engineering。



所以是新瓶装旧酒,一套过去的思维方法论,重新套上了新名词吗?


人从写提示词,变成写循环


如果只看技术实现,Loop Engineering其实没有发明什么全新的东西。Harness、Skill、Agent Workflow这些系统,过去几年都在尝试让Agent自己规划、执行、反思和继续执行。


但今天大家重新开始讨论Loop,是因为模型终于开始能把循环跑下去了。当Agent能连续工作几十分钟、几个小时,甚至跨天完成任务时,人和AI协作的单位,也开始从一次对话变成一个完整回路。


什么是Loop Engineering,这个词听起来很新,讲的事其实很日常:你让AI写代码,它写完后你跑测试;测试报错,你把错误贴回去;它再改;你再跑。来回几次,直到代码能用。


这就是一个最原始的loop:行动、观察、修正、再行动。


区别在于,过去每一轮都靠人手动推动。人要复制报错、追问原因、提醒它别改错文件、判断什么时候该停。Loop Engineering做的事,是把这些反复发生的动作写成规则,交给系统去执行。



一个完整的loop,至少要回答五个问题:AI什么时候开始干活?它能调用哪些工具?它怎么知道自己做错了?它把每一轮结果记在哪里?它什么时候必须停下来交给人?


所以Loop Engineering更接近一套工作制度:给AI设任务、设工具、设反馈、设记忆、设刹车;prompt只是这套系统里最小的零件。


放到代码项目里,它可能是这样:每天早上,系统自动检查昨晚失败的代码提交。


AI读日志,判断是测试波动、依赖问题,还是最近提交引入的bug。能复现的,它在单独的worktree里尝试修复,跑测试,通过后开一个草稿PR。原因不清楚的,它把现场、尝试过的方法和下一步建议写进一个文件,等人来接手。



放在我们的工作流里,它就是每天早上,AI自动扫指定的新闻源、社交平台和公司博客。它挑出5个可能成稿的选题,补上来源、关键人物、争议点、可用截图和一句话判断。资料不足的地方,它标出来。到我们面前时,它已经整理成一张选题卡。


龙虾之父也在X分享了自己的循环工程实践,他让Codex维护自己的代码仓库,每5分钟唤醒一次并将工作分配给不同的线程。他说通过运用统筹能力,结合分类、自动审核和Computer Use技能,已经能让一些工作自主完成。



听起来也很像之前Claude Code主打的「做梦」机制,以及Hermes Agent的自进化功能,让Agent自己从过往上下文学习知识并完善所有的流程。


这也就是Loop Engineering的核心变化:Prompt Engineering时代,人负责写一句好提示词。Harness Engineering时代,人开始给模型搭框架。到Loop Engineering,人的工作进一步后退了一层。


一个loop由什么组成


一个能跑起来的loop,通常有几样东西。



根据Google Cloud AI总监Addy Osmani在X发布的循环工程文章,一套完整的循环工程,同样是五个积木加一个用来记录的记事本。



五个积木分别是定时任务、worktree、Skill、连接器、子Agent,以及一个记事本叫状态文件。


定时任务,在Codex里它叫Automations,在OpenClaw里面叫HEARTBEAT,在Claude Cowork里面是Scheduled。通过配置定时任务,我们可以选择对应的项目,自定义一段提示词,再设置对应的运行频率。


这是自动化循环的第一步。在设置定时任务时,也像使用Codex里面的Goal模式,让Agent自动跑,直到完成我们设定的目标。



Worktree存在的意义,是给每个Agent一个独立的工作目录,可以确保Agent在循环工程中只是修改各自的分支。


有了Skill,循环每一圈都可以不用猜测我们的项目是什么。Skill通过把项目知识写在文件里:构建步骤、团队约定、「上次就是这么出事的,所以不允许这么做了」,让Agent有了更充分的记忆,去处理任务。


连接器的主要目的是靠MCP协议跳出这个单独的文件系统,获取外界的给定数据库和其他系统信息,来完善整个循环。


子agent也是整个体系里最重要的结构,写代码的和审代码必须是两拨人。换一个指令不同、甚至模型都不同的agent来挑刺,才能审核出真正的问题。



记忆也很重要。很多AI工作流每天都会重复,但每天都从零开始。昨天已经确认过的事实,今天还要再查一次;上周已经否掉的标题风格,这周又被生成出来;某个来源经常不可靠,但AI下次仍然引用它。


除了用Skill的更新来规范Agent的行为,循环还需要一个聊天框外的记忆位置。


记事本,一个状态文件,它在单次对话之外,可以是一个文档、表格、看板,也可以是一份项目规则。里面记录已确认的信息、踩过的坑、偏好的格式、禁用的表达、上次没解决的问题。AI每次启动时先读它,就能接着往下走。



上手Loop Engineering


Loop Engineering常被开发者讨论,是因为代码有天然的反馈机制:测试能不能过,程序能不能跑,错误日志在哪里。这让代码场景看起来特别适合loop。


但就像Coding Agent最后变成了所有人的Agent,loop的适用范围也远不止编程。


内容工作里,它可以做选题筛选、资料整理、初稿生成、事实检查、标题优化和发布前检查。


客服工作里,它可以先读客户来信,判断问题类型,整理历史记录,生成回复草稿,并把敏感投诉留给人工处理。AI不需要直接发出所有回复,它先把问题分好、材料备好,就已经省掉很多时间。


产品和运营工作里,它可以定期整理用户反馈、应用商店评论、社媒讨论和竞品更新。


研究工作里,它可以追踪一个主题下的新论文、新报告、新数据。每天或每周更新一次,把新增内容和已有判断放在一起。


这些场景共同点都是任务会反复出现,流程相对稳定,结果可以被检查,关键判断还在人的手里。



想要真正入门循环工程也不是一件容易的事情,它有个前提:token管够。


循环会反复读上下文、反复重试、四处探索,不管最后有没有产出,Token都在燃烧。拥有无限额度的人觉得循环是常识,就像龙虾之父、Claude Code负责人、Google Cloud AI总监,他们都有无上限的Token。


但月付20美元的我们,循环跑了两天就达到了周限额。


还有,任务得每周都重复,如果是一次性的活,一句好提示词又快又便宜,重复太少,Agent又无法从循环中学习到知识。


而反复的循环又得有自动验证、测试、类型检查、构建,需要确保Agent在没人盯着的时候可以把烂活拦下来。Agent还得有高级工程师的素养:日志、复现环境、能跑自己写的代码。



随便缺这里哪一条,循环的成本可能就会高过回报。而token成本其实把这个热词拉回了现实,Loop Engineering不会让AI协作变得无成本,它只是把成本从「人一轮轮盯着」的时间成本,转移到「系统一轮轮运行」Money成本。


新的问题在于,随着模型越来越强,这笔账正在发生变化。


过去,一个任务失败了,人只能回来继续追问、补充上下文、重新解释需求。今天,很多时候AI已经能自己尝试、自己验证、自己修正,再把结果交回来。


如果一次循环消耗的Token,已经接近一个人来回追问几轮的成本,那么真正值得优化的,可能就不再是某一句提示词,而是整个反馈回路。



所以Loop Engineering最值得讨论的地方,未必是它算不算一个新学科。


更现实的问题是,当AI已经能连续处理多轮任务,人还要不要继续把自己卡在每一次追问里。


有些工作,确实只需要一句好提示词。有些工作,则需要一套能反复运行、能留下记录、能及时停手的流程。


这个分界线,在当下看来,可能比「循环工程」这个名字本身重要得多。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。