Agent = Model + Harness
模型负责推理,Harness 负责工具、上下文、权限、反馈等"剩下的所有事"。
重要性:优化方向从"换模型"转向"换缰绳",杠杆位置彻底改变瓶颈不在模型够不够聪明,而在我们有没有把它"装"好。本文梳理 Harness Engineering 的范式演进、四条铁律、六大模式,并以悟空 AI 招聘案例验证。
本页将这篇约 16000 字的技术文章拆解为可视化结构,帮你快速掌握核心论点和工程模式。
模型负责推理,Harness 负责工具、上下文、权限、反馈等"剩下的所有事"。
重要性:优化方向从"换模型"转向"换缰绳",杠杆位置彻底改变LangChain 仅优化 Harness,得分从 52.8 升到 66.5,排名从第 30 冲入第 5。
重要性:一手数据证明 Harness 回报曲线比换模型陡得多上下文越少越好、专才胜通才、状态写文件、约束写 Linter。
重要性:这是后续所有工程模式的"DNA"从"全能 Agent + 13 工具"改为"2 Agent + N Skill"专才架构,准确率达标。
重要性:生产环境实测,而非理论推演Prompt → Context → Harness Engineering,从"对马喊话"到"给马造高速公路"。
重要性:理解团队站在第几代,才知道该补什么聊天 Agent 被加上白名单、Linter、另一 Agent 审稿三层护栏。
重要性:事故率从每周一两次降到"记不清上一次"Agent 开发者普遍遇到"野马冲出显示器"的困境:模型够聪明但缺约束。
优化方向错误——大量精力放在"换更强模型"上,真正杠杆在模型之外。
四条铁律 + 六大工程模式,系统化地为 Agent 构建可控工作环境。
护城河不是更聪明的模型,而是更稳的 Harness——它决定你能跑多远多稳。
从左到右,每一代解决的核心问题不同,后一代包含前一代但不被其替代。
三代范式依次演进:Prompt 解决"说什么",Context 解决"给什么",Harness 解决"怎么管"。
作者观点 文章将 AI 工程范式分为三代。
第一代关注"怎么把话说清楚",第二代关注"怎么给 AI 喂对信息"。
第三代 Harness Engineering 关注"怎么让 Agent 可控地工作"。
类比:模型是 CPU,Harness 是操作系统——CPU 再快,OS 拉胯也白搭。
文章依据:代际对比表及 CPU/OS 类比,出自文章第三节。
影响:团队应评估自己处于哪一代,补齐后一代的能力。
每组三个节点展示一条铁律:左侧是本能反应,中间是转变,右侧是铁律。
铁律要求反本能操作:减少而非增加、拆分而非合并、外化而非内化、机器强制而非人工记忆。
作者观点 铁律一:上下文是稀缺资源,会被污染和干扰。
不要把"模型支持 200K"等同于"可以塞 200K"。
铁律二:Agent 是昂贵的,Skill 是廉价的。
铁律三:上下文是易失存储,文件系统才是持久内存。
铁律四:文档只是"建议",Linter/CI 才是"强制"。
文章依据:四条铁律及对比表,出自文章第四节。
影响:构建 Agent 系统的团队应审视是否违反了这四条。
任务进入双阶段架构,经工具签名优化后分发给 Sub-Agent,反压防循环,审计保质量。
六个模式形成三层防线:任务拆分层、执行隔离层、质量保障层。
FACT 模式 1:双阶段架构。
Initializer 写 plan.md,Executor 读取执行,不共享 Context。
FACT 模式 2:工具签名即文档。
工具名是动词短语,参数带描述,返回值结构稳定。
FACT 模式 3:Sub-Agent 隔离。
独立 Context Window,只看必要工具。
FACT 模式 4:上下游反压。
Linter/CI 拒绝无效工作,错误信息本身是上下文工程。
FACT 模式 5:智能体审智能体。
换 Context 做 Review,避免"自我合理化"偏见。
FACT 模式 6:文档园丁。
定期扫描过期文档,持续小额偿还技术债。
文章依据:六大模式索引表及描述,出自文章第六节。
影响:为 Agent 工程师提供可复用的"设计模式手册"。
从左到右:第一版的问题 → 改造动作 → 第二版的效果。
全能 Agent 在工具堆里"逛超市",拆分后每个专才 Agent 只看 4-5 个工具,准确率显著提升。
FACT 第一版是全能招聘 Agent。
600+ 行 Prompt、13 个工具,跑了一周问题全冒出来。
上下文爆炸、工具选错、状态丢失,同时违反铁律一和铁律二。
FACT 第二版按"Agent 贵、Skill 廉"重新设计。
人岗匹配 Agent(RPA 专才,4 工具)+ 招聘沟通 Agent(聊天专才,5 工具)。
FACT 改造后端到端准确率稳定超过上线门槛。
日志分钟级定位,人岗匹配 Agent 已复用到内推系统。
文章依据:悟空架构图及改造对比表,出自文章第七节。
影响:企业级 Agent 开发者可直接参考该架构。
从下到上,每一层拦截不同类型的风险,形成纵深防御。
三层护栏依次拦截:工具层限制能力范围,Linter 层检查内容合规,独立 Agent 层用新 Context 判断风险。
FACT 悟空招聘的聊天 Agent 是唯一"会主动给真人发消息"的 Agent。
三层护栏使事故率从"每周一两次"降到"记不清上一次"。
FACT 行业标杆对位:Anthropic 重双阶段,LangChain 重自我验证。
Ghostty 重 AGENTS.md,Cursor 重反馈回路。
作者观点 各家护栏落点不同。
四根护栏在五层里都有落点才是成熟团队。
文章依据:三层护栏表格及行业标杆地图,出自文章第 7.5 节和第八节。
影响:"对外发言"和"操作用户数据"的 Agent 必须早期就上护栏。
驾驭工程,通过工程化手段设计 Agent 的工作环境,让它不再犯同样的错。
从左到右:每次 Agent 犯错触发一次环境改造,形成正循环。
Harness 的核心循环:失败 → 工程化解决 → 预防再犯。
它把优化方向从"换更强模型"转向"换更好的缰绳",是全文核心论点。
上下文工程,系统化管理输入给模型的信息,使其结构化、可回放、可审计。
从左到右:从原始"喂信息"升级为工程化的"控信号"。
上下文工程的四个动作:结构化、分段化、可回放、可审计。
它是 Harness 的前身和核心组成部分。不理解上下文工程,就无法理解 Harness。
Agent 系统的持久化状态层,任务中间结果、跨会话状态全部存在文件系统中。
上下文窗口是易失的"工位",Workspace 是持久的"档案"。
状态从易失的上下文窗口转移到持久的 Workspace 文件系统。
铁律三的核心载体。没有 Workspace,跨会话、断点续传、审计回放都无法实现。
将复杂任务拆给独立的专才 Agent,每个拥有独立上下文窗口,只看必要工具。
主 Agent 派单给专才,只接收结构化输出,不接收中间思考。
主 Agent 派单 → 专才 Agent 独立执行 → 结构化结果回传,避免上下文污染。
铁律二的核心实现。悟空案例证明,拆分后工具选择准确率显著提升。
通过下游测试/Lint/CI 拒绝无效工作,将错误信号回传上游,防止无限循环。
错误信息本身就是上下文工程,它解释"为什么"而不只是"违反了什么"。
反压回路:执行 → 检查 → 拒绝并回传原因 → 上游自我修正。
模式 4 的核心。没有反压,Agent 会反复"修复"同一个错误十几次。
把任务拆成 Initializer(理解 + 计划)和 Executor(执行)两段,通过文件接力。
任务先经过计划阶段写入文件,再由另一个 Agent 读取执行。
双阶段架构:计划者写文件 → 执行者读文件,两者不共享上下文。
模式 1 的核心。让任务可跨多次会话延续,不依赖任何一个会话的记忆。
纵向五层是用户请求流过的完整路径,左侧四根护栏垂直穿透每一层。
每个角色从 Harness Engineering 获得的收益和面临的风险不同。
| 内容点 | 原文含义 | 为什么重要 | 影响对象 | 风险/限制 |
|---|---|---|---|---|
| Agent = Model + Harness | 模型负责推理,Harness 负责其余一切 | 彻底改变优化方向 | 所有 Agent 开发者 | 原文未提供具体边界条件 |
| LangChain 排名提升 | 仅优化 Harness,得分 52.8→66.5,排名 30→5 | 一手数据证明 Harness 回报率高 | 开发者、团队负责人 | 仅限 Terminal Bench 场景 |
| 四条铁律 | 上下文少、专才胜通才、状态写文件、约束可执行 | 所有工程模式的 DNA | Agent 架构设计师 | 具体阈值因模型/任务而异 |
| 悟空 AI 招聘架构 | 全能 Agent → 2 Agent + N Skill,四维度全胜 | 生产环境实测验证 | 企业级 Agent 团队 | 数据仅代表本场景 |
| 三层硬护栏 | 白名单 + Linter + 独立 Agent 审稿 | 对外发言必须有机器强制护栏 | 招聘、客服等对外场景 | 原文未提供具体误报率数字 |
| 行业标杆对位 | Anthropic/LangChain/Ghostty/Cursor 各有侧重 | 四根护栏在五层里都有落点才是成熟团队 | 技术决策者 | 非排名,是"护栏落点差异" |
| 三大趋势判断 | 岗位转型、A2A 协议、Agent OS | 未来竞争焦点从"更智能"转向"更稳" | 行业从业者、投资者 | 每条均附可证伪条件 |
优化的不是 Agent,是 Agent 的工作环境。把它当员工而非工具,上下文是稀缺资源,状态写在文件里。
Agent 是昂贵的,Skill 是廉价的,护栏是最便宜的。能用 Skill 解决就别加 Agent,能用 Linter 拦下就别靠 Prompt。
对外说话和动用户数据的地方,硬护栏要早一步到位。Prompt 可以漏,模型可以错,但合规底线不能突破。
真正的护城河不是更聪明的模型,而是更稳的 Harness。未来竞争焦点会从"我的 Agent 多智能"变成"我的 Agent OS 多稳"。
每一个写过代码、调过 Bug、做过 Code Review 的工程师,都拥有这场革命中最稀缺的资产:对"系统应该如何运转"的直觉。
作者观点/趋势判断:文章多处使用"作者观点"标签明确区分事实与观点。三大趋势判断均附可证伪条件。部分行业流传数字(如"小团队/百万行代码/0 手写")已标注为未核实。
原文未提供 作者个人姓名(仅标注"阿里妹")、发布者准确名称(推测为千问云/阿里云开发者)