AI 工程 · Agent Harness

Agent Harness 工程实践深度解读

瓶颈不在模型够不够聪明,而在我们有没有把它"装"好。本文梳理 Harness Engineering 的范式演进、四条铁律、六大模式,并以悟空 AI 招聘案例验证。

阿里云开发者 · 2026年6月30日 · 阅读原文 ↗

本页将这篇约 16000 字的技术文章拆解为可视化结构,帮你快速掌握核心论点和工程模式。

Quick Read

最值得先知道的几件事

Agent = Model + Harness

模型负责推理,Harness 负责工具、上下文、权限、反馈等"剩下的所有事"。

重要性:优化方向从"换模型"转向"换缰绳",杠杆位置彻底改变

不换模型,排名 30→第 5

LangChain 仅优化 Harness,得分从 52.8 升到 66.5,排名从第 30 冲入第 5。

重要性:一手数据证明 Harness 回报曲线比换模型陡得多

四条反直觉铁律

上下文越少越好、专才胜通才、状态写文件、约束写 Linter。

重要性:这是后续所有工程模式的"DNA"

悟空 AI 招聘真实案例

从"全能 Agent + 13 工具"改为"2 Agent + N Skill"专才架构,准确率达标。

重要性:生产环境实测,而非理论推演

范式三代跳跃

Prompt → Context → Harness Engineering,从"对马喊话"到"给马造高速公路"。

重要性:理解团队站在第几代,才知道该补什么

对外说话必须接硬护栏

聊天 Agent 被加上白名单、Linter、另一 Agent 审稿三层护栏。

重要性:事故率从每周一两次降到"记不清上一次"
Core Thread

文章核心脉络

背景

Agent 开发者普遍遇到"野马冲出显示器"的困境:模型够聪明但缺约束。

问题

优化方向错误——大量精力放在"换更强模型"上,真正杠杆在模型之外。

机制

四条铁律 + 六大工程模式,系统化地为 Agent 构建可控工作环境。

结论

护城河不是更聪明的模型,而是更稳的 Harness——它决定你能跑多远多稳。

Deep Dive

深度解读

范式的三次跃迁

从"对马喊话"到"给马造高速公路",关注点从话术转向环境

三代范式演进路径

从左到右,每一代解决的核心问题不同,后一代包含前一代但不被其替代。

第一代
Prompt Eng.
怎么把话说清楚
第二代
Context Eng.
怎么喂对信息
第三代
Harness Eng.
怎么让 Agent 可控

三代范式依次演进:Prompt 解决"说什么",Context 解决"给什么",Harness 解决"怎么管"。

作者观点 文章将 AI 工程范式分为三代。

第一代关注"怎么把话说清楚",第二代关注"怎么给 AI 喂对信息"。

第三代 Harness Engineering 关注"怎么让 Agent 可控地工作"。

类比:模型是 CPU,Harness 是操作系统——CPU 再快,OS 拉胯也白搭。

文章依据:代际对比表及 CPU/OS 类比,出自文章第三节。

影响:团队应评估自己处于哪一代,补齐后一代的能力。

四条反直觉铁律

每一条都和工程师本能背道而驰,这正是它们值钱的原因

本能 vs Harness 真相

每组三个节点展示一条铁律:左侧是本能反应,中间是转变,右侧是铁律。

上下文越多越好
← 本能
稀缺资源
精挑细选
← 转变
上下文越少越好
→ 铁律一
超级 Agent 全包
← 本能
拆给专才
只装必要工具
← 转变
专才永远赢通才
→ 铁律二

铁律要求反本能操作:减少而非增加、拆分而非合并、外化而非内化、机器强制而非人工记忆。

作者观点 铁律一:上下文是稀缺资源,会被污染和干扰。

不要把"模型支持 200K"等同于"可以塞 200K"。

铁律二:Agent 是昂贵的,Skill 是廉价的。

铁律三:上下文是易失存储,文件系统才是持久内存。

铁律四:文档只是"建议",Linter/CI 才是"强制"。

文章依据:四条铁律及对比表,出自文章第四节。

影响:构建 Agent 系统的团队应审视是否违反了这四条。

六大工程模式

已被多家团队在生产环境验证过,可以直接抄

模式间的逻辑关系

任务进入双阶段架构,经工具签名优化后分发给 Sub-Agent,反压防循环,审计保质量。

双阶段架构
Init + Exec
Sub-Agent 隔离
工具签名即文档
反压 + 审计
园丁抑熵

六个模式形成三层防线:任务拆分层、执行隔离层、质量保障层。

FACT 模式 1:双阶段架构。

Initializer 写 plan.md,Executor 读取执行,不共享 Context。

FACT 模式 2:工具签名即文档。

工具名是动词短语,参数带描述,返回值结构稳定。

FACT 模式 3:Sub-Agent 隔离。

独立 Context Window,只看必要工具。

FACT 模式 4:上下游反压。

Linter/CI 拒绝无效工作,错误信息本身是上下文工程。

FACT 模式 5:智能体审智能体。

换 Context 做 Review,避免"自我合理化"偏见。

FACT 模式 6:文档园丁。

定期扫描过期文档,持续小额偿还技术债。

文章依据:六大模式索引表及描述,出自文章第六节。

影响:为 Agent 工程师提供可复用的"设计模式手册"。

悟空 AI 招聘:从全能到专才

同一组数据,两种架构,四个维度全胜

架构改造的因果链路

从左到右:第一版的问题 → 改造动作 → 第二版的效果。

全能 Agent
600行 Prompt
13 工具,上下文爆炸
拆为 2 Agent
+ N Skill
每 Agent 只看 4-5 工具
准确率达标
分钟级定位
可复用到其他场景

全能 Agent 在工具堆里"逛超市",拆分后每个专才 Agent 只看 4-5 个工具,准确率显著提升。

FACT 第一版是全能招聘 Agent。

600+ 行 Prompt、13 个工具,跑了一周问题全冒出来。

上下文爆炸、工具选错、状态丢失,同时违反铁律一和铁律二。

FACT 第二版按"Agent 贵、Skill 廉"重新设计。

人岗匹配 Agent(RPA 专才,4 工具)+ 招聘沟通 Agent(聊天专才,5 工具)。

FACT 改造后端到端准确率稳定超过上线门槛。

日志分钟级定位,人岗匹配 Agent 已复用到内推系统。

文章依据:悟空架构图及改造对比表,出自文章第七节。

影响:企业级 Agent 开发者可直接参考该架构。

企业级护栏与行业标杆

对外说话的地方必须接硬护栏,各家护栏落点不同

聊天 Agent 的三层硬护栏

从下到上,每一层拦截不同类型的风险,形成纵深防御。

第 1 层
白名单工具
禁用撤回/群发
第 2 层
Linter 拦截
敏感词/合规检查
第 3 层
独立 Agent 审稿
判断是否冒犯

三层护栏依次拦截:工具层限制能力范围,Linter 层检查内容合规,独立 Agent 层用新 Context 判断风险。

FACT 悟空招聘的聊天 Agent 是唯一"会主动给真人发消息"的 Agent。

三层护栏使事故率从"每周一两次"降到"记不清上一次"。

FACT 行业标杆对位:Anthropic 重双阶段,LangChain 重自我验证。

Ghostty 重 AGENTS.md,Cursor 重反馈回路。

作者观点 各家护栏落点不同。

四根护栏在五层里都有落点才是成熟团队。

文章依据:三层护栏表格及行业标杆地图,出自文章第 7.5 节和第八节。

影响:"对外发言"和"操作用户数据"的 Agent 必须早期就上护栏。

Concepts

关键概念解释

Harness Engineering

驾驭工程,通过工程化手段设计 Agent 的工作环境,让它不再犯同样的错。

从左到右:每次 Agent 犯错触发一次环境改造,形成正循环。

Agent 犯错工程化解法同样错误不再犯

Harness 的核心循环:失败 → 工程化解决 → 预防再犯。

它把优化方向从"换更强模型"转向"换更好的缰绳",是全文核心论点。

Context Engineering

上下文工程,系统化管理输入给模型的信息,使其结构化、可回放、可审计。

从左到右:从原始"喂信息"升级为工程化的"控信号"。

结构化 + 分段化可回放 + 可审计从玄学到工程

上下文工程的四个动作:结构化、分段化、可回放、可审计。

它是 Harness 的前身和核心组成部分。不理解上下文工程,就无法理解 Harness。

Workspace(真相之源)

Agent 系统的持久化状态层,任务中间结果、跨会话状态全部存在文件系统中。

上下文窗口是易失的"工位",Workspace 是持久的"档案"。

Context Window
当前工位(易失)
写入文件
状态持久化
Workspace
真相之源(持久)

状态从易失的上下文窗口转移到持久的 Workspace 文件系统。

铁律三的核心载体。没有 Workspace,跨会话、断点续传、审计回放都无法实现。

Sub-Agent 隔离

将复杂任务拆给独立的专才 Agent,每个拥有独立上下文窗口,只看必要工具。

主 Agent 派单给专才,只接收结构化输出,不接收中间思考。

主 Agent
拆任务 + 派单
专才 Agent
独立 Context
结构化输出
回传主 Agent

主 Agent 派单 → 专才 Agent 独立执行 → 结构化结果回传,避免上下文污染。

铁律二的核心实现。悟空案例证明,拆分后工具选择准确率显著提升。

上下游反压

通过下游测试/Lint/CI 拒绝无效工作,将错误信号回传上游,防止无限循环。

错误信息本身就是上下文工程,它解释"为什么"而不只是"违反了什么"。

Agent 执行Linter/CI 拦截错误信号回传
上游调整

反压回路:执行 → 检查 → 拒绝并回传原因 → 上游自我修正。

模式 4 的核心。没有反压,Agent 会反复"修复"同一个错误十几次。

双阶段架构

把任务拆成 Initializer(理解 + 计划)和 Executor(执行)两段,通过文件接力。

任务先经过计划阶段写入文件,再由另一个 Agent 读取执行。

Initializer
理解任务 → 写计划
plan.md
Workspace 接力
Executor
读取计划 → 执行

双阶段架构:计划者写文件 → 执行者读文件,两者不共享上下文。

模式 1 的核心。让任务可跨多次会话延续,不依赖任何一个会话的记忆。

Visuals

关系可视化

Agent + Harness 五层运行时

纵向五层是用户请求流过的完整路径,左侧四根护栏垂直穿透每一层。

User Interaction — 用户交互层
Orchestration — 编排层:任务拆分、调度
Capability — 能力层:Skill 和工具签名
Workspace — 状态基座:横跨所有层的持久化存储
MCP / External — 外部接口层:标准化设备驱动

不同角色的收益与风险

每个角色从 Harness Engineering 获得的收益和面临的风险不同。

对象
收益
风险
Agent 开发者
可复用模式库,减少踩坑
需要学习新抽象层
企业团队
Agent 可控、可审计、可复用
初期投入成本较高
行业整体
从"单 Agent"进化为"Agent OS"
标准化尚未完成
Key Table

重点信息表

内容点原文含义为什么重要影响对象风险/限制
Agent = Model + Harness模型负责推理,Harness 负责其余一切彻底改变优化方向所有 Agent 开发者原文未提供具体边界条件
LangChain 排名提升仅优化 Harness,得分 52.8→66.5,排名 30→5一手数据证明 Harness 回报率高开发者、团队负责人仅限 Terminal Bench 场景
四条铁律上下文少、专才胜通才、状态写文件、约束可执行所有工程模式的 DNAAgent 架构设计师具体阈值因模型/任务而异
悟空 AI 招聘架构全能 Agent → 2 Agent + N Skill,四维度全胜生产环境实测验证企业级 Agent 团队数据仅代表本场景
三层硬护栏白名单 + Linter + 独立 Agent 审稿对外发言必须有机器强制护栏招聘、客服等对外场景原文未提供具体误报率数字
行业标杆对位Anthropic/LangChain/Ghostty/Cursor 各有侧重四根护栏在五层里都有落点才是成熟团队技术决策者非排名,是"护栏落点差异"
三大趋势判断岗位转型、A2A 协议、Agent OS未来竞争焦点从"更智能"转向"更稳"行业从业者、投资者每条均附可证伪条件
Takeaways

总结与启发

01

优化的不是 Agent,是 Agent 的工作环境。把它当员工而非工具,上下文是稀缺资源,状态写在文件里。

02

Agent 是昂贵的,Skill 是廉价的,护栏是最便宜的。能用 Skill 解决就别加 Agent,能用 Linter 拦下就别靠 Prompt。

03

对外说话和动用户数据的地方,硬护栏要早一步到位。Prompt 可以漏,模型可以错,但合规底线不能突破。

04

真正的护城河不是更聪明的模型,而是更稳的 Harness。未来竞争焦点会从"我的 Agent 多智能"变成"我的 Agent OS 多稳"。

05

每一个写过代码、调过 Bug、做过 Code Review 的工程师,都拥有这场革命中最稀缺的资产:对"系统应该如何运转"的直觉。

Coverage

内容覆盖检查

已覆盖:核心观点(Agent=Model+Harness,四条铁律,六大模式)
已覆盖:关键事实(LangChain 排名提升,悟空架构改造数据)
已覆盖:重要案例(悟空 AI 招聘全流程,三条血泪经验)
已覆盖:影响分析(开发者、团队、行业三个角度)
已覆盖:风险/限制(数据仅代表本场景,趋势含可证伪条件)
已标注:部分行业流传数字未核实到一手来源,原文已主动软化或删除

作者观点/趋势判断:文章多处使用"作者观点"标签明确区分事实与观点。三大趋势判断均附可证伪条件。部分行业流传数字(如"小团队/百万行代码/0 手写")已标注为未核实。

原文未提供 作者个人姓名(仅标注"阿里妹")、发布者准确名称(推测为千问云/阿里云开发者)