Harness Engineering 速查手册
本文件是 Harness Engineering 核心概念的浓缩参考,供 Skills 和 Commands 按需加载。 完整手册见:references/HarnessEngineering.md(综合 Anthropic · OpenAI · InfoQ · HN 实践精华)
核心定义
Harness Engineering 是将工程师的核心工作从「编写代码」转变为「设计让 AI 智能体可靠工作的环境」。
模型是骏马——强大但不自知方向;Harness 是缰绳、鞍具和衔铁——引导力量朝正确方向。
三个演进阶段
四大组成要素
六层模型
单层失效陷阱:三者协同才能真正有效——CLAUDE.md 规则单独使用会被偶尔忽略;Hooks 单独使用无法处理判断性任务;settings.json 单独使用缺乏上下文。
核心原则
- 上下文重置优于无限压缩:定期清空并结构化交接比累积更有效
- 永远不要让创建者独立评审自己的产出:分离生成与评估角色
- 随模型进化精简 Harness:新模型解决了某类失败时,主动删除脚手架
- 约束赋能,而非限制:架构约束越严格,Agent 产出越可靠
- 上下文是稀缺资源:批判性审视每个加入上下文窗口的内容
- 权限强制与模型推理分离:CLAUDE.md 解释原因,Hook 强制执行
核心循环
「在环路上」的角色定位
正确做法:对 Agent 产出不满意时,改进产生这个产物的 Harness,而不是直接修改产物。
前馈与反馈体系
原则:先用 Computational 覆盖 80% 常见问题,再用 Inferential 处理语义层面的剩余 20%。
