s01: Agent Loop — 一个循环就够了
s01 → s02 → s03 → s04 → ... → s20
"One loop & Bash is all you need" — 一个工具 + 一个循环 = 一个 Agent。
Harness 层: 循环 — 模型与真实世界的第一道连接。
问题
你提出了一个问题给大模型:“帮我读取下我的目录下有哪些文件,并且执行XXX.py”。
模型能输出一条 bash 命令,但输出完了就停了,它不会自己跑,也不会看到结果后继续推理。
你可以手动跑一遍,把输出粘贴回对话框,让它接着干。下一个命令出来,你再跑一遍、再贴回去。
每一个来回,你都在做中间层。而把它自动化,就是这一章要做的事。
解决方案
)
一个 while True 循环,模型调用工具就继续,不调用就停。整个过程只有两个信号:
工作原理
将这个过程翻译成代码。分步来看:
第 1 步:把用户的问题作为第一条消息。
第 2 步:将消息和工具定义一起发给 LLM。
第 3 步:追加模型回答,检查它是否调了工具。没调 → 结束。
第 4 步:执行模型要求的工具,收集结果。
第 5 步:把工具结果作为新消息追加,回到第 2 步。
组装为一个完整函数:
不到 30 行,这就是最小可运行的 agent harness 内核。它不是智能本身,而是让模型能持续行动的最小运行框架,模型负责决策(要不要调工具、调哪个),harness 负责执行(调了就跑、结果喂回去)。后面 18 个章节都在这个循环上叠加机制,循环本身始终不变。
试一下
教学 demo 提示:代码会执行模型生成的 shell 命令。建议在一个临时测试目录中运行,避免影响你的项目文件。s03 会讲真正的权限系统。
准备(首次运行):
运行:
试试这些 prompt:
Create a file called hello.py that prints "Hello, World!"List all Python files in this directoryWhat is the current git branch?
观察重点:模型什么时候调用工具(循环继续),什么时候不调用(循环结束)?
接下来
现在模型手里只有 bash 一个工具,读文件要 cat,写文件要 echo ... >,找个文件要 find,又丑又容易出错。
s02 Tool Use → 给它 5 个真正的工具,会发生什么?模型会不会一次调用多个工具?几个工具同时跑会不会互相踩?
深入 CC 源码
以下内容基于 CC 源码
src/query.ts(1729 行)的核查。核心差异就两个:CC 不看stop_reason字段而是检查内容里有没有 tool_use 块(因为流式响应中 stop_reason 不可靠);CC 有更多的退出路径和恢复策略做生产级保护。
教学版的 30 行 while True 就是 CC 1729 行的核心。 下面每一项都是在这个核心上叠加的保护机制。
一、循环结构差异
教学版检查 response.stop_reason。CC 不把它作为循环继续的唯一依据——流式响应中 stop_reason 可能还没更新但内容里已经有 tool_use 块了。CC 用 needsFollowUp 标志:接收到流式消息时(query.ts:830-834),只要检测到 tool_use 块就设为 true;QueryEngine.ts 会从 message_delta 捕获真实 stop_reason 用于其他逻辑,但 query loop 本身靠 needsFollowUp 决定是否继续。
二、State 对象 10 字段(教学版只用 messages)
注:
taskBudgetRemaining(query.ts:291)是 loop-local 局部变量,不在 State 上。源码注释明确写了 "Loop-local (not on State)"。
三、多条退出和继续路径
教学版只有 1 条退出路径(模型不调工具就结束)。生产版有多条退出和继续路径,覆盖 blocking limit、prompt too long、model error、abort、hook stop、max turns、token budget continuation、reactive compact retry 等场景。每种场景都有对应的恢复或退出策略。
四、流式工具执行和 QueryEngine
CC 的 StreamingToolExecutor(query.ts:561)让工具在模型还在生成时就开始并行执行(根据工具是否 concurrency-safe 决定并发或独占)。QueryEngine.ts 额外加了费用超限、结构化输出验证失败等保护。教学版不实现这些——目标是概念清晰,不是性能极致。
一句话:1729 行的 query.ts 核心就是 30 行 while True。所有复杂字段和退出路径都是保护机制。先理解核心循环,后面的一切自然展开。
