Files
everything-claude-code/docs/zh-CN/skills/agent-harness-construction/SKILL.md
zdoc.app abcf38b085 docs(zh-CN): sync Chinese docs with latest upstream changes (#341)
* docs(zh-CN): sync Chinese docs with latest upstream changes

* docs(zh-CN): update link

---------

Co-authored-by: neo <neo.dowithless@gmail.com>
2026-03-07 14:48:02 -08:00

1.9 KiB
Raw Blame History

name, description, origin
name description origin
agent-harness-construction 设计和优化AI代理的动作空间、工具定义和观察格式以提高完成率。 ECC

智能体框架构建

当你在改进智能体的规划、调用工具、从错误中恢复以及收敛到完成状态的方式时,使用此技能。

核心模型

智能体输出质量受限于:

  1. 行动空间质量
  2. 观察质量
  3. 恢复质量
  4. 上下文预算质量

行动空间设计

  1. 使用稳定、明确的工具名称。
  2. 保持输入模式优先且范围狭窄。
  3. 返回确定性的输出形状。
  4. 除非无法隔离,否则避免使用全能型工具。

粒度规则

  • 对高风险操作(部署、迁移、权限)使用微工具。
  • 对常见的编辑/读取/搜索循环使用中等工具。
  • 仅当往返开销是主要成本时使用宏工具。

观察设计

每个工具响应都应包括:

  • status: success|warning|error
  • summary: 一行结果
  • next_actions: 可执行的后续步骤
  • artifacts: 文件路径 / ID

错误恢复契约

对于每个错误路径,应包括:

  • 根本原因提示
  • 安全重试指令
  • 明确的停止条件

上下文预算管理

  1. 保持系统提示词最少且不变。
  2. 将大量指导信息移至按需加载的技能中。
  3. 优先引用文件,而不是内联长文档。
  4. 在阶段边界处进行压缩,而不是任意的令牌阈值。

架构模式指导

  • ReAct最适合路径不确定的探索性任务。
  • 函数调用:最适合结构化的确定性流程。
  • 混合模式推荐ReAct 规划 + 类型化工具执行。

基准测试

跟踪:

  • 完成率
  • 每项任务的重试次数
  • pass@1 和 pass@3
  • 每个成功任务的成本

反模式

  • 太多语义重叠的工具。
  • 不透明的工具输出,没有恢复提示。
  • 仅输出错误而没有后续步骤。
  • 上下文过载,包含不相关的引用。