mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-04-17 15:43:30 +08:00
docs(zh-CN): sync Chinese docs with latest upstream changes (#341)
* docs(zh-CN): sync Chinese docs with latest upstream changes * docs(zh-CN): update link --------- Co-authored-by: neo <neo.dowithless@gmail.com>
This commit is contained in:
77
docs/zh-CN/skills/agent-harness-construction/SKILL.md
Normal file
77
docs/zh-CN/skills/agent-harness-construction/SKILL.md
Normal file
@@ -0,0 +1,77 @@
|
||||
---
|
||||
name: agent-harness-construction
|
||||
description: 设计和优化AI代理的动作空间、工具定义和观察格式,以提高完成率。
|
||||
origin: ECC
|
||||
---
|
||||
|
||||
# 智能体框架构建
|
||||
|
||||
当你在改进智能体的规划、调用工具、从错误中恢复以及收敛到完成状态的方式时,使用此技能。
|
||||
|
||||
## 核心模型
|
||||
|
||||
智能体输出质量受限于:
|
||||
|
||||
1. 行动空间质量
|
||||
2. 观察质量
|
||||
3. 恢复质量
|
||||
4. 上下文预算质量
|
||||
|
||||
## 行动空间设计
|
||||
|
||||
1. 使用稳定、明确的工具名称。
|
||||
2. 保持输入模式优先且范围狭窄。
|
||||
3. 返回确定性的输出形状。
|
||||
4. 除非无法隔离,否则避免使用全能型工具。
|
||||
|
||||
## 粒度规则
|
||||
|
||||
* 对高风险操作(部署、迁移、权限)使用微工具。
|
||||
* 对常见的编辑/读取/搜索循环使用中等工具。
|
||||
* 仅当往返开销是主要成本时使用宏工具。
|
||||
|
||||
## 观察设计
|
||||
|
||||
每个工具响应都应包括:
|
||||
|
||||
* `status`: success|warning|error
|
||||
* `summary`: 一行结果
|
||||
* `next_actions`: 可执行的后续步骤
|
||||
* `artifacts`: 文件路径 / ID
|
||||
|
||||
## 错误恢复契约
|
||||
|
||||
对于每个错误路径,应包括:
|
||||
|
||||
* 根本原因提示
|
||||
* 安全重试指令
|
||||
* 明确的停止条件
|
||||
|
||||
## 上下文预算管理
|
||||
|
||||
1. 保持系统提示词最少且不变。
|
||||
2. 将大量指导信息移至按需加载的技能中。
|
||||
3. 优先引用文件,而不是内联长文档。
|
||||
4. 在阶段边界处进行压缩,而不是任意的令牌阈值。
|
||||
|
||||
## 架构模式指导
|
||||
|
||||
* ReAct:最适合路径不确定的探索性任务。
|
||||
* 函数调用:最适合结构化的确定性流程。
|
||||
* 混合模式(推荐):ReAct 规划 + 类型化工具执行。
|
||||
|
||||
## 基准测试
|
||||
|
||||
跟踪:
|
||||
|
||||
* 完成率
|
||||
* 每项任务的重试次数
|
||||
* pass@1 和 pass@3
|
||||
* 每个成功任务的成本
|
||||
|
||||
## 反模式
|
||||
|
||||
* 太多语义重叠的工具。
|
||||
* 不透明的工具输出,没有恢复提示。
|
||||
* 仅输出错误而没有后续步骤。
|
||||
* 上下文过载,包含不相关的引用。
|
||||
Reference in New Issue
Block a user