mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-04-05 16:53:29 +08:00
* docs(zh-CN): sync Chinese docs with latest upstream changes * docs(zh-CN): update link --------- Co-authored-by: neo <neo.dowithless@gmail.com>
67 lines
1.6 KiB
Markdown
67 lines
1.6 KiB
Markdown
---
|
||
name: agentic-engineering
|
||
description: 作为代理工程师,采用评估优先执行、分解和成本感知模型路由进行操作。
|
||
origin: ECC
|
||
---
|
||
|
||
# 智能体工程
|
||
|
||
在 AI 智能体执行大部分实施工作、而人类负责质量与风险控制的工程工作流中使用此技能。
|
||
|
||
## 操作原则
|
||
|
||
1. 在执行前定义完成标准。
|
||
2. 将工作分解为智能体可处理的单元。
|
||
3. 根据任务复杂度路由模型层级。
|
||
4. 使用评估和回归检查进行度量。
|
||
|
||
## 评估优先循环
|
||
|
||
1. 定义能力评估和回归评估。
|
||
2. 运行基线并捕获失败特征。
|
||
3. 执行实施。
|
||
4. 重新运行评估并比较差异。
|
||
|
||
## 任务分解
|
||
|
||
应用 15 分钟单元规则:
|
||
|
||
* 每个单元应可独立验证
|
||
* 每个单元应有一个主要风险
|
||
* 每个单元应暴露一个清晰的完成条件
|
||
|
||
## 模型路由
|
||
|
||
* Haiku:分类、样板转换、狭窄编辑
|
||
* Sonnet:实施和重构
|
||
* Opus:架构、根因分析、多文件不变量
|
||
|
||
## 会话策略
|
||
|
||
* 对于紧密耦合的单元,继续使用同一会话。
|
||
* 在主要阶段转换后,启动新的会话。
|
||
* 在里程碑完成后进行压缩,而不是在主动调试期间。
|
||
|
||
## AI 生成代码的审查重点
|
||
|
||
优先审查:
|
||
|
||
* 不变量和边界情况
|
||
* 错误边界
|
||
* 安全性和身份验证假设
|
||
* 隐藏的耦合和上线风险
|
||
|
||
当自动化格式化/代码检查工具已强制执行代码风格时,不要在仅涉及风格分歧的审查上浪费周期。
|
||
|
||
## 成本纪律
|
||
|
||
按任务跟踪:
|
||
|
||
* 模型
|
||
* 令牌估算
|
||
* 重试次数
|
||
* 实际用时
|
||
* 成功/失败
|
||
|
||
仅当较低层级的模型失败且存在清晰的推理差距时,才升级模型层级。
|