mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-06-13 19:51:24 +08:00
abcf38b085
* docs(zh-CN): sync Chinese docs with latest upstream changes * docs(zh-CN): update link --------- Co-authored-by: neo <neo.dowithless@gmail.com>
67 lines
1.6 KiB
Markdown
67 lines
1.6 KiB
Markdown
---
|
|
name: agentic-engineering
|
|
description: 作为代理工程师,采用评估优先执行、分解和成本感知模型路由进行操作。
|
|
origin: ECC
|
|
---
|
|
|
|
# 智能体工程
|
|
|
|
在 AI 智能体执行大部分实施工作、而人类负责质量与风险控制的工程工作流中使用此技能。
|
|
|
|
## 操作原则
|
|
|
|
1. 在执行前定义完成标准。
|
|
2. 将工作分解为智能体可处理的单元。
|
|
3. 根据任务复杂度路由模型层级。
|
|
4. 使用评估和回归检查进行度量。
|
|
|
|
## 评估优先循环
|
|
|
|
1. 定义能力评估和回归评估。
|
|
2. 运行基线并捕获失败特征。
|
|
3. 执行实施。
|
|
4. 重新运行评估并比较差异。
|
|
|
|
## 任务分解
|
|
|
|
应用 15 分钟单元规则:
|
|
|
|
* 每个单元应可独立验证
|
|
* 每个单元应有一个主要风险
|
|
* 每个单元应暴露一个清晰的完成条件
|
|
|
|
## 模型路由
|
|
|
|
* Haiku:分类、样板转换、狭窄编辑
|
|
* Sonnet:实施和重构
|
|
* Opus:架构、根因分析、多文件不变量
|
|
|
|
## 会话策略
|
|
|
|
* 对于紧密耦合的单元,继续使用同一会话。
|
|
* 在主要阶段转换后,启动新的会话。
|
|
* 在里程碑完成后进行压缩,而不是在主动调试期间。
|
|
|
|
## AI 生成代码的审查重点
|
|
|
|
优先审查:
|
|
|
|
* 不变量和边界情况
|
|
* 错误边界
|
|
* 安全性和身份验证假设
|
|
* 隐藏的耦合和上线风险
|
|
|
|
当自动化格式化/代码检查工具已强制执行代码风格时,不要在仅涉及风格分歧的审查上浪费周期。
|
|
|
|
## 成本纪律
|
|
|
|
按任务跟踪:
|
|
|
|
* 模型
|
|
* 令牌估算
|
|
* 重试次数
|
|
* 实际用时
|
|
* 成功/失败
|
|
|
|
仅当较低层级的模型失败且存在清晰的推理差距时,才升级模型层级。
|