Files
everything-claude-code/docs/zh-CN/the-longform-guide.md

359 lines
15 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 关于 Claude Code 的完整长篇指南
![Header: The Longform Guide to Everything Claude Code](../../assets/images/longform/01-header.png)
***
> **前提**:本指南建立在 [关于 Claude Code 的简明指南](the-shortform-guide.md) 之上。如果你还没有设置技能、钩子、子代理、MCP 和插件,请先阅读该指南。
![Reference to Shorthand Guide](../../assets/images/longform/02-shortform-reference.png)
*速记指南 - 请先阅读此指南*
在简明指南中我介绍了基础设置技能和命令、钩子、子代理、MCP、插件以及构成有效 Claude Code 工作流骨干的配置模式。那是设置指南和基础架构。
这篇长篇指南深入探讨了区分高效会话与浪费会话的技巧。如果你还没有阅读简明指南,请先返回并设置好你的配置。以下内容假定你已经配置好技能、代理、钩子和 MCP并且它们正在工作。
这里的主题是:令牌经济、记忆持久性、验证模式、并行化策略,以及构建可重用工作流的复合效应。这些是我在超过 10 个月的日常使用中提炼出的模式,它们决定了你是在第一个小时内就饱受上下文腐化之苦,还是能够保持数小时的高效会话。
简明指南和长篇指南中涵盖的所有内容都可以在 GitHub 上找到:`github.com/affaan-m/everything-claude-code`
***
## 技巧与窍门
### 有些 MCP 是可替换的,可以释放你的上下文窗口
对于诸如版本控制GitHub、数据库Supabase、部署Vercel、Railway等 MCP 来说——这些平台大多已经拥有健壮的 CLIMCP 本质上只是对其进行包装。MCP 是一个很好的包装器,但它是有代价的。
要让 CLI 功能更像 MCP而不实际使用 MCP以及随之而来的减少的上下文窗口可以考虑将功能打包成技能和命令。提取出 MCP 暴露的、使事情变得容易的工具,并将它们转化为命令。
示例:与其始终加载 GitHub MCP不如创建一个包装了 `gh pr create` 并带有你偏好选项的 `/gh-pr` 命令。与其让 Supabase MCP 消耗上下文,不如创建直接使用 Supabase CLI 的技能。
有了延迟加载上下文窗口问题基本解决了。但令牌使用和成本问题并未以同样的方式解决。CLI + 技能的方法仍然是一种令牌优化方法。
***
## 重要事项
### 上下文与记忆管理
要在会话间共享记忆,最好的方法是使用一个技能或命令来总结和检查进度,然后保存到 `.claude` 文件夹中的一个 `.tmp` 文件中,并在会话结束前不断追加内容。第二天,它可以将其用作上下文,并从中断处继续。为每个会话创建一个新文件,这样你就不会将旧的上下文污染到新的工作中。
![Session Storage File Tree](../../assets/images/longform/03-session-storage.png)
*会话存储示例 -> https://github.com/affaan-m/everything-claude-code/tree/main/examples/sessions*
Claude 创建一个总结当前状态的文件。审阅它,如果需要则要求编辑,然后重新开始。对于新的对话,只需提供文件路径。当你达到上下文限制并需要继续复杂工作时,这尤其有用。这些文件应包含:
* 哪些方法有效(有证据可验证)
* 哪些方法尝试过但无效
* 哪些方法尚未尝试,以及剩下什么需要做
**策略性地清除上下文:**
一旦你制定了计划并清除了上下文Claude Code 中计划模式的默认选项),你就可以根据计划工作。当你积累了大量与执行不再相关的探索性上下文时,这很有用。对于策略性压缩,请禁用自动压缩。在逻辑间隔手动压缩,或创建一个为你执行此操作的技能。
**高级:动态系统提示注入**
我学到的一个模式是:与其将所有内容都放在 CLAUDE.md用户作用域`.claude/rules/`(项目作用域)中,让它们每次会话都加载,不如使用 CLI 标志动态注入上下文。
```bash
claude --system-prompt "$(cat memory.md)"
```
这让你可以更精确地控制何时加载哪些上下文。系统提示内容比用户消息具有更高的权威性,而用户消息又比工具结果具有更高的权威性。
**实际设置:**
```bash
# Daily development
alias claude-dev='claude --system-prompt "$(cat ~/.claude/contexts/dev.md)"'
# PR review mode
alias claude-review='claude --system-prompt "$(cat ~/.claude/contexts/review.md)"'
# Research/exploration mode
alias claude-research='claude --system-prompt "$(cat ~/.claude/contexts/research.md)"'
```
**高级:记忆持久化钩子**
有一些大多数人不知道的钩子,有助于记忆管理:
* **PreCompact 钩子**:在上下文压缩发生之前,将重要状态保存到文件
* **Stop 钩子(会话结束)**:在会话结束时,将学习成果持久化到文件
* **SessionStart 钩子**:在新会话开始时,自动加载之前的上下文
我已经构建了这些钩子,它们位于仓库的 `github.com/affaan-m/everything-claude-code/tree/main/hooks/memory-persistence`
***
### 持续学习 / 记忆
如果你不得不多次重复一个提示,并且 Claude 遇到了同样的问题或给出了你以前听过的回答——这些模式必须被附加到技能中。
**问题:** 浪费令牌,浪费上下文,浪费时间。
**解决方案:** 当 Claude Code 发现一些不平凡的事情时——调试技巧、变通方法、某些项目特定的模式——它会将该知识保存为一个新技能。下次出现类似问题时,该技能会自动加载。
我构建了一个实现此功能的持续学习技能:`github.com/affaan-m/everything-claude-code/tree/main/skills/continuous-learning`
**为什么用 Stop 钩子(而不是 UserPromptSubmit**
关键的设计决策是使用 **Stop 钩子** 而不是 UserPromptSubmit。UserPromptSubmit 在每个消息上运行——给每个提示增加延迟。Stop 在会话结束时只运行一次——轻量级,不会在会话期间拖慢你的速度。
***
### 令牌优化
**主要策略:子代理架构**
优化你使用的工具和子代理架构,旨在将任务委托给最便宜且足以胜任的模型。
**模型选择快速参考:**
![Model Selection Table](../../assets/images/longform/04-model-selection.png)
*针对各种常见任务的子代理假设设置及选择背后的推理*
| 任务类型 | 模型 | 原因 |
| ------------------------- | ------ | ------------------------------------------ |
| 探索/搜索 | Haiku | 快速、便宜,足以用于查找文件 |
| 简单编辑 | Haiku | 单文件更改,指令清晰 |
| 多文件实现 | Sonnet | 编码的最佳平衡 |
| 复杂架构 | Opus | 需要深度推理 |
| PR 审查 | Sonnet | 理解上下文,捕捉细微差别 |
| 安全分析 | Opus | 不能错过漏洞 |
| 编写文档 | Haiku | 结构简单 |
| 调试复杂错误 | Opus | 需要将整个系统记在脑中 |
对于 90% 的编码任务,默认使用 Sonnet。当第一次尝试失败、任务涉及 5 个以上文件、架构决策或安全关键代码时,升级到 Opus。
**定价参考:**
![Claude Model Pricing](../../assets/images/longform/05-pricing-table.png)
*来源https://platform.claude.com/docs/en/about-claude/pricing*
**工具特定优化:**
用 mgrep 替换 grep——与传统 grep 或 ripgrep 相比,平均减少约 50% 的令牌:
![mgrep Benchmark](../../assets/images/longform/06-mgrep-benchmark.png)
*在我们的 50 项任务基准测试中mgrep + Claude Code 使用的 token 数量比基于 grep 的工作流少约 2 倍且判断质量相似或更好。来源mgrep by @mixedbread-ai*
**模块化代码库的好处:**
拥有一个更模块化的代码库,主文件只有数百行而不是数千行,这有助于降低令牌优化成本,并确保任务在第一次尝试时就正确完成。
***
### 验证循环与评估
**基准测试工作流:**
比较在有和没有技能的情况下询问同一件事,并检查输出差异:
分叉对话,在其中之一的对话中初始化一个新的工作树但不使用该技能,最后拉取差异,查看记录了什么。
**评估模式类型:**
* **基于检查点的评估**:设置明确的检查点,根据定义的标准进行验证,在继续之前修复
* **持续评估**:每 N 分钟或在重大更改后运行,完整的测试套件 + 代码检查
**关键指标:**
```
pass@k: At least ONE of k attempts succeeds
k=1: 70% k=3: 91% k=5: 97%
pass^k: ALL k attempts must succeed
k=1: 70% k=3: 34% k=5: 17%
```
当你只需要它能工作时,使用 **pass@k**。当一致性至关重要时,使用 **pass^k**
***
## 并行化
在多 Claude 终端设置中分叉对话时,请确保分叉中的操作和原始对话的范围定义明确。在代码更改方面,力求最小化重叠。
**我偏好的模式:**
主聊天用于代码更改,分叉用于询问有关代码库及其当前状态的问题,或研究外部服务。
**关于任意终端数量:**
![Boris on Parallel Terminals](../../assets/images/longform/07-boris-parallel.png)
*Boris (Anthropic) 关于运行多个 Claude 实例的说明*
Boris 有关于并行化的建议。他曾建议在本地运行 5 个 Claude 实例,在上游运行 5 个。我建议不要设置任意的终端数量。增加终端应该是出于真正的必要性。
你的目标应该是:**用最小可行的并行化程度,你能完成多少工作。**
**用于并行实例的 Git Worktrees**
```bash
# Create worktrees for parallel work
git worktree add ../project-feature-a feature-a
git worktree add ../project-feature-b feature-b
git worktree add ../project-refactor refactor-branch
# Each worktree gets its own Claude instance
cd ../project-feature-a && claude
```
**如果** 你要开始扩展实例数量 **并且** 你有多个 Claude 实例在处理相互重叠的代码,那么你必须使用 git worktrees并为每个实例制定非常明确的计划。使用 `/rename <name here>` 来命名你所有的聊天。
![Two Terminal Setup](../../assets/images/longform/08-two-terminals.png)
*初始设置:左侧终端用于编码,右侧终端用于提问 - 使用 /rename 和 /fork 命令*
**级联方法:**
当运行多个 Claude Code 实例时,使用“级联”模式进行组织:
* 在右侧的新标签页中打开新任务
* 从左到右、从旧到新进行扫描
* 一次最多专注于 3-4 个任务
***
## 基础工作
**双实例启动模式:**
对于我自己的工作流管理,我喜欢从一个空仓库开始,打开 2 个 Claude 实例。
**实例 1脚手架代理**
* 搭建脚手架和基础工作
* 创建项目结构
* 设置配置CLAUDE.md、规则、代理
**实例 2深度研究代理**
* 连接到你的所有服务,进行网络搜索
* 创建详细的 PRD
* 创建架构 Mermaid 图
* 编译包含实际文档片段的参考资料
**llms.txt 模式:**
如果可用,你可以通过在你到达它们的文档页面后执行 `/llms.txt` 来在许多文档参考资料上找到一个 `llms.txt`。这会给你一个干净的、针对 LLM 优化的文档版本。
**理念:构建可重用的模式**
来自 @omarsar0"早期,我花时间构建可重用的工作流/模式。构建过程很繁琐,但随着模型和代理框架的改进,这产生了惊人的复合效应。"
**应该投资于:**
* 子代理
* 技能
* 命令
* 规划模式
* MCP 工具
* 上下文工程模式
***
## 代理与子代理的最佳实践
**子代理上下文问题:**
子代理的存在是为了通过返回摘要而不是转储所有内容来节省上下文。但编排器拥有子代理所缺乏的语义上下文。子代理只知道字面查询,不知道请求背后的 **目的**
**迭代检索模式:**
1. 编排器评估每个子代理的返回
2. 在接受之前询问后续问题
3. 子代理返回源,获取答案,返回
4. 循环直到足够(最多 3 个周期)
**关键:** 传递目标上下文,而不仅仅是查询。
**具有顺序阶段的编排器:**
```markdown
第一阶段:研究(使用探索智能体)→ research-summary.md
第二阶段:规划(使用规划智能体)→ plan.md
第三阶段:实施(使用测试驱动开发指南智能体)→ 代码变更
第四阶段:审查(使用代码审查智能体)→ review-comments.md
第五阶段:验证(如需则使用构建错误解决器)→ 完成或循环返回
```
**关键规则:**
1. 每个智能体获得一个清晰的输入并产生一个清晰的输出
2. 输出成为下一阶段的输入
3. 永远不要跳过阶段
4. 在智能体之间使用 `/clear`
5. 将中间输出存储在文件中
***
## 有趣的东西 / 非关键,仅供娱乐的小贴士
### 自定义状态栏
你可以使用 `/statusline` 来设置它 - 然后 Claude 会说你没有状态栏,但可以为你设置,并询问你想要在里面放什么。
另请参阅ccstatusline用于自定义 Claude Code 状态行的社区项目)
### 语音转录
用你的声音与 Claude Code 对话。对很多人来说比打字更快。
* Mac 上的 superwhisper、MacWhisper
* 即使转录有误Claude 也能理解意图
### 终端别名
```bash
alias c='claude'
alias gb='github'
alias co='code'
alias q='cd ~/Desktop/projects'
```
***
## 里程碑
![25k+ GitHub Stars](../../assets/images/longform/09-25k-stars.png)
*一周内获得 25,000+ GitHub stars*
***
## 资源
**智能体编排:**
* claude-flow — 社区构建的企业级编排平台,包含 54+ 个专业代理
**自我改进记忆:**
* 请参阅本仓库中的 `skills/continuous-learning/`
* rlancemartin.github.io/2025/12/01/claude\_diary/ - 会话反思模式
**系统提示词参考:**
* system-prompts-and-models-of-ai-tools — 社区收集的 AI 系统提示110k+ 星标)
**官方:**
* Anthropic Academy: anthropic.skilljar.com
***
## 参考资料
* [Anthropic: 解密 AI 智能体的评估](https://www.anthropic.com/engineering/demystifying-evals-for-ai-agents)
* [YK: 32 个 Claude Code 技巧](https://agenticcoding.substack.com/p/32-claude-code-tips-from-basics-to)
* [RLanceMartin: 会话反思模式](https://rlancemartin.github.io/2025/12/01/claude_diary/)
* @PerceptualPeak: 子智能体上下文协商
* @menhguin: 智能体抽象层分级
* @omarsar0: 复合效应哲学
***
*两份指南中涵盖的所有内容都可以在 GitHub 上的 [everything-claude-code](https://github.com/affaan-m/everything-claude-code) 找到*