mirror of
https://github.com/affaan-m/everything-claude-code.git
synced 2026-05-18 14:53:05 +08:00
Add files present in zh-CN but missing from ja-JP: - commands: claw, context-budget, devfleet, docs, projects, prompt-optimize, rules-distill (7 files) - skills: regex-vs-llm-structured-text, remotion-video-creation, repo-scan, research-ops, returns-reverse-logistics, rules-distill, rust-patterns, rust-testing, skill-comply, skill-stocktake, social-graph-ranker, swift-actor-persistence, swift-concurrency-6-2, swift-protocol-di-testing, swiftui-patterns, team-builder, terminal-ops, token-budget-advisor, ui-demo, unified-notifications-ops, video-editing, videodb (+reference/*), visa-doc-translate, workspace-surface-audit, x-api (37 files) Result: ja-JP now has 517 files vs zh-CN 412 files. zh-CN parity: 0 missing files (complete parity achieved).
7.3 KiB
7.3 KiB
name: token-budget-advisor
description: 回答する前に、どれだけの回答深度を消費するかについてユーザーに情報に基づいた選択を提供する。ユーザーが回答の長さ、深さ、またはトークンバジェットを明示的に制御したい場合にこのスキルを使用する。トリガー条件:"token budget", "token count", "token usage", "token limit", "response length", "answer depth", "short version", "brief answer", "detailed answer", "exhaustive answer", "respuesta corta vs larga", "cuántos tokens", "ahorrar tokens", "responde al 50%", "dame la versión corta", "quiero controlar cuánto usas"、またはユーザーが回答のサイズや深さの制御を明示的に求めるその他の明確なバリエーション。トリガーしない条件:ユーザーが現在のセッションでレベルを指定済み(そのレベルを維持)、リクエストが明らかに一言の回答、または「token」が認証/セッション/支払いトークンを指している。origin: community
トークンバジェットアドバイザー(TBA)
Claudeが回答する前にレスポンスフローをインターセプトし、ユーザーが回答の深さを選択できるようにする。
使用場面
- ユーザーが回答の長さや詳細度を制御したい場合
- ユーザーがトークン、バジェット、深さ、または回答の長さに言及する場合
- ユーザーが「短いバージョン」「TL;DR」「簡潔に」「25%」「詳細に」などと言う場合
- ユーザーが事前に深さ/詳細度を選択したい場合
トリガーしない場合:ユーザーが本セッションですでにレベルを設定している(静かに維持)、または回答が本質的に一行。
動作原理
ステップ 1 — 入力トークンを推定する
リポジトリの標準コンテキストバジェットのヒューリスティックスを使用して、プロンプトのトークン数を頭の中で推定する。
context-budget と同じキャリブレーションガイドラインを使用する:
- 散文:
words × 1.3 - コード集約またはコード混在/コードブロック:
chars / 4
混在コンテンツの場合、支配的なコンテンツタイプを使用し、推定ヒューリスティックスを保持する。
ステップ 2 — 複雑度に応じてレスポンスサイズを推定する
プロンプトを分類し、乗数範囲を適用して完全なレスポンスウィンドウを得る:
| 複雑度 | 乗数範囲 | プロンプト例 |
|---|---|---|
| シンプル | 3× – 8× | 「Xとは何ですか?」、はい/いいえの質問、単一の事実 |
| 中程度 | 8× – 20× | 「Xはどのように機能しますか?」 |
| 中〜高 | 10× – 25× | コンテキスト付きのコードリクエスト |
| 複雑 | 15× – 40× | マルチパート分析、比較、アーキテクチャ |
| クリエイティブ | 10× – 30× | ストーリー、散文、ナラティブライティング |
レスポンスウィンドウ = input_tokens × mult_min から input_tokens × mult_max(ただしモデルの設定済み出力トークン制限を超えない)。
ステップ 3 — 深さのオプションを提示する
回答する前に、実際に推定した数値を使用してこのブロックを提示する:
プロンプトを分析中...
入力:~[N] トークン | タイプ:[タイプ] | 複雑度:[レベル] | 言語:[言語]
深さレベルを選択してください:
[1] ベーシック (25%) -> ~[トークン数] 直接回答、前置きなし
[2] 適度 (50%) -> ~[トークン数] 回答 + 背景 + 1つの例
[3] 詳細 (75%) -> ~[トークン数] 代替案を含む完全な回答
[4] 徹底的 (100%) -> ~[トークン数] すべて、制限なし
どのレベルを選択しますか?(1-4 または「25%の深さ」「50%の深さ」「75%の深さ」「100%の深さ」)
精度:ヒューリスティック推定、約85〜90%の精度(±15%)。
各レベルのトークン推定(レスポンスウィンドウ内):
- 25% →
min + (max - min) × 0.25 - 50% →
min + (max - min) × 0.50 - 75% →
min + (max - min) × 0.75 - 100% →
max
ステップ 4 — 選択されたレベルで回答する
| レベル | 目標の長さ | 含む内容 | 省略する内容 |
|---|---|---|---|
| 25% コア | 最大2〜4文 | 直接回答、重要な結論 | コンテキスト、例、ニュアンス、代替案 |
| 50% 適度 | 1〜3段落 | 回答 + 必要なコンテキスト + 1つの例 | 深い分析、エッジケース、参考文献 |
| 75% 詳細 | 構造化された回答 | 複数の例、長所/短所、代替案 | 極端なエッジケース、網羅的な参考文献 |
| 100% 徹底的 | 制限なし | すべて——完全な分析、すべてのコード、すべての視点 | なし |
ショートカット——質問をスキップ
ユーザーがすでにレベルを示している場合、質問せずにそのレベルで即座に回答する:
| ユーザーの発言 | レベル |
|---|---|
| 「1」/「25%の深さ」/「短いバージョン」/「簡潔に」/「TL;DR」 | 25% |
| 「2」/「50%の深さ」/「適度の深さ」/「バランスの取れた回答」 | 50% |
| 「3」/「75%の深さ」/「詳細な回答」/「包括的な回答」 | 75% |
| 「4」/「100%の深さ」/「徹底的な回答」/「完全で詳細な分析」 | 100% |
ユーザーが本セッションですでにレベルを設定している場合、ユーザーが変更しない限り後続の回答も静かにそのレベルを維持する。
精度について
このスキルはヒューリスティック推定を使用する——実際のトークナイザーではない。精度は約85〜90%で偏差は±15%。常に免責事項を表示する。
例
トリガーシナリオ
- 「まず短いバージョンをください。」
- 「あなたの回答は何トークン使いますか?」
- 「50%の深さで回答してください。」
- 「徹底的な回答が欲しい、サマリーはいらない。」
- 「まず短いバージョン、次に詳細なバージョンをください。」
トリガーしないシナリオ
- 「JWTトークンとは何ですか?」
- 「チェックアウトフローは支払いトークンを使用しています。」
- 「これは正常ですか?」
- 「リファクタリングを完了してください。」
- ユーザーが本セッションの深さを選択した後の後続の質問
出典
TBA — Claude CodeのToken Budget Advisorから引用した独立スキル。 元のプロジェクトにはPython推定スクリプトも付属しているが、本リポジトリではスキルを自己完結型に保ち、ヒューリスティックスのみを使用する。