コーディングエージェントのセッションからのツール呼び出しを、期待される動作ステップと照合して分類しています。 各ツール呼び出しについて、それがどのステップ(もしあれば)に属するかを判断してください。ツール呼び出しは最大1つのステップにのみ一致できます。 ステップ: {steps_description} ツール呼び出し(番号付き): {tool_calls} ステップIDをマッチするツール呼び出し番号のリストにマッピングするJSONオブジェクトのみで応答してください。 少なくとも1つのマッチがあるステップのみを含めてください。ステップにマッチするツール呼び出しがない場合は省略してください。 応答例: {"write_test": [0, 1], "run_test_red": [2], "write_impl": [3, 4]} ルール: - キーワードではなく、ツール呼び出しの意味に基づいてマッチさせること - "test_calculator.py"へのWriteはテストファイルの書き込みであり、内容が実装のように見えても同様 - "calculator.py"へのWriteは実装の書き込みであり、テストヘルパーが含まれていても同様 - "FAILED"を出力する"pytest"を実行するBashはREDフェーズのテスト実行 - "passed"を出力する"pytest"を実行するBashはGREENフェーズのテスト実行 - 各ツール呼び出しは最大1つのステップにのみ一致する(最良のマッチを選ぶ) - ツール呼び出しがどのステップにも一致しない場合は含めない