Files
everything-claude-code/docs/es/commands/eval.md
Santiago González Siordia ac0f11c640 docs: add Spanish (es) translation (#2095)
Adds a complete Spanish translation of the ECC documentation under
docs/es/, mirroring the Turkish (docs/tr/) translation in scope.
141 files covering agents, commands, rules, skills, contexts, examples,
and core docs. Updates root README.md with the Spanish language link.

Co-authored-by: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-06-07 13:26:42 +08:00

121 lines
2.4 KiB
Markdown

# Comando Eval
Gestionar el flujo de trabajo de desarrollo orientado a evals.
## Uso
`/eval [define|check|report|list] [nombre-feature]`
## Definir Eval
`/eval define nombre-feature`
Crear una nueva definición de eval:
1. Crear `.claude/evals/nombre-feature.md` con la plantilla:
```markdown
## EVAL: nombre-feature
Created: $(date)
### Capability Evals
- [ ] [Descripción de Capability 1]
- [ ] [Descripción de Capability 2]
### Regression Evals
- [ ] [El comportamiento existente 1 sigue funcionando]
- [ ] [El comportamiento existente 2 sigue funcionando]
### Success Criteria
- pass@3 > 90% para capability evals
- pass^3 = 100% para regression evals
```
2. Pedir al usuario que complete los criterios específicos
## Verificar Eval
`/eval check nombre-feature`
Ejecutar los evals para una feature:
1. Leer la definición de eval desde `.claude/evals/nombre-feature.md`
2. Para cada capability eval:
- Intentar verificar el criterio
- Registrar PASS/FAIL
- Guardar el intento en `.claude/evals/nombre-feature.log`
3. Para cada regression eval:
- Ejecutar las pruebas relevantes
- Comparar con la línea base
- Registrar PASS/FAIL
4. Reportar el estado actual:
```
EVAL CHECK: nombre-feature
========================
Capability: X/Y pasando
Regression: X/Y pasando
Estado: EN PROGRESO / LISTO
```
## Reporte de Eval
`/eval report nombre-feature`
Generar reporte exhaustivo de eval:
```
EVAL REPORT: nombre-feature
=========================
Generated: $(date)
CAPABILITY EVALS
----------------
[eval-1]: PASS (pass@1)
[eval-2]: PASS (pass@2) - requirió reintento
[eval-3]: FAIL - ver notas
REGRESSION EVALS
----------------
[test-1]: PASS
[test-2]: PASS
[test-3]: PASS
METRICS
-------
Capability pass@1: 67%
Capability pass@3: 100%
Regression pass^3: 100%
NOTES
-----
[Cualquier problema, caso límite u observación]
RECOMMENDATION
--------------
[SHIP / NEEDS WORK / BLOCKED]
```
## Listar Evals
`/eval list`
Mostrar todas las definiciones de eval:
```
EVAL DEFINITIONS
================
feature-auth [3/5 pasando] EN PROGRESO
feature-search [5/5 pasando] LISTO
feature-export [0/4 pasando] NO INICIADO
```
## Argumentos
$ARGUMENTS:
- `define <nombre>` - Crear nueva definición de eval
- `check <nombre>` - Ejecutar y verificar evals
- `report <nombre>` - Generar reporte completo
- `list` - Mostrar todos los evals
- `clean` - Eliminar logs de evals antiguos (mantiene las últimas 10 ejecuciones)