EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados.
Instalación
SKILL.md
EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.
EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.
User Intent: Analyze results and get recommendations Example Requests:
EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados. Fuente: mikeyobrien/ralph-orchestrator.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval- Categoría
- {}Análisis de Datos
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es eval?
EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados. Fuente: mikeyobrien/ralph-orchestrator.
¿Cómo instalo eval?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/mikeyobrien/ralph-orchestrator
Detalles
- Categoría
- {}Análisis de Datos
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01