·eval

EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados.

7Instalaciones·0Tendencia·@mikeyobrien

Instalación

$npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval

SKILL.md

EvalKit is a conversational evaluation framework for AI agents that guides you through creating robust evaluations using the Strands Evals SDK. Through natural conversation, you can plan evaluations, generate test data, execute evaluations, and analyze results.

EvalKit understands the evaluation workflow and guides users through four phases: Plan, Data, Eval, and Report.

User Intent: Analyze results and get recommendations Example Requests:

EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados. Fuente: mikeyobrien/ralph-orchestrator.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval
Categoría
{}Análisis de Datos
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es eval?

EvalKit es un marco de evaluación conversacional para agentes de IA que lo guía en la creación de evaluaciones sólidas utilizando el SDK de Strands Evals. A través de una conversación natural, puede planificar evaluaciones, generar datos de prueba, ejecutar evaluaciones y analizar resultados. Fuente: mikeyobrien/ralph-orchestrator.

¿Cómo instalo eval?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/mikeyobrien/ralph-orchestrator --skill eval Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/mikeyobrien/ralph-orchestrator