·eval-harness
</>

eval-harness

mhylle/claude-skills-collection

Marco de evaluación integral para pruebas, mediciones y garantía de calidad sistemáticas de implementaciones asistidas por IA. Admite evaluaciones de capacidad, pruebas de regresión, múltiples tipos de calificadores y métricas estandarizadas.

2Instalaciones·0Tendencia·@mhylle

Instalación

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

SKILL.md

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

Marco de evaluación integral para pruebas, mediciones y garantía de calidad sistemáticas de implementaciones asistidas por IA. Admite evaluaciones de capacidad, pruebas de regresión, múltiples tipos de calificadores y métricas estandarizadas. Fuente: mhylle/claude-skills-collection.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
Categoría
</>Desarrollo
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es eval-harness?

Marco de evaluación integral para pruebas, mediciones y garantía de calidad sistemáticas de implementaciones asistidas por IA. Admite evaluaciones de capacidad, pruebas de regresión, múltiples tipos de calificadores y métricas estandarizadas. Fuente: mhylle/claude-skills-collection.

¿Cómo instalo eval-harness?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/mhylle/claude-skills-collection