·ai-evals
{}

ai-evals

Cree un paquete de evaluaciones de IA (evaluación PRD, conjunto de pruebas, rúbrica, plan de jueces, resultados + bucle de iteración). Úselo para evaluación de LLM, puntos de referencia, rúbricas, análisis de errores/codificación abierta y puertas de calidad de envío/no envío para funciones de IA.

23Instalaciones·0Tendencia·@oldwinter

Instalación

$npx skills add https://github.com/oldwinter/skills --skill ai-evals

Cómo instalar ai-evals

Instala rápidamente el skill de IA ai-evals en tu entorno de desarrollo mediante línea de comandos

  1. Abrir Terminal: Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.)
  2. Ejecutar comando de instalación: Copia y ejecuta este comando: npx skills add https://github.com/oldwinter/skills --skill ai-evals
  3. Verificar instalación: Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

Fuente: oldwinter/skills.

SKILL.md

Ver original

Produce an AI Evals Pack (in chat; or as files if requested), in this order:

1) Eval PRD (evaluation requirements): decision, scope, target behaviors, success metrics, acceptance thresholds 2) Test set spec + initial golden set: schema, coverage plan, and a starter set of cases (tagged by scenario/risk) 3) Error taxonomy (from error analysis + open coding): failure modes, severity, examples

4) Rubric + judging guide: dimensions, scoring scale, definitions, examples, tie-breakers 5) Judge + harness plan: human vs LLM-as-judge vs automated checks, prompts/instructions, calibration, runbook, cost/time estimate 6) Reporting + iteration loop: baseline results format, regression policy, how new bugs become new tests

Cree un paquete de evaluaciones de IA (evaluación PRD, conjunto de pruebas, rúbrica, plan de jueces, resultados + bucle de iteración). Úselo para evaluación de LLM, puntos de referencia, rúbricas, análisis de errores/codificación abierta y puertas de calidad de envío/no envío para funciones de IA. Fuente: oldwinter/skills.

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/oldwinter/skills --skill ai-evals
Categoría
{}Análisis de Datos
Verificado
Primera vez visto
2026-02-26
Actualizado
2026-03-11

Browse more skills from oldwinter/skills

Respuestas rápidas

¿Qué es ai-evals?

Cree un paquete de evaluaciones de IA (evaluación PRD, conjunto de pruebas, rúbrica, plan de jueces, resultados + bucle de iteración). Úselo para evaluación de LLM, puntos de referencia, rúbricas, análisis de errores/codificación abierta y puertas de calidad de envío/no envío para funciones de IA. Fuente: oldwinter/skills.

¿Cómo instalo ai-evals?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/oldwinter/skills --skill ai-evals Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

¿Dónde está el repositorio de origen?

https://github.com/oldwinter/skills