·advanced-evaluation
</>

advanced-evaluation

shipshitdev/library

Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA.

38Instalaciones·1Tendencia·@shipshitdev

Instalación

$npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation

SKILL.md

LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.

Direct Scoring: Single LLM rates one response on a defined scale.

Pairwise Comparison: LLM compares two responses and selects better one.

Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA. Fuente: shipshitdev/library.

Ver original

Datos (listos para citar)

Campos y comandos estables para citas de IA/búsqueda.

Comando de instalación
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation
Categoría
</>Desarrollo
Verificado
Primera vez visto
2026-02-01
Actualizado
2026-02-18

Respuestas rápidas

¿Qué es advanced-evaluation?

Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA. Fuente: shipshitdev/library.

¿Cómo instalo advanced-evaluation?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor

¿Dónde está el repositorio de origen?

https://github.com/shipshitdev/library