advanced-evaluation
✓Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA.
Instalación
SKILL.md
LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.
Direct Scoring: Single LLM rates one response on a defined scale.
Pairwise Comparison: LLM compares two responses and selects better one.
Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA. Fuente: shipshitdev/library.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation- Fuente
- shipshitdev/library
- Categoría
- </>Desarrollo
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es advanced-evaluation?
Domine las técnicas de evaluación de LLM como juez, incluida la puntuación directa, la comparación por pares, la generación de rúbricas y la mitigación de sesgos. Úselo al crear sistemas de evaluación, comparar resultados de modelos o establecer estándares de calidad para contenido generado por IA. Fuente: shipshitdev/library.
¿Cómo instalo advanced-evaluation?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/shipshitdev/library
Detalles
- Categoría
- </>Desarrollo
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01