¿Cómo instalo llm-as-a-judge?

Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/maragudk/evals-skills --skill llm-as-a-judge Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw

·llm-as-a-judge

</>

llm-as-a-judge

Name: llm-as-a-judge
Author: maragudk

✓

maragudk/evals-skills

Cree, valide e implemente evaluadores de LLM como juez para una evaluación de calidad automatizada de los resultados del proceso de LLM. Utilice esta habilidad siempre que el usuario quiera: crear un evaluador automatizado para modos de falla subjetivos o matizados, escribir un mensaje de juez para la evaluación de Aprobado/Reprobado, dividir datos etiquetados para el desarrollo de jueces, medir la alineación de los jueces (TPR/TNR), estimar tasas de éxito reales con corrección de sesgos o configurar canales de evaluación de CI. También se activa cuando el usuario menciona "solicitud de evaluación", "evaluación automatizada", "evaluador LLM", "solicitud de calificación", "métricas de alineación", "tasa de verdaderos positivos" o desea pasar de la revisión de seguimiento manual a la evaluación automatizada. Esta habilidad cubre el ciclo de vida completo: diseño rápido → división de datos → refinamiento iterativo → estimación de la tasa de éxito.

maragudk·llm·as·judge

8Instalaciones·0Tendencia·@maragudk