llm-evaluation
✓Evaluación de resultados de LLM y evaluación de calidad. Úselo al implementar patrones de LLM como juez, puertas de calidad para resultados de IA o canales de evaluación automatizados.
SKILL.md
Evaluate and validate LLM outputs for quality assurance using RAGAS and LLM-as-judge patterns.
| Faithfulness | RAG grounding | ≥ 0.8 | | Answer Relevancy | Q&A systems | ≥ 0.7 | | Context Precision | Retrieval quality | ≥ 0.7 | | Context Recall | Retrieval completeness | ≥ 0.7 |
| Judge model | GPT-4o-mini or Claude Haiku | | Threshold | 0.7 for production, 0.6 for drafts | | Dimensions | 3-5 most relevant to use case | | Sample size | 50+ for reliable metrics |
Evaluación de resultados de LLM y evaluación de calidad. Úselo al implementar patrones de LLM como juez, puertas de calidad para resultados de IA o canales de evaluación automatizados. Fuente: yonatangross/skillforge-claude-plugin.
Datos (listos para citar)
Campos y comandos estables para citas de IA/búsqueda.
- Comando de instalación
npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill llm-evaluation- Categoría
- </>Desarrollo
- Verificado
- ✓
- Primera vez visto
- 2026-02-01
- Actualizado
- 2026-02-18
Respuestas rápidas
¿Qué es llm-evaluation?
Evaluación de resultados de LLM y evaluación de calidad. Úselo al implementar patrones de LLM como juez, puertas de calidad para resultados de IA o canales de evaluación automatizados. Fuente: yonatangross/skillforge-claude-plugin.
¿Cómo instalo llm-evaluation?
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill llm-evaluation Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code o Cursor
¿Dónde está el repositorio de origen?
https://github.com/yonatangross/skillforge-claude-plugin
Detalles
- Categoría
- </>Desarrollo
- Fuente
- skills.sh
- Primera vez visto
- 2026-02-01