¿Qué es advanced-evaluation?
Esta habilidad debe usarse cuando el usuario solicita "implementar LLM como juez", "comparar los resultados del modelo", "crear rúbricas de evaluación", "mitigar el sesgo de evaluación" o menciona calificación directa, comparación por pares, sesgo de posición, canales de evaluación o evaluación de calidad automatizada. Fuente: chakshugautam/games.