Qu'est-ce que advanced-evaluation ?
Cette compétence doit être utilisée lorsque l'utilisateur demande de « mettre en œuvre LLM-as-juge », « comparer les résultats du modèle », « créer des rubriques d'évaluation », « atténuer les biais d'évaluation » ou mentionne la notation directe, la comparaison par paires, le biais de position, les pipelines d'évaluation ou l'évaluation automatisée de la qualité. Source : chakshugautam/games.