advanced-evaluation

Name: advanced-evaluation
Author: guanyang

✓

Cette compétence doit être utilisée lorsque l'utilisateur demande de « mettre en œuvre LLM-as-juge », « comparer les résultats du modèle », « créer des rubriques d'évaluation », « atténuer les biais d'évaluation » ou mentionne la notation directe, la comparaison par paires, le biais de position, les pipelines d'évaluation ou l'évaluation automatisée de la qualité.

guanyang·advanced·evaluation

17Installations·2Tendance·@guanyang