Che cos'è advanced-evaluation?
Questa competenza dovrebbe essere utilizzata quando l'utente chiede di "implementare il LLM come giudice", "confrontare i risultati del modello", "creare rubriche di valutazione", "mitigare i bias di valutazione" o menziona il punteggio diretto, il confronto a coppie, il bias di posizione, le pipeline di valutazione o la valutazione automatizzata della qualità. Fonte: muratcankoylan/agent-skills-for-context-engineering.