Che cos'è judge?
Valutare gli output delle attività dell'agente utilizzando una rubrica tridimensionale (semantica, pragmatica, sintattica) derivata dal quadro di qualità KLS. Da utilizzare quando: (1) un'attività è stata completata e necessita di una valutazione di qualità prima dell'accettazione, (2) sono richiesti controlli di qualità automatizzati post-attività, (3) sono necessari verdetti di consenso multi-modello per gli output dell'agente, (4) la qualità della documentazione, del codice o delle specifiche deve essere valutata con verdetti JSON strutturati o (5) è necessaria una decisione di fallback umana dopo un disaccordo del modello. Produce record di verdetto JSONL compatibili con lo schema di verdetto in automation/judge/. Fonte: terraphim/terraphim-skills.