¿Qué es judge?
Evalúe los resultados de las tareas de los agentes utilizando una rúbrica tridimensional (semántica, pragmática, sintáctica) derivada del marco de calidad KLS. Úselo cuando: (1) se ha completado una tarea y necesita una evaluación de calidad antes de su aceptación, (2) se requieren controles de calidad automatizados posteriores a la tarea, (3) se necesitan veredictos de consenso multimodelo para los resultados de los agentes, (4) la calidad de la documentación, el código o las especificaciones se debe calificar con veredictos JSON estructurados, o (5) se necesita una decisión humana alternativa después de un desacuerdo con el modelo. Produce registros de veredicto JSONL compatibles con el esquema de veredicto en automatización/juez/. Fuente: terraphim/terraphim-skills.