·judge

Bewerten Sie die Aufgabenausgaben von Agenten mithilfe einer dreidimensionalen Rubrik (semantisch, pragmatisch, syntaktisch), die aus dem KLS-Qualitätsrahmen abgeleitet ist. Verwenden Sie dies, wenn: (1) eine Aufgabe abgeschlossen wurde und vor der Annahme eine Qualitätsbewertung erfordert, (2) automatisierte Qualitätsprüfungen nach der Aufgabe erforderlich sind, (3) Konsensurteile für mehrere Modelle für Agentenausgaben erforderlich sind, (4) die Dokumentations-, Code- oder Spezifikationsqualität mit strukturierten JSON-Urteilen bewertet werden muss oder (5) nach einer Modellunstimmigkeit eine menschliche Fallback-Entscheidung erforderlich ist. Erstellt JSONL-Urteilsdatensätze, die mit dem Urteilsschema in „automation/judge/“ kompatibel sind.

8Installationen·0Trend·@terraphim

Installation

$npx skills add https://github.com/terraphim/terraphim-skills --skill judge

So installieren Sie judge

Installieren Sie den KI-Skill judge schnell in Ihrer Entwicklungsumgebung über die Kommandozeile

  1. Terminal öffnen: Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.)
  2. Installationsbefehl ausführen: Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/terraphim/terraphim-skills --skill judge
  3. Installation überprüfen: Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code, Cursor oder OpenClaw

Quelle: terraphim/terraphim-skills.

Evaluate agent task outputs against a three-dimension rubric and produce structured verdict records. The judge operates as a quality gate at the task completion boundary, scoring outputs on Semantic accuracy, Pragmatic usefulness, and Syntactic consistency.

The rubric reuses three dimensions from the KLS (Krogstie-Lindland-Sindre) quality framework defined in disciplined-quality-evaluation:

| Semantic | Does it accurately represent the domain? | Factual correctness, domain terminology, no contradictions | | Pragmatic | Does it enable the intended decisions/actions? | Actionable, useful, addresses the task goal | | Syntactic | Is it internally consistent and well-structured? | Format compliance, structural completeness, no broken references |

Bewerten Sie die Aufgabenausgaben von Agenten mithilfe einer dreidimensionalen Rubrik (semantisch, pragmatisch, syntaktisch), die aus dem KLS-Qualitätsrahmen abgeleitet ist. Verwenden Sie dies, wenn: (1) eine Aufgabe abgeschlossen wurde und vor der Annahme eine Qualitätsbewertung erfordert, (2) automatisierte Qualitätsprüfungen nach der Aufgabe erforderlich sind, (3) Konsensurteile für mehrere Modelle für Agentenausgaben erforderlich sind, (4) die Dokumentations-, Code- oder Spezifikationsqualität mit strukturierten JSON-Urteilen bewertet werden muss oder (5) nach einer Modellunstimmigkeit eine menschliche Fallback-Entscheidung erforderlich ist. Erstellt JSONL-Urteilsdatensätze, die mit dem Urteilsschema in „automation/judge/“ kompatibel sind. Quelle: terraphim/terraphim-skills.

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/terraphim/terraphim-skills --skill judge
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-22
Aktualisiert
2026-03-10

Browse more skills from terraphim/terraphim-skills

Schnelle Antworten

Was ist judge?

Bewerten Sie die Aufgabenausgaben von Agenten mithilfe einer dreidimensionalen Rubrik (semantisch, pragmatisch, syntaktisch), die aus dem KLS-Qualitätsrahmen abgeleitet ist. Verwenden Sie dies, wenn: (1) eine Aufgabe abgeschlossen wurde und vor der Annahme eine Qualitätsbewertung erfordert, (2) automatisierte Qualitätsprüfungen nach der Aufgabe erforderlich sind, (3) Konsensurteile für mehrere Modelle für Agentenausgaben erforderlich sind, (4) die Dokumentations-, Code- oder Spezifikationsqualität mit strukturierten JSON-Urteilen bewertet werden muss oder (5) nach einer Modellunstimmigkeit eine menschliche Fallback-Entscheidung erforderlich ist. Erstellt JSONL-Urteilsdatensätze, die mit dem Urteilsschema in „automation/judge/“ kompatibel sind. Quelle: terraphim/terraphim-skills.

Wie installiere ich judge?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/terraphim/terraphim-skills --skill judge Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code, Cursor oder OpenClaw

Wo ist das Quell-Repository?

https://github.com/terraphim/terraphim-skills