·advanced-evaluation
</>

advanced-evaluation

shipshitdev/library

Beherrschen Sie LLM-Bewertungstechniken als Richter, einschließlich direkter Bewertung, paarweisem Vergleich, Rubrikgenerierung und Verzerrungsminderung. Verwenden Sie es beim Aufbau von Bewertungssystemen, beim Vergleich von Modellausgaben oder beim Festlegen von Qualitätsstandards für KI-generierte Inhalte.

37Installationen·0Trend·@shipshitdev

Installation

$npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation

SKILL.md

LLM-as-a-Judge techniques for evaluating AI outputs. Not a single technique but a family of approaches - choosing the right one and mitigating biases is the core competency.

Direct Scoring: Single LLM rates one response on a defined scale.

Pairwise Comparison: LLM compares two responses and selects better one.

Beherrschen Sie LLM-Bewertungstechniken als Richter, einschließlich direkter Bewertung, paarweisem Vergleich, Rubrikgenerierung und Verzerrungsminderung. Verwenden Sie es beim Aufbau von Bewertungssystemen, beim Vergleich von Modellausgaben oder beim Festlegen von Qualitätsstandards für KI-generierte Inhalte. Quelle: shipshitdev/library.

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-01
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist advanced-evaluation?

Beherrschen Sie LLM-Bewertungstechniken als Richter, einschließlich direkter Bewertung, paarweisem Vergleich, Rubrikgenerierung und Verzerrungsminderung. Verwenden Sie es beim Aufbau von Bewertungssystemen, beim Vergleich von Modellausgaben oder beim Festlegen von Qualitätsstandards für KI-generierte Inhalte. Quelle: shipshitdev/library.

Wie installiere ich advanced-evaluation?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/shipshitdev/library --skill advanced-evaluation Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/shipshitdev/library