evaluating-llms

Name: evaluating-llms
Author: ancoleman

✓

Bewerten Sie LLM-Systeme mithilfe automatisierter Metriken, LLM-as-Judge und Benchmarks. Verwenden Sie es zum Testen der Prompt-Qualität, zum Validieren von RAG-Pipelines, zum Messen der Sicherheit (Halluzinationen, Bias) oder zum Vergleichen von Modellen für den Produktionseinsatz.

ancoleman·evaluating·llms

7Installationen·0Trend·@ancoleman

Installation

$npx skills add https://github.com/ancoleman/ai-design-components --skill evaluating-llms

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

evaluating-llms

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist evaluating-llms?

Wie installiere ich evaluating-llms?

Wo ist das Quell-Repository?

Details

Verwandte Skills