Was ist eval-audit?
Prüfen Sie eine LLM-Evaluierungspipeline und decken Sie Probleme auf: fehlende Fehleranalyse, nicht validierte Beurteilungen, Vanity-Metriken usw. Verwenden Sie diese Option, wenn Sie ein Evaluierungssystem übernehmen, wenn Sie nicht sicher sind, ob Evaluierungen vertrauenswürdig sind, oder als Ausgangspunkt, wenn keine Evaluierungsinfrastruktur vorhanden ist. NICHT verwenden, wenn das Ziel darin besteht, einen neuen Evaluator von Grund auf zu erstellen (verwenden Sie stattdessen Fehleranalyse, Write-Judge-Prompt oder Validate-Evaluator). Quelle: hamelsmu/evals-skills.