agent-evaluation

Name: agent-evaluation
Author: hainamchung

✓

Testen und Benchmarking von LLM-Agenten, einschließlich Verhaltenstests, Fähigkeitsbewertung, Zuverlässigkeitsmetriken und Produktionsüberwachung – wobei selbst Top-Agenten bei realen Benchmarks weniger als 50 % erreichen. Verwendung bei: Agententests, Agentenbewertung, Benchmark-Agenten, Agentenzuverlässigkeit, Testagent.

hainamchung·agent·evaluation

2Installationen·0Trend·@hainamchung

Installation

$npx skills add https://github.com/hainamchung/agent-assistant --skill agent-evaluation

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

agent-evaluation

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist agent-evaluation?

Wie installiere ich agent-evaluation?

Wo ist das Quell-Repository?

Details

Verwandte Skills