agent-evaluation

Name: agent-evaluation
Author: omer-metin

✓

Testen und Benchmarking von LLM-Agenten, einschließlich Verhaltenstests, Fähigkeitsbewertung, Zuverlässigkeitsmetriken und Produktionsüberwachung – wobei selbst Top-Agenten bei realen Benchmarks weniger als 50 % erreichen. Verwenden Sie diese Option, wenn „Agententests, Agentenbewertung, Benchmark-Agenten, Agentenzuverlässigkeit, Testagent, Tests, Bewertung, Benchmark, Agenten, Zuverlässigkeit, Qualität“ erwähnt wird.

omer-metin·agent·evaluation

10Installationen·0Trend·@omer-metin

Installation

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill agent-evaluation

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

agent-evaluation

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist agent-evaluation?

Wie installiere ich agent-evaluation?

Wo ist das Quell-Repository?

Details

Verwandte Skills