·agent-evaluation

</>

agent-evaluation

✓

sickn33/antigravity-awesome-skills

행동 테스트, 기능 평가, 안정성 지표, 생산 모니터링을 포함한 LLM 에이전트 테스트 및 벤치마킹 - 최고 에이전트라도 실제 벤치마크에서 50% 미만을 달성합니다. 사용 시기: 에이전트 테스트, 에이전트 평가, 벤치마크 에이전트, 에이전트 신뢰성, 테스트 에이전트.

sickn33·agent·evaluation

244설치·2트렌드·@sickn33

설치

$npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill agent-evaluation

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-01

관련 Skills

nextjs-supabase-auth

nextjs-best-practices

security-review

playwright-skill