evaluating-skills-with-models
✓하위 에이전트를 사용하여 소네트, 오푸스, 하이쿠 모델 전반에 걸쳐 실행하여 기술을 평가합니다. 스킬이 제대로 작동하는지 테스트하거나, 모델 성능을 비교하거나, 가장 저렴한 호환 모델을 찾을 때 사용하세요. 모델 기능을 차별화하기 위해 숫자 점수(0-100)를 반환합니다.
SKILL.md
Evaluate skills across multiple Claude models using sub-agents with quality-based scoring.
Binary pass/fail ("did it do X?") fails to differentiate models - all models can "do the steps." The difference is how well they do them. This skill uses weighted scoring to reveal capability differences.
Default to difficult scenarios: When multiple scenarios exist, prioritize Hard or Medium difficulty scenarios for evaluation. Easy scenarios often don't show meaningful differences between models and aren't realistic for production use.
하위 에이전트를 사용하여 소네트, 오푸스, 하이쿠 모델 전반에 걸쳐 실행하여 기술을 평가합니다. 스킬이 제대로 작동하는지 테스트하거나, 모델 성능을 비교하거나, 가장 저렴한 호환 모델을 찾을 때 사용하세요. 모델 기능을 차별화하기 위해 숫자 점수(0-100)를 반환합니다. 출처: taisukeoe/agentic-ai-skills-creator.
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/taisukeoe/agentic-ai-skills-creator --skill evaluating-skills-with-models- 카테고리
- </>개발 도구
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
evaluating-skills-with-models이란?
하위 에이전트를 사용하여 소네트, 오푸스, 하이쿠 모델 전반에 걸쳐 실행하여 기술을 평가합니다. 스킬이 제대로 작동하는지 테스트하거나, 모델 성능을 비교하거나, 가장 저렴한 호환 모델을 찾을 때 사용하세요. 모델 기능을 차별화하기 위해 숫자 점수(0-100)를 반환합니다. 출처: taisukeoe/agentic-ai-skills-creator.
evaluating-skills-with-models 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/taisukeoe/agentic-ai-skills-creator --skill evaluating-skills-with-models 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/taisukeoe/agentic-ai-skills-creator
상세
- 카테고리
- </>개발 도구
- 출처
- skills.sh
- 최초 등록
- 2026-02-01