ai-evals
✓사용자가 AI 평가를 생성하고 실행하도록 돕습니다. 누군가가 LLM 제품에 대한 평가를 구축하고, 모델 품질을 측정하고, 테스트 사례를 만들고, 기준표를 디자인하거나, AI 출력 품질을 체계적으로 측정하려고 할 때 사용하세요.
SKILL.md
Help the user create systematic evaluations for AI products using insights from AI practitioners.
Evals are the new PRD Brendan Foody: "If the model is the product, then the eval is the product requirement document." Evals define what success looks like in AI products—they're not optional quality checks, they're core specifications.
Evals are a core product skill Hamel Husain & Shreya Shankar: "Both the chief product officers of Anthropic and OpenAI shared that evals are becoming the most important new skill for product builders." This isn't just for ML engineers—product people need to master this.
사용자가 AI 평가를 생성하고 실행하도록 돕습니다. 누군가가 LLM 제품에 대한 평가를 구축하고, 모델 품질을 측정하고, 테스트 사례를 만들고, 기준표를 디자인하거나, AI 출력 품질을 체계적으로 측정하려고 할 때 사용하세요. 출처: refoundai/lenny-skills.
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals- 카테고리
- </>개발 도구
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
ai-evals이란?
사용자가 AI 평가를 생성하고 실행하도록 돕습니다. 누군가가 LLM 제품에 대한 평가를 구축하고, 모델 품질을 측정하고, 테스트 사례를 만들고, 기준표를 디자인하거나, AI 출력 품질을 체계적으로 측정하려고 할 때 사용하세요. 출처: refoundai/lenny-skills.
ai-evals 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/refoundai/lenny-skills
상세
- 카테고리
- </>개발 도구
- 출처
- skills.sh
- 최초 등록
- 2026-02-01