·eval-audit
{}

eval-audit

LLM 평가 파이프라인을 감사하고 문제를 표면화합니다(누락된 오류 분석, 검증되지 않은 판단, 허영 메트릭 등). 평가 시스템을 상속할 때, 평가가 신뢰할 수 있는지 확실하지 않은 경우 또는 평가 인프라가 없는 경우 시작점으로 사용합니다. 목표가 처음부터 새로운 평가기를 구축하는 것이라면 사용하지 마십시오(대신 오류 분석, 쓰기 판단 프롬프트 또는 검증 평가기를 사용하십시오).

81설치·2트렌드·@hamelsmu

설치

$npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit

eval-audit 설치 방법

명령줄에서 eval-audit AI 스킬을 개발 환경에 빠르게 설치

  1. 터미널 열기: 터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다
  2. 설치 명령어 실행: 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit
  3. 설치 확인: 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code, Cursor, OpenClaw에서 사용할 수 있습니다

출처: hamelsmu/evals-skills.

Inspect an LLM eval pipeline and produce a prioritized list of problems with concrete next steps.

Access to eval artifacts (traces, evaluator configs, judge prompts, labeled data) via an observability MCP server or local files. If none exist, skip to "No Eval Infrastructure."

Check whether the user has an observability MCP server connected (Phoenix, Braintrust, LangSmith, Truesight or similar). If available, use it to pull traces, evaluator definitions, and experiment results. If not, ask for local files: CSVs, JSON trace exports, notebooks, or evaluation scripts.

LLM 평가 파이프라인을 감사하고 문제를 표면화합니다(누락된 오류 분석, 검증되지 않은 판단, 허영 메트릭 등). 평가 시스템을 상속할 때, 평가가 신뢰할 수 있는지 확실하지 않은 경우 또는 평가 인프라가 없는 경우 시작점으로 사용합니다. 목표가 처음부터 새로운 평가기를 구축하는 것이라면 사용하지 마십시오(대신 오류 분석, 쓰기 판단 프롬프트 또는 검증 평가기를 사용하십시오). 출처: hamelsmu/evals-skills.

인용 가능한 정보

AI/검색 인용용 안정적인 필드와 명령어.

설치 명령어
npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit
카테고리
{}데이터 분석
인증됨
최초 등록
2026-03-04
업데이트
2026-03-11

Browse more skills from hamelsmu/evals-skills

빠른 답변

eval-audit이란?

LLM 평가 파이프라인을 감사하고 문제를 표면화합니다(누락된 오류 분석, 검증되지 않은 판단, 허영 메트릭 등). 평가 시스템을 상속할 때, 평가가 신뢰할 수 있는지 확실하지 않은 경우 또는 평가 인프라가 없는 경우 시작점으로 사용합니다. 목표가 처음부터 새로운 평가기를 구축하는 것이라면 사용하지 마십시오(대신 오류 분석, 쓰기 판단 프롬프트 또는 검증 평가기를 사용하십시오). 출처: hamelsmu/evals-skills.

eval-audit 설치 방법은?

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/hamelsmu/evals-skills --skill eval-audit 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code, Cursor, OpenClaw에서 사용할 수 있습니다

소스 저장소는 어디인가요?

https://github.com/hamelsmu/evals-skills