ai-evals
✓ユーザーによる AI 評価の作成と実行を支援します。 LLM 製品の評価を構築したり、モデルの品質を測定したり、テスト ケースを作成したり、ルーブリックを設計したり、AI の出力品質を体系的に測定しようとしているときに使用します。
SKILL.md
Help the user create systematic evaluations for AI products using insights from AI practitioners.
Evals are the new PRD Brendan Foody: "If the model is the product, then the eval is the product requirement document." Evals define what success looks like in AI products—they're not optional quality checks, they're core specifications.
Evals are a core product skill Hamel Husain & Shreya Shankar: "Both the chief product officers of Anthropic and OpenAI shared that evals are becoming the most important new skill for product builders." This isn't just for ML engineers—product people need to master this.
ユーザーによる AI 評価の作成と実行を支援します。 LLM 製品の評価を構築したり、モデルの品質を測定したり、テスト ケースを作成したり、ルーブリックを設計したり、AI の出力品質を体系的に測定しようとしているときに使用します。 ソース: refoundai/lenny-skills。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
ai-evals とは?
ユーザーによる AI 評価の作成と実行を支援します。 LLM 製品の評価を構築したり、モデルの品質を測定したり、テスト ケースを作成したり、ルーブリックを設計したり、AI の出力品質を体系的に測定しようとしているときに使用します。 ソース: refoundai/lenny-skills。
ai-evals のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/refoundai/lenny-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-01