dspy-evaluation-suite
✓このスキルは、ユーザーが「DSPy プログラムの評価」、「DSPy モジュールのテスト」、「パフォーマンスの測定」、「評価メトリクスの作成」、「answer_exact_match または SemanticF1 の使用」を要求した場合、「クラスの評価」、「プログラムの比較」、「ベースラインの確立」に言及した場合、またはカスタムまたは組み込みメトリクスを使用して DSPy プログラムの品質を体系的にテストおよび測定する必要がある場合に使用する必要があります。
SKILL.md
Systematically evaluate DSPy programs using built-in and custom metrics with parallel execution.
| program | dspy.Module | Program to evaluate | | devset | list[dspy.Example] | Evaluation examples | | metric | callable | Scoring function | | numthreads | int | Parallel threads |
| score | float | Average metric score | | results | list | Per-example results |
このスキルは、ユーザーが「DSPy プログラムの評価」、「DSPy モジュールのテスト」、「パフォーマンスの測定」、「評価メトリクスの作成」、「answer_exact_match または SemanticF1 の使用」を要求した場合、「クラスの評価」、「プログラムの比較」、「ベースラインの確立」に言及した場合、またはカスタムまたは組み込みメトリクスを使用して DSPy プログラムの品質を体系的にテストおよび測定する必要がある場合に使用する必要があります。 ソース: omidzamani/dspy-skills。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/omidzamani/dspy-skills --skill dspy-evaluation-suite- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
dspy-evaluation-suite とは?
このスキルは、ユーザーが「DSPy プログラムの評価」、「DSPy モジュールのテスト」、「パフォーマンスの測定」、「評価メトリクスの作成」、「answer_exact_match または SemanticF1 の使用」を要求した場合、「クラスの評価」、「プログラムの比較」、「ベースラインの確立」に言及した場合、またはカスタムまたは組み込みメトリクスを使用して DSPy プログラムの品質を体系的にテストおよび測定する必要がある場合に使用する必要があります。 ソース: omidzamani/dspy-skills。
dspy-evaluation-suite のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/omidzamani/dspy-skills --skill dspy-evaluation-suite インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/omidzamani/dspy-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-01