·dspy-evaluation-suite
</>

dspy-evaluation-suite

omidzamani/dspy-skills

當用戶要求“評估 DSPy 程序”、“測試我的 DSPy 模塊”、“測量性能”、“創建評估指標”、“使用answer_exact_match 或 SemanticF1”、提到“評估類別”、“比較程序”、“建立基線”或需要使用自定義或內置指標系統地測試和測量 DSPy 程序質量時,應使用此技能。

8安裝·0熱度·@omidzamani

安裝

$npx skills add https://github.com/omidzamani/dspy-skills --skill dspy-evaluation-suite

SKILL.md

Systematically evaluate DSPy programs using built-in and custom metrics with parallel execution.

| program | dspy.Module | Program to evaluate | | devset | list[dspy.Example] | Evaluation examples | | metric | callable | Scoring function | | numthreads | int | Parallel threads |

| score | float | Average metric score | | results | list | Per-example results |

當用戶要求“評估 DSPy 程序”、“測試我的 DSPy 模塊”、“測量性能”、“創建評估指標”、“使用answer_exact_match 或 SemanticF1”、提到“評估類別”、“比較程序”、“建立基線”或需要使用自定義或內置指標系統地測試和測量 DSPy 程序質量時,應使用此技能。 來源:omidzamani/dspy-skills。

查看原文

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/omidzamani/dspy-skills --skill dspy-evaluation-suite
分類
</>開發工具
認證
收錄時間
2026-02-01
更新時間
2026-02-18

快速解答

什麼是 dspy-evaluation-suite?

當用戶要求“評估 DSPy 程序”、“測試我的 DSPy 模塊”、“測量性能”、“創建評估指標”、“使用answer_exact_match 或 SemanticF1”、提到“評估類別”、“比較程序”、“建立基線”或需要使用自定義或內置指標系統地測試和測量 DSPy 程序質量時,應使用此技能。 來源:omidzamani/dspy-skills。

如何安裝 dspy-evaluation-suite?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/omidzamani/dspy-skills --skill dspy-evaluation-suite 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用

這個 Skill 的原始碼在哪?

https://github.com/omidzamani/dspy-skills