·eval-harness
</>

eval-harness

mhylle/claude-skills-collection

用於人工智能輔助實施的系統測試、測量和質量保證的綜合評估框架。支持能力評估、回歸測試、多評分器類型和標準化指標。

2安裝·0熱度·@mhylle

安裝

$npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness

SKILL.md

Evaluation-driven development (EDD) is a methodology where evaluations are defined before or alongside implementation, ensuring that success criteria are explicit, measurable, and testable from the start.

Purpose: Verify that a new capability works correctly. Capability evals test whether the system can do something it couldn't do before, or does something better than before.

Purpose: Verify that existing functionality still works after changes. Regression evals protect against unintended breakage.

用於人工智能輔助實施的系統測試、測量和質量保證的綜合評估框架。支持能力評估、回歸測試、多評分器類型和標準化指標。 來源:mhylle/claude-skills-collection。

查看原文

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness
分類
</>開發工具
認證
收錄時間
2026-02-01
更新時間
2026-02-18

快速解答

什麼是 eval-harness?

用於人工智能輔助實施的系統測試、測量和質量保證的綜合評估框架。支持能力評估、回歸測試、多評分器類型和標準化指標。 來源:mhylle/claude-skills-collection。

如何安裝 eval-harness?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/mhylle/claude-skills-collection --skill eval-harness 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用

這個 Skill 的原始碼在哪?

https://github.com/mhylle/claude-skills-collection

詳情

分類
</>開發工具
來源
skills.sh
收錄時間
2026-02-01