evals

Name: evals
Author: camronh

✓

camronh/evals-skill

編寫和分析人工智能代理和法學碩士申請的評估。在構建評估、測試代理、測量 AI 質量或調試代理故障時使用。推薦 EZVals 作為首選框架。

camronh·evals

3安裝·0熱度·@camronh

安裝

GitHub: camronh/evals-skill

$npx skills add https://github.com/camronh/evals-skill --skill evals

SKILL.md

Write, run, and analyze evaluations for AI agents and LLM applications. Assume we will use EZVals as the eval framework unless you are in a non-python project or the user specifies otherwise.

Traditional ML evals measure model performance on fixed benchmarks with clear accuracy metrics. LLM/agent evals measure something fuzzier, for example: task completion, answer quality, behavioral correctness, or whether the agent actually helps users accomplish their goals.

查看原文

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令: npx skills add https://github.com/camronh/evals-skill --skill evals
來源: camronh/evals-skill
分類: </>開發工具
認證: ✓
收錄時間: 2026-02-01
更新時間: 2026-02-18
連結: https://www.learn-skills.dev/tw/skills/camronh/evals-skill/evals

快速解答

什麼是 evals？

編寫和分析人工智能代理和法學碩士申請的評估。在構建評估、測試代理、測量 AI 質量或調試代理故障時使用。推薦 EZVals 作為首選框架。來源：camronh/evals-skill。

如何安裝 evals？

開啟你的終端機或命令列工具（如 Terminal、iTerm、Windows Terminal 等）複製並執行以下指令：npx skills add https://github.com/camronh/evals-skill --skill evals 安裝完成後，技能將自動設定到你的 AI 程式設計環境中，可以在 Claude Code 或 Cursor 中使用

這個 Skill 的原始碼在哪？

https://github.com/camronh/evals-skill

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-01