·ai-eval-design-and-iteration
*

ai-eval-design-and-iteration

發展「測驗」(評估)來衡量特定任務的模型表現。使用這些基準來指導微調、確定產品使用者體驗模式並追蹤一段時間內的效能改進。在啟動新的人工智慧功能、在模型版本之間切換或針對高風險精度進行最佳化時,請使用此功能。

4安裝·0熱度·@samarv

安裝

$npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration

如何安裝 ai-eval-design-and-iteration

透過命令列快速安裝 ai-eval-design-and-iteration AI 技能到你的開發環境

  1. 開啟終端機: 開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等)
  2. 執行安裝指令: 複製並執行以下指令:npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration
  3. 驗證安裝: 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

來源:samarv/shanon。

SKILL.md

查看原文

In traditional software, inputs and outputs are defined. In AI, inputs and outputs are fuzzy. Evals (evaluations) are the "unit tests" for AI products. They allow you to move from "vibes-based" development to metric-driven iteration. By building a rigorous "quiz" for your model, you can determine exactly how capable your product is and where it requires human-in-the-loop scaffolding.

Identify "Hero Use Cases" Don't start with generic benchmarks (like MMLU). Instead, define the specific "hero" scenarios your product must master.

Design the "Quiz" (The Eval) Create a set of tests to gauge how well the model knows the subject material.

發展「測驗」(評估)來衡量特定任務的模型表現。使用這些基準來指導微調、確定產品使用者體驗模式並追蹤一段時間內的效能改進。在啟動新的人工智慧功能、在模型版本之間切換或針對高風險精度進行最佳化時,請使用此功能。 來源:samarv/shanon。

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration
分類
*創意媒體
認證
收錄時間
2026-02-25
更新時間
2026-03-10

Browse more skills from samarv/shanon

快速解答

什麼是 ai-eval-design-and-iteration?

發展「測驗」(評估)來衡量特定任務的模型表現。使用這些基準來指導微調、確定產品使用者體驗模式並追蹤一段時間內的效能改進。在啟動新的人工智慧功能、在模型版本之間切換或針對高風險精度進行最佳化時,請使用此功能。 來源:samarv/shanon。

如何安裝 ai-eval-design-and-iteration?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/samarv/shanon --skill ai-eval-design-and-iteration 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用

這個 Skill 的原始碼在哪?

https://github.com/samarv/shanon