·ai-evals
</>

ai-evals

refoundai/lenny-skills

幫助用戶創建和運行人工智能評估。當有人為 LLM 產品構建評估、測量模型質量、創建測試用例、設計標准或嘗試系統地測量 AI 輸出質量時使用。

299安裝·10熱度·@refoundai

安裝

$npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals

SKILL.md

Help the user create systematic evaluations for AI products using insights from AI practitioners.

Evals are the new PRD Brendan Foody: "If the model is the product, then the eval is the product requirement document." Evals define what success looks like in AI products—they're not optional quality checks, they're core specifications.

Evals are a core product skill Hamel Husain & Shreya Shankar: "Both the chief product officers of Anthropic and OpenAI shared that evals are becoming the most important new skill for product builders." This isn't just for ML engineers—product people need to master this.

幫助用戶創建和運行人工智能評估。當有人為 LLM 產品構建評估、測量模型質量、創建測試用例、設計標准或嘗試系統地測量 AI 輸出質量時使用。 來源:refoundai/lenny-skills。

查看原文

可引用資訊

為搜尋與 AI 引用準備的穩定欄位與指令。

安裝指令
npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals
分類
</>開發工具
認證
收錄時間
2026-02-01
更新時間
2026-02-18

快速解答

什麼是 ai-evals?

幫助用戶創建和運行人工智能評估。當有人為 LLM 產品構建評估、測量模型質量、創建測試用例、設計標准或嘗試系統地測量 AI 輸出質量時使用。 來源:refoundai/lenny-skills。

如何安裝 ai-evals?

開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/refoundai/lenny-skills --skill ai-evals 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用

這個 Skill 的原始碼在哪?

https://github.com/refoundai/lenny-skills