pydantic-evals

Name: pydantic-evals
Author: fuenfgeld

什麼是 pydantic-evals？

使用具有強類型功能的程式碼優先評估框架來測試和評估 AI 代理程式和 LLM 輸出。當使用者想要執行以下操作時使用：(1) 使用 AI 代理的測試案例建立評估資料集，(2) 定義評估器（確定性、LLM-as-Judge、自訂或基於跨度），(3) 運行評估並產生報告，(4) 比較不同實驗的模型性能，(5) 將評估與 Pydantic AI 代理集成，(6) 使用測試性 (27) 測試性。系統實施回歸測試。來源：fuenfgeld/pydantic-ai-skills。

如何安裝 pydantic-evals？

開啟你的終端機或命令列工具（如 Terminal、iTerm、Windows Terminal 等）複製並執行以下指令：npx skills add https://github.com/fuenfgeld/pydantic-ai-skills --skill pydantic-evals 安裝完成後，技能將自動設定到你的 AI 程式設計環境中，可以在 Claude Code、Cursor 或 OpenClaw 中使用

這個 Skill 的原始碼在哪？

https://github.com/fuenfgeld/pydantic-ai-skills

安裝

詳情

相關 Skills

pydantic-evals

安裝

如何安裝 pydantic-evals

SKILL.md

可引用資訊

快速解答

什麼是 pydantic-evals？

如何安裝 pydantic-evals？

這個 Skill 的原始碼在哪？

詳情

相關 Skills