pydantic-evals

Name: pydantic-evals
Author: fuenfgeld

什么是 pydantic-evals？

使用具有强类型功能的代码优先评估框架来测试和评估 AI 代理和 LLM 输出。当用户想要执行以下操作时使用：(1) 使用 AI 代理的测试用例创建评估数据集，(2) 定义评估器（确定性、LLM-as-Judge、自定义或基于跨度），(3) 运行评估并生成报告，(4) 比较不同实验的模型性能，(5) 将评估与 Pydantic AI 代理集成，(6) 使用 Logfire 设置可观察性，(7) 使用 LLM 生成测试数据集，(8) 为 AI 系统实施回归测试。来源：fuenfgeld/pydantic-ai-skills。

如何安装 pydantic-evals？

打开你的终端或命令行工具（如 Terminal、iTerm、Windows Terminal 等）复制并运行以下命令：npx skills add https://github.com/fuenfgeld/pydantic-ai-skills --skill pydantic-evals 安装完成后，技能将自动配置到你的 AI 编程环境中，可以在 Claude Code、Cursor 或 OpenClaw 中使用

这个 Skill 的源码在哪？

https://github.com/fuenfgeld/pydantic-ai-skills

安装

详情

相关 Skills

pydantic-evals

安装

如何安装 pydantic-evals

SKILL.md

可引用信息

快速解答

什么是 pydantic-evals？

如何安装 pydantic-evals？

这个 Skill 的源码在哪？

详情

相关 Skills