什么是 langsmith-evaluator?
使用此技能来解决有关创建评估器的任何问题。涵盖创建自定义指标、LLM 作为 Judge 评估器、基于代码的评估器以及将评估逻辑上传到 LangSmith。不包括 RUNNING 评估。 来源:jackjin1997/clawforge。
使用此技能来解决有关创建评估器的任何问题。涵盖创建自定义指标、LLM 作为 Judge 评估器、基于代码的评估器以及将评估逻辑上传到 LangSmith。不包括 RUNNING 评估。
通过命令行快速安装 langsmith-evaluator AI 技能到你的开发环境
来源:jackjin1997/clawforge。
Create evaluators to measure agent performance on your datasets. LangSmith supports two types: LLM as Judge (uses LLM to grade outputs) and Custom Code (deterministic logic).
Common Metrics: Completeness, correctness, helpfulness, professionalism
The upload script is a utility tool to deploy your custom evaluators to LangSmith. Write evaluators specific to your use case, then upload them.
使用此技能来解决有关创建评估器的任何问题。涵盖创建自定义指标、LLM 作为 Judge 评估器、基于代码的评估器以及将评估逻辑上传到 LangSmith。不包括 RUNNING 评估。 来源:jackjin1997/clawforge。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator使用此技能来解决有关创建评估器的任何问题。涵盖创建自定义指标、LLM 作为 Judge 评估器、基于代码的评估器以及将评估逻辑上传到 LangSmith。不包括 RUNNING 评估。 来源:jackjin1997/clawforge。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/jackjin1997/clawforge