什麼是 langsmith-evaluator?
使用此技能來解決有關創建評估器的任何問題。涵蓋建立自訂指標、LLM 作為 Judge 評估器、基於程式碼的評估器以及將評估邏輯上傳到 LangSmith。不包括 RUNNING 評估。 來源:jackjin1997/clawforge。
使用此技能來解決有關創建評估器的任何問題。涵蓋建立自訂指標、LLM 作為 Judge 評估器、基於程式碼的評估器以及將評估邏輯上傳到 LangSmith。不包括 RUNNING 評估。
透過命令列快速安裝 langsmith-evaluator AI 技能到你的開發環境
來源:jackjin1997/clawforge。
Create evaluators to measure agent performance on your datasets. LangSmith supports two types: LLM as Judge (uses LLM to grade outputs) and Custom Code (deterministic logic).
Common Metrics: Completeness, correctness, helpfulness, professionalism
The upload script is a utility tool to deploy your custom evaluators to LangSmith. Write evaluators specific to your use case, then upload them.
使用此技能來解決有關創建評估器的任何問題。涵蓋建立自訂指標、LLM 作為 Judge 評估器、基於程式碼的評估器以及將評估邏輯上傳到 LangSmith。不包括 RUNNING 評估。 來源:jackjin1997/clawforge。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator使用此技能來解決有關創建評估器的任何問題。涵蓋建立自訂指標、LLM 作為 Judge 評估器、基於程式碼的評估器以及將評估邏輯上傳到 LangSmith。不包括 RUNNING 評估。 來源:jackjin1997/clawforge。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/jackjin1997/clawforge