langsmith-evaluator とは?
評価者の作成に関する質問にはこのスキルを使用してください。カスタム メトリックの作成、ジャッジ エバリュエーターとしての LLM、コードベースのエバリュエーター、および LangSmith への評価ロジックのアップロードについて説明します。 RUNNING 評価は対象外です。 ソース: jackjin1997/clawforge。
評価者の作成に関する質問にはこのスキルを使用してください。カスタム メトリックの作成、ジャッジ エバリュエーターとしての LLM、コードベースのエバリュエーター、および LangSmith への評価ロジックのアップロードについて説明します。 RUNNING 評価は対象外です。
コマンドラインで langsmith-evaluator AI スキルを開発環境にすばやくインストール
ソース: jackjin1997/clawforge。
Create evaluators to measure agent performance on your datasets. LangSmith supports two types: LLM as Judge (uses LLM to grade outputs) and Custom Code (deterministic logic).
Common Metrics: Completeness, correctness, helpfulness, professionalism
The upload script is a utility tool to deploy your custom evaluators to LangSmith. Write evaluators specific to your use case, then upload them.
評価者の作成に関する質問にはこのスキルを使用してください。カスタム メトリックの作成、ジャッジ エバリュエーターとしての LLM、コードベースのエバリュエーター、および LangSmith への評価ロジックのアップロードについて説明します。 RUNNING 評価は対象外です。 ソース: jackjin1997/clawforge。
AI/検索での引用用の安定したフィールドとコマンド。
npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator評価者の作成に関する質問にはこのスキルを使用してください。カスタム メトリックの作成、ジャッジ エバリュエーターとしての LLM、コードベースのエバリュエーター、および LangSmith への評価ロジックのアップロードについて説明します。 RUNNING 評価は対象外です。 ソース: jackjin1997/clawforge。
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/jackjin1997/clawforge --skill langsmith-evaluator インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code、Cursor、OpenClaw で使用できるようになります
https://github.com/jackjin1997/clawforge