nemo-evaluator-sdk

Name: nemo-evaluator-sdk
Author: orchestra-research

✓

マルチバックエンド実行により、18 以上のハーネス (MMLU、HumanEval、GSM8K、安全性、VLM) からの 100 以上のベンチマークにわたって LLM を評価します。ローカルの Docker、Slurm HPC、またはクラウドプラットフォームでスケーラブルな評価が必要な場合に使用します。再現可能なベンチマークを実現するコンテナファーストアーキテクチャを備えた NVIDIA のエンタープライズグレードのプラットフォーム。

orchestra-research·nemo·evaluator·sdk

14インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-evaluator-sdk

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

nemo-evaluator-sdk

インストール

SKILL.md

引用可能な情報

クイックアンサー

nemo-evaluator-sdk とは？

nemo-evaluator-sdk のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills