·nemo-evaluator-sdk

</>

nemo-evaluator-sdk

✓

orchestra-research/ai-research-skills

通过多后端执行，通过 18 多个工具（MMLU、HumanEval、GSM8K、安全、VLM）的 100 多个基准评估法学硕士。当需要在本地 Docker、Slurm HPC 或云平台上进行可扩展评估时使用。 NVIDIA 的企业级平台采用容器优先架构，可实现可重复的基准测试。

orchestra-research·nemo·evaluator·sdk

14安装·0热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill nemo-evaluator-sdk

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm