nemo-evaluator-sdk

Name: nemo-evaluator-sdk
Author: orchestra-research

✓

Évalue les LLM sur plus de 100 références provenant de plus de 18 harnais (MMLU, HumanEval, GSM8K, sécurité, VLM) avec une exécution multi-backend. À utiliser lorsque vous avez besoin d'une évaluation évolutive sur des plates-formes locales Docker, Slurm HPC ou cloud. Plateforme d'entreprise de NVIDIA avec une architecture axée sur les conteneurs pour des analyses comparatives reproductibles.

orchestra-research·nemo·evaluator·sdk

14Installations·0Tendance·@orchestra-research