nemo-evaluator-sdk

Name: nemo-evaluator-sdk
Author: orchestra-research

✓

orchestra-research/ai-research-skills

Valuta LLM su oltre 100 benchmark da oltre 18 cablaggi (MMLU, HumanEval, GSM8K, sicurezza, VLM) con esecuzione multi-backend. Da utilizzare quando è necessaria una valutazione scalabile su Docker locale, Slurm HPC o piattaforme cloud. La piattaforma di livello aziendale di NVIDIA con architettura container-first per benchmark riproducibili.

orchestra-research·nemo·evaluator·sdk

37Installazioni·1Tendenza·@orchestra-research