nemo-evaluator-sdk

Name: nemo-evaluator-sdk
Author: orchestra-research

✓

orchestra-research/ai-research-skills

يقوم بتقييم LLMs عبر أكثر من 100 معيار مرجعي من أكثر من 18 أداة (MMLU، وHumanEval، وGSM8K، وsafety، وVLM) مع تنفيذ متعدد الخلفيات. يُستخدم عند الحاجة إلى تقييم قابل للتطوير على منصات Docker المحلية أو Slurm HPC أو الأنظمة الأساسية السحابية. منصة NVIDIA على مستوى المؤسسات مع بنية الحاوية الأولى لقياس الأداء القابل للتكرار.

orchestra-research·nemo·evaluator·sdk

37التثبيتات·1الرائج·@orchestra-research