·nemo-evaluator

</>

nemo-evaluator

✓

在评估 LLM、运行 MMLU/HumanEval/GSM8K 等基准、设置评估管道或询问“NeMo Evaluator”、“LLM 基准测试”、“模型评估”、“MMLU”、“HumanEval”、“GSM8K”、“基准测试工具”时使用

eyadsibai·nemo·evaluator

22安装·1热度·@eyadsibai

安装

$npx skills add https://github.com/eyadsibai/ltk --skill nemo-evaluator

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-17

相关 Skills

agent-evaluation

context-optimization