Comment installer evaluating-llms-harness ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/ovachiever/droid-tings --skill evaluating-llms-harness Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

·evaluating-llms-harness

</>

evaluating-llms-harness

Name: evaluating-llms-harness
Author: ovachiever

✓

ovachiever/droid-tings

Évalue les LLM sur plus de 60 références académiques (MMLU, HumanEval, GSM8K, TruthfulQA, HellaSwag). À utiliser pour évaluer la qualité des modèles, comparer des modèles, rapporter des résultats académiques ou suivre les progrès de la formation. Norme industrielle utilisée par EleutherAI, HuggingFace et les principaux laboratoires. Prend en charge HuggingFace, vLLM et les API.

ovachiever·evaluating·llms·harness

26Installations·0Tendance·@ovachiever