evaluating-code-models

Name: evaluating-code-models
Author: orchestra-research

✓

Évalue les modèles de génération de code sur HumanEval, MBPP, MultiPL-E et plus de 15 benchmarks avec les métriques pass@k. À utiliser pour évaluer des modèles de code, comparer les capacités de codage, tester la prise en charge multilingue ou mesurer la qualité de la génération de code. Norme industrielle du projet BigCode utilisée par les classements HuggingFace.

orchestra-research·evaluating·code·models

15Installations·0Tendance·@orchestra-research