evaluating-code-models

Name: evaluating-code-models
Author: orchestra-research

✓

Evalúa modelos de generación de código en HumanEval, MBPP, MultiPL-E y más de 15 puntos de referencia con métricas pass@k. Úselo para comparar modelos de código, comparar capacidades de codificación, probar la compatibilidad con varios idiomas o medir la calidad de la generación de código. Estándar de la industria del Proyecto BigCode utilizado por las tablas de clasificación de HuggingFace.

orchestra-research·evaluating·code·models

15Instalaciones·0Tendencia·@orchestra-research