evaluating-code-models

Name: evaluating-code-models
Author: orchestra-research

✓

Bewertet Codegenerierungsmodelle in HumanEval, MBPP, MultiPL-E und mehr als 15 Benchmarks mit pass@k-Metriken. Verwenden Sie es zum Benchmarking von Codemodellen, zum Vergleichen von Codierungsfähigkeiten, zum Testen der Unterstützung mehrerer Sprachen oder zum Messen der Qualität der Codegenerierung. Industriestandard des BigCode-Projekts, der von HuggingFace-Bestenlisten verwendet wird.

orchestra-research·evaluating·code·models

15Installationen·0Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill evaluating-code-models

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

evaluating-code-models

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist evaluating-code-models?

Wie installiere ich evaluating-code-models?

Wo ist das Quell-Repository?

Details

Verwandte Skills