evaluating-code-models

Name: evaluating-code-models
Author: orchestra-research

✓

HumanEval、MBPP、MultiPL-E、および pass@k メトリクスを使用した 15 以上のベンチマークにわたるコード生成モデルを評価します。コードモデルのベンチマーク、コーディング能力の比較、多言語サポートのテスト、またはコード生成品質の測定を行う場合に使用します。 HuggingFace リーダーボードで使用される BigCode プロジェクトの業界標準。

orchestra-research·evaluating·code·models

15インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill evaluating-code-models

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

evaluating-code-models

インストール

SKILL.md

引用可能な情報

クイックアンサー

evaluating-code-models とは？

evaluating-code-models のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills