·evaluating-skills-with-models
</>

evaluating-skills-with-models

taisukeoe/agentic-ai-skills-creator

サブエージェントを使用してソネット、作品、俳句モデル全体でスキルを実行することでスキルを評価します。スキルが正しく動作するかどうかをテストする場合、モデルのパフォーマンスを比較する場合、または互換性のある最も安価なモデルを見つける場合に使用します。モデルの機能を区別するために数値スコア (0 ~ 100) を返します。

9インストール·0トレンド·@taisukeoe

インストール

$npx skills add https://github.com/taisukeoe/agentic-ai-skills-creator --skill evaluating-skills-with-models

SKILL.md

Evaluate skills across multiple Claude models using sub-agents with quality-based scoring.

Binary pass/fail ("did it do X?") fails to differentiate models - all models can "do the steps." The difference is how well they do them. This skill uses weighted scoring to reveal capability differences.

Default to difficult scenarios: When multiple scenarios exist, prioritize Hard or Medium difficulty scenarios for evaluation. Easy scenarios often don't show meaningful differences between models and aren't realistic for production use.

サブエージェントを使用してソネット、作品、俳句モデル全体でスキルを実行することでスキルを評価します。スキルが正しく動作するかどうかをテストする場合、モデルのパフォーマンスを比較する場合、または互換性のある最も安価なモデルを見つける場合に使用します。モデルの機能を区別するために数値スコア (0 ~ 100) を返します。 ソース: taisukeoe/agentic-ai-skills-creator。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/taisukeoe/agentic-ai-skills-creator --skill evaluating-skills-with-models
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

evaluating-skills-with-models とは?

サブエージェントを使用してソネット、作品、俳句モデル全体でスキルを実行することでスキルを評価します。スキルが正しく動作するかどうかをテストする場合、モデルのパフォーマンスを比較する場合、または互換性のある最も安価なモデルを見つける場合に使用します。モデルの機能を区別するために数値スコア (0 ~ 100) を返します。 ソース: taisukeoe/agentic-ai-skills-creator。

evaluating-skills-with-models のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/taisukeoe/agentic-ai-skills-creator --skill evaluating-skills-with-models インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/taisukeoe/agentic-ai-skills-creator