·evaluating-llms

</>

evaluating-llms

✓

ancoleman/ai-design-components

自動化されたメトリクス、LLM-as-judge、ベンチマークを使用して LLM システムを評価します。プロンプト品質のテスト、RAG パイプラインの検証、安全性 (幻覚、偏見) の測定、または実稼働展開用のモデルの比較を行う場合に使用します。

ancoleman·evaluating·llms

7インストール·0トレンド·@ancoleman

インストール

$npx skills add https://github.com/ancoleman/ai-design-components --skill evaluating-llms

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-01

関連 Skills

implementing-drag-drop

51 インストール

creating-dashboards

36 インストール

administering-linux

30 インストール

securing-authentication

17 インストール

16 インストール

designing-layouts

16 インストール