evaluating-llms

Name: evaluating-llms
Author: ancoleman

✓

Evaluate LLM systems using automated metrics, LLM-as-judge, and benchmarks. Use when testing prompt quality, validating RAG pipelines, measuring safety (hallucinations, bias), or comparing models for production deployment.

ancoleman·evaluating·llms

7Installs·0Trend·@ancoleman

Installation

$npx skills add https://github.com/ancoleman/ai-design-components --skill evaluating-llms

Details

Category: </>Dev Tools
Source: skills.sh
First Seen: 2026-02-01

Related Skills

implementing-drag-drop

securing-authentication

evaluating-llms

Installation

SKILL.md

Facts (cite-ready)

Quick answers

What is evaluating-llms?

How do I install evaluating-llms?

Where is the source repository?

Details

Related Skills