Purpose Provides expertise in monitoring, benchmarking, and optimizing AI agent performance. Specializes in token usage tracking, latency analysis, cost optimization, and implementing quality evaluation metrics (evals) for AI systems.
| No token tracking | Surprise costs | Instrument all calls | | Optimizing without evals | Quality regression | Measure before optimizing | | Average-only latency | Hides tail latency | Use percentiles | | No prompt versioning | Can't correlate changes | Version and track | | Ignoring caching | Repeated costs | Cache stable responses |
Эксперт в области наблюдения, сравнительного анализа и оптимизации агентов ИИ. Специализируется на отслеживании использования токенов, анализе задержек и показателях оценки качества. Используйте при оптимизации затрат на агентов, измерении производительности или внедрении оценок. Триггеры включают «производительность агента», «использование токена», «оптимизацию задержки», «оценку», «показатели агента», «оптимизацию затрат», «сравнительный анализ агента». Источник: 404kidwiz/claude-supercode-skills.