Что такое ai-evals?
Помогите пользователям создавать и проводить оценки ИИ. Используйте, когда кто-то создает оценки для продуктов LLM, измеряет качество модели, создает тестовые примеры, разрабатывает критерии или пытается систематически измерять качество результатов ИИ. Источник: refoundai/lenny-skills.