Что такое langgraph-testing-evaluation?
Используйте этот навык, когда вам нужно протестировать или оценить агенты LangGraph/LangChain: написание модульных или интеграционных тестов, создание тестовых шаблонов, моделирование поведения LLM/инструмента, выполнение оценки траектории (сопоставление или LLM-как судья), выполнение оценок набора данных LangSmith и сравнение двух версий агента с помощью автономного анализа в стиле A/B. Используйте его для рабочих процессов Python и JavaScript/TypeScript, проектирования оценщиков, настройки экспериментов, ворот регрессии и отладки нестабильных/неправильных результатов оценки. Источник: lubu-labs/langchain-agent-skills.