Qu'est-ce que langgraph-testing-evaluation ?
Utilisez cette compétence lorsque vous devez tester ou évaluer des agents LangGraph/LangChain : écrire des tests unitaires ou d'intégration, générer des échafaudages de test, se moquer du comportement du LLM/outil, exécuter une évaluation de trajectoire (match ou LLM en tant que juge), exécuter des évaluations d'ensembles de données LangSmith et comparer deux versions d'agent avec une analyse hors ligne de style A/B. Utilisez-le pour les flux de travail Python et JavaScript/TypeScript, la conception d'évaluateurs, la configuration d'expériences, les portes de régression et le débogage des résultats d'évaluation irréguliers/incorrects. Source : lubu-labs/langchain-agent-skills.