¿Qué es langgraph-testing-evaluation?
Utilice esta habilidad cuando necesite probar o evaluar agentes LangGraph/LangChain: escribir pruebas unitarias o de integración, generar andamios de prueba, burlarse del comportamiento de herramientas/LLM, ejecutar evaluación de trayectoria (coincidencia o LLM como juez), ejecutar evaluaciones de conjuntos de datos LangSmith y comparar dos versiones de agentes con análisis fuera de línea de estilo A/B. Úselo para flujos de trabajo de Python y JavaScript/TypeScript, diseño de evaluadores, configuración de experimentos, puertas de regresión y depuración de resultados de evaluación incorrectos o incorrectos. Fuente: lubu-labs/langchain-agent-skills.