Was ist langgraph-testing-evaluation?
Verwenden Sie diese Fertigkeit, wenn Sie LangGraph/LangChain-Agenten testen oder bewerten müssen: Unit- oder Integrationstests schreiben, Testgerüste generieren, LLM-/Tool-Verhalten verspotten, Trajektorienauswertung (Match oder LLM-as-Judge) durchführen, LangSmith-Datensatzauswertungen durchführen und zwei Agentenversionen mit einer Offline-Analyse im A/B-Stil vergleichen. Verwenden Sie es für Python- und JavaScript/TypeScript-Workflows, Evaluator-Design, Experiment-Setup, Regressions-Gates und das Debuggen unzuverlässiger/falscher Bewertungsergebnisse. Quelle: lubu-labs/langchain-agent-skills.