什么是 langgraph-testing-evaluation?
当您需要测试或评估 LangGraph/LangChain 代理时,请使用此技能:编写单元或集成测试、生成测试脚手架、模拟 LLM/工具行为、运行轨迹评估(匹配或 LLM 作为判断)、运行 LangSmith 数据集评估以及使用 A/B 式离线分析比较两个代理版本。将其用于 Python 和 JavaScript/TypeScript 工作流程、评估器设计、实验设置、回归门以及调试不稳定/不正确的评估结果。 来源:lubu-labs/langchain-agent-skills。