什麼是 langgraph-testing-evaluation?
當您需要測試或評估 LangGraph/LangChain 代理程式時,請使用此技能:編寫單元或整合測試、產生測試腳手架、模擬 LLM/工具行為、運行軌跡評估(匹配或 LLM 作為判斷)、執行 LangSmith 資料集評估以及使用 A/B 式離線分析比較兩個代理版本。將其用於 Python 和 JavaScript/TypeScript 工作流程、評估器設計、實驗設定、回歸閘門以及調試不穩定/不正確的評估結果。 來源:lubu-labs/langchain-agent-skills。