langgraph-testing-evaluation이란?
LangGraph/LangChain 에이전트를 테스트하거나 평가해야 할 때 이 기술을 사용하십시오. 단위 또는 통합 테스트 작성, 테스트 스캐폴드 생성, LLM/도구 동작 모의, 궤적 평가 실행(일치 또는 LLM-판단), LangSmith 데이터 세트 평가 실행, A/B 스타일 오프라인 분석과 두 에이전트 버전 비교. Python 및 JavaScript/TypeScript 워크플로, 평가자 설계, 실험 설정, 회귀 게이트 및 불안정하거나 잘못된 평가 결과 디버깅에 사용하세요. 출처: lubu-labs/langchain-agent-skills.