Che cos'è langgraph-testing-evaluation?
Utilizza questa competenza quando devi testare o valutare gli agenti LangGraph/LangChain: scrivere test di unità o di integrazione, generare scaffold di test, simulare il comportamento di LLM/strumenti, eseguire valutazioni di traiettorie (corrispondenza o LLM-as-judge), eseguire valutazioni di set di dati LangSmith e confrontare due versioni di agenti con analisi offline in stile A/B. Usalo per flussi di lavoro Python e JavaScript/TypeScript, progettazione di valutatori, configurazione di esperimenti, porte di regressione e debug di risultati di valutazione instabili/errati. Fonte: lubu-labs/langchain-agent-skills.