langgraph-testing-evaluation

Name: langgraph-testing-evaluation
Author: lubu-labs

✓

lubu-labs/langchain-agent-skills

Utilizza questa competenza quando devi testare o valutare gli agenti LangGraph/LangChain: scrivere test di unità o di integrazione, generare scaffold di test, simulare il comportamento di LLM/strumenti, eseguire valutazioni di traiettorie (corrispondenza o LLM-as-judge), eseguire valutazioni di set di dati LangSmith e confrontare due versioni di agenti con analisi offline in stile A/B. Usalo per flussi di lavoro Python e JavaScript/TypeScript, progettazione di valutatori, configurazione di esperimenti, porte di regressione e debug di risultati di valutazione instabili/errati.

lubu-labs·langgraph·testing·evaluation

16Installazioni·3Tendenza·@lubu-labs