agent-evaluation

Name: agent-evaluation
Author: sebas-aikon-intelligence

✓

sebas-aikon-intelligence/antigravity-awesome-skills

Test et analyse comparative des agents LLM, y compris les tests comportementaux, l'évaluation des capacités, les mesures de fiabilité et la surveillance de la production, où même les meilleurs agents obtiennent moins de 50 % sur les références du monde réel. À utiliser dans les cas suivants : test d'agent, évaluation d'agent, agents de référence, fiabilité d'agent, agent de test.

sebas-aikon-intelligence·agent·evaluation

3Installations·0Tendance·@sebas-aikon-intelligence