agent-evaluation

Name: agent-evaluation
Author: sebas-aikon-intelligence

✓

sebas-aikon-intelligence/antigravity-awesome-skills

Pruebas y evaluaciones comparativas de agentes LLM, incluidas pruebas de comportamiento, evaluación de capacidades, métricas de confiabilidad y monitoreo de producción, donde incluso los mejores agentes logran menos del 50 % en evaluaciones comparativas del mundo real. Úselo cuando: pruebas de agentes, evaluación de agentes, agentes comparativos, confiabilidad del agente, agente de prueba.

sebas-aikon-intelligence·agent·evaluation

3Instalaciones·0Tendencia·@sebas-aikon-intelligence