ما هي eval؟
EvalKit هو إطار عمل لتقييم المحادثة لوكلاء الذكاء الاصطناعي يرشدك خلال إنشاء تقييمات قوية باستخدام Strands Evals SDK. من خلال المحادثة الطبيعية، يمكنك تخطيط التقييمات وإنشاء بيانات الاختبار وتنفيذ التقييمات وتحليل النتائج. المصدر: mikeyobrien/ralph-orchestrator.