ما هي llm-evaluation؟
تنفيذ استراتيجيات تقييم شاملة لتطبيقات LLM باستخدام المقاييس الآلية، وردود الفعل البشرية، والمعايير. يُستخدم عند اختبار أداء LLM، أو قياس جودة تطبيقات الذكاء الاصطناعي، أو إنشاء أطر التقييم. المصدر: sickn33/antigravity-awesome-skills.