knowledge-distillation

Name: knowledge-distillation
Author: orchestra-research

✓

orchestra-research/ai-research-skills

ضغط نماذج اللغة الكبيرة باستخدام تقطير المعرفة من نماذج المعلم إلى الطلاب. يُستخدم عند نشر نماذج أصغر ذات أداء محتفظ به، أو نقل إمكانات GPT-4 إلى نماذج مفتوحة المصدر، أو تقليل تكاليف الاستدلال. يغطي قياس درجة الحرارة، والأهداف السهلة، وKLD العكسي، والتقطير اللوغاريتمي، واستراتيجيات تدريب MiniLLM.

orchestra-research·knowledge·distillation

42التثبيتات·1الرائج·@orchestra-research