·knowledge-distillation

</>

knowledge-distillation

✓

orchestra-research/ai-research-skills

使用從教師模型到學生模型的知識蒸餾來壓縮大型語言模型。在部署保留效能的較小模型、將 GPT-4 功能轉移到開源模型或降低推理成本時使用。涵蓋溫度縮放、軟目標、反向 KLD、logit 蒸餾和 MiniLLM 訓練策略。

orchestra-research·knowledge·distillation

16安裝·1熱度·@orchestra-research

安裝

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill knowledge-distillation

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-11

相關 Skills

ml-paper-writing

serving-llms-vllm