·speculative-decoding

</>

speculative-decoding

✓

orchestra-research/ai-research-skills

使用推測性解碼、Medusa 多頭和前瞻解碼技術加速 LLM 推理。在優化推理速度（1.5-3.6 倍加速）、減少即時應用程式的延遲或部署計算有限的模型時使用。涵蓋草稿模型、基於樹的注意力、雅可比迭代、平行令牌產生和生產部署策略。

orchestra-research·speculative·decoding

16安裝·1熱度·@orchestra-research

安裝

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill speculative-decoding

詳情

分類: </>開發工具
來源: skills.sh
收錄時間: 2026-02-11

相關 Skills

ml-paper-writing

serving-llms-vllm