speculative-decoding

Name: speculative-decoding
Author: orchestra-research

✓

投機的デコード、Medusa マルチヘッド、先読みデコード技術を使用して LLM 推論を高速化します。推論速度の最適化 (1.5 ～ 3.6 倍の高速化)、リアルタイムアプリケーションの遅延の削減、または限られたコンピューティングでモデルを展開する場合に使用します。ドラフトモデル、ツリーベースのアテンション、Jacobi 反復、並列トークン生成、および運用展開戦略について説明します。

orchestra-research·speculative·decoding

17インストール·1トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill speculative-decoding

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

speculative-decoding

インストール

SKILL.md

引用可能な情報

クイックアンサー

speculative-decoding とは？

speculative-decoding のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills