speculative-decoding

Name: speculative-decoding
Author: orchestra-research

✓

Beschleunigen Sie die LLM-Inferenz durch spekulative Dekodierung, Medusa-Mehrfachköpfe und Lookahead-Dekodierungstechniken. Verwenden Sie diese Option, wenn Sie die Inferenzgeschwindigkeit optimieren (1,5- bis 3,6-fache Beschleunigung), die Latenz für Echtzeitanwendungen reduzieren oder Modelle mit begrenzter Rechenleistung bereitstellen. Behandelt Entwurfsmodelle, baumbasierte Aufmerksamkeit, Jacobi-Iteration, parallele Token-Generierung und Produktionsbereitstellungsstrategien.

orchestra-research·speculative·decoding

16Installationen·1Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill speculative-decoding

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

speculative-decoding

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist speculative-decoding?

Wie installiere ich speculative-decoding?

Wo ist das Quell-Repository?

Details

Verwandte Skills