speculative-decoding

Name: speculative-decoding
Author: ovachiever

✓

Beschleunigen Sie die LLM-Inferenz durch spekulative Dekodierung, Medusa-Mehrfachköpfe und Lookahead-Dekodierungstechniken. Verwenden Sie diese Option, wenn Sie die Inferenzgeschwindigkeit optimieren (1,5- bis 3,6-fache Beschleunigung), die Latenz für Echtzeitanwendungen reduzieren oder Modelle mit begrenzter Rechenleistung bereitstellen. Behandelt Entwurfsmodelle, baumbasierte Aufmerksamkeit, Jacobi-Iteration, parallele Token-Generierung und Produktionsbereitstellungsstrategien.

ovachiever·speculative·decoding

21Installationen·0Trend·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill speculative-decoding

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

speculative-decoding

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist speculative-decoding?

Wie installiere ich speculative-decoding?

Wo ist das Quell-Repository?

Details

Verwandte Skills