high-performance-inference

Name: high-performance-inference
Author: yonatangross

✓

Hochleistungs-LLM-Inferenz mit vLLM, Quantisierung (AWQ, GPTQ, FP8), spekulativer Dekodierung und Edge-Bereitstellung. Zur Optimierung der Inferenzlatenz, des Durchsatzes oder des Speichers.

yonatangross·high·performance·inference

12Installationen·0Trend·@yonatangross

Installation

$npx skills add https://github.com/yonatangross/orchestkit --skill high-performance-inference

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

high-performance-inference

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist high-performance-inference?

Wie installiere ich high-performance-inference?

Wo ist das Quell-Repository?

Details

Verwandte Skills