high-performance-inference

Name: high-performance-inference
Author: yonatangross

✓

yonatangross/skillforge-claude-plugin

Inferenza LLM ad alte prestazioni con vLLM, quantizzazione (AWQ, GPTQ, FP8), decodifica speculativa e distribuzione edge. Da utilizzare per ottimizzare la latenza di inferenza, la velocità effettiva o la memoria.

yonatangross·high·performance·inference

4Installazioni·0Tendenza·@yonatangross

Installazione

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference

Dettagli

Categoria: </>Sviluppo
Fonte: skills.sh
Prima apparizione: 2026-02-01

Skills correlate

zustand-patterns

31 Installazioni

architecture-decision-record

high-performance-inference

Installazione

Come installare high-performance-inference

SKILL.md

Fatti (pronti per citazione)

Risposte rapide

Che cos'è high-performance-inference?

Come installo high-performance-inference?

Dov'è il repository sorgente?

Dettagli

Skills correlate