high-performance-inference

Name: high-performance-inference
Author: yonatangross

Inferencia LLM de alto rendimiento con vLLM, cuantificación (AWQ, GPTQ, FP8), decodificación especulativa e implementación perimetral. Utilícelo para optimizar la latencia, el rendimiento o la memoria de inferencia.

cached·yonatangross·high·performance·inference

0Instalaciones·0Tendencia·@yonatangross

Instalación

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference

Detalles

Categoría: </>Desarrollo
Fuente: user
Primera vez visto: 2026-02-01

Skills Relacionados

high-performance-inference

Instalación

SKILL.md

Datos (listos para citar)

Respuestas rápidas

¿Qué es high-performance-inference?

¿Cómo instalo high-performance-inference?

¿Dónde está el repositorio de origen?

Detalles

Skills Relacionados