high-performance-inference

Name: high-performance-inference
Author: yonatangross

✓

yonatangross/orchestkit

Высокопроизводительный вывод LLM с помощью vLLM, квантования (AWQ, GPTQ, FP8), спекулятивного декодирования и периферийного развертывания. Используйте при оптимизации задержки вывода, пропускной способности или памяти.

yonatangross·high·performance·inference

11Установки·0Тренд·@yonatangross

Установка

$npx skills add https://github.com/yonatangross/orchestkit --skill high-performance-inference

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-02-01

high-performance-inference

Установка

Как установить high-performance-inference

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое high-performance-inference?

Как установить high-performance-inference?

Где находится исходный репозиторий?

Детали

Похожие навыки