high-performance-inference

Name: high-performance-inference
Author: yonatangross

Что такое high-performance-inference?

Высокопроизводительный вывод LLM с помощью vLLM, квантования (AWQ, GPTQ, FP8), спекулятивного декодирования и периферийного развертывания. Используйте при оптимизации задержки вывода, пропускной способности или памяти. Источник: yonatangross/skillforge-claude-plugin.

Как установить high-performance-inference?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/yonatangross/skillforge-claude-plugin

Установка

Детали

Похожие навыки

high-performance-inference

Установка

Как установить high-performance-inference

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое high-performance-inference?

Как установить high-performance-inference?

Где находится исходный репозиторий?

Детали

Похожие навыки