serving-llms-vllm

Name: serving-llms-vllm
Author: ovachiever

✓

ovachiever/droid-tings

Обслуживает LLM с высокой пропускной способностью, используя PagedAttention vLLM и непрерывную пакетную обработку. Используйте при развертывании производственных API-интерфейсов LLM, оптимизации задержки/пропускной способности вывода или обслуживания моделей с ограниченной памятью графического процессора. Поддерживает OpenAI-совместимые конечные точки, квантование (GPTQ/AWQ/FP8) и тензорный параллелизм.

ovachiever·serving·llms·vllm

27Установки·0Тренд·@ovachiever

Установка

$npx skills add https://github.com/ovachiever/droid-tings --skill serving-llms-vllm

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-03-03

serving-llms-vllm

Установка

Как установить serving-llms-vllm

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое serving-llms-vllm?

Как установить serving-llms-vllm?

Где находится исходный репозиторий?

Детали

Похожие навыки