serving-llms-vllm

Name: serving-llms-vllm
Author: orchestra-research

Что такое serving-llms-vllm?

Обслуживает LLM с высокой пропускной способностью, используя PagedAttention vLLM и непрерывную пакетную обработку. Используйте при развертывании производственных API-интерфейсов LLM, оптимизации задержки/пропускной способности вывода или обслуживания моделей с ограниченной памятью графического процессора. Поддерживает OpenAI-совместимые конечные точки, квантование (GPTQ/AWQ/FP8) и тензорный параллелизм. Источник: orchestra-research/ai-research-skills.

Как установить serving-llms-vllm?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill serving-llms-vllm После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Установка

Детали

Похожие навыки

serving-llms-vllm

Установка

Как установить serving-llms-vllm

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое serving-llms-vllm?

Как установить serving-llms-vllm?

Где находится исходный репозиторий?

Детали

Похожие навыки