¿Qué es vllm-deployment?
Implemente vLLM para inferencia LLM de alto rendimiento. Cubre implementaciones de CPU/GPU de Docker y aprovisionamiento de VM en la nube con puntos finales API compatibles con OpenAI. Fuente: stakpak/community-paks.
Implemente vLLM para inferencia LLM de alto rendimiento. Cubre implementaciones de CPU/GPU de Docker y aprovisionamiento de VM en la nube con puntos finales API compatibles con OpenAI.
Instala rápidamente el skill de IA vllm-deployment en tu entorno de desarrollo mediante línea de comandos
Fuente: stakpak/community-paks.
| CPU | 2x model size | 4x model size | | GPU | Model size + 2GB | Model size + 4GB VRAM |
| VLLMCPUKVCACHESPACE | KV cache size in GB (CPU) | 4 | | VLLMCPUOMPTHREADSBIND | CPU core binding (CPU) | 0-7 | | CUDAVISIBLEDEVICES | GPU device selection | 0,1 | | HFTOKEN | HuggingFace authentication | hfxxx |
| --shm-size=4g | Shared memory for IPC | | --cap-add SYSNICE | NUMA optimization (CPU) | | --security-opt seccomp=unconfined | Memory policy syscalls (CPU) | | --gpus all | GPU access | | -p 8000:8000 | Port mapping |
Implemente vLLM para inferencia LLM de alto rendimiento. Cubre implementaciones de CPU/GPU de Docker y aprovisionamiento de VM en la nube con puntos finales API compatibles con OpenAI. Fuente: stakpak/community-paks.
Campos y comandos estables para citas de IA/búsqueda.
npx skills add https://github.com/stakpak/community-paks --skill vllm-deploymentImplemente vLLM para inferencia LLM de alto rendimiento. Cubre implementaciones de CPU/GPU de Docker y aprovisionamiento de VM en la nube con puntos finales API compatibles con OpenAI. Fuente: stakpak/community-paks.
Abre tu terminal o herramienta de línea de comandos (Terminal, iTerm, Windows Terminal, etc.) Copia y ejecuta este comando: npx skills add https://github.com/stakpak/community-paks --skill vllm-deployment Una vez instalado, el skill se configurará automáticamente en tu entorno de programación con IA y estará listo para usar en Claude Code, Cursor u OpenClaw
https://github.com/stakpak/community-paks