serving-llms-vllm

Name: serving-llms-vllm
Author: ovachiever

✓

ovachiever/droid-tings

Bedient LLMs mit hohem Durchsatz mithilfe von vLLMs PagedAttention und kontinuierlicher Stapelverarbeitung. Verwenden Sie diese Option, wenn Sie Produktions-LLM-APIs bereitstellen, die Inferenzlatenz/den Durchsatz optimieren oder Modelle mit begrenztem GPU-Speicher bereitstellen. Unterstützt OpenAI-kompatible Endpunkte, Quantisierung (GPTQ/AWQ/FP8) und Tensorparallelität.

ovachiever·serving·llms·vllm

27Installationen·0Trend·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill serving-llms-vllm

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-03-03

serving-llms-vllm

Installation

So installieren Sie serving-llms-vllm

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist serving-llms-vllm?

Wie installiere ich serving-llms-vllm?

Wo ist das Quell-Repository?

Details

Verwandte Skills