model-serving

Name: model-serving
Author: ancoleman

✓

Bereitstellung von LLM- und ML-Modellen für Inferenz. Verwenden Sie es, wenn Sie Modelle in der Produktion bereitstellen, KI-APIs erstellen oder Inferenz optimieren. Deckt vLLM (LLM-Bereitstellung), TensorRT-LLM (GPU-Optimierung), Ollama (lokal), BentoML (ML-Bereitstellung), Triton (Multi-Modell), LangChain (Orchestrierung), LlamaIndex (RAG) und Streaming-Muster ab.

ancoleman·model·serving

7Installationen·0Trend·@ancoleman

Installation

$npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

model-serving

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist model-serving?

Wie installiere ich model-serving?

Wo ist das Quell-Repository?

Details

Verwandte Skills