tensorrt-llm

Name: tensorrt-llm
Author: orchestra-research

✓

Optimiert die LLM-Inferenz mit NVIDIA TensorRT für maximalen Durchsatz und niedrigste Latenz. Verwenden Sie es für die Produktionsbereitstellung auf NVIDIA-GPUs (A100/H100), wenn Sie eine 10–100-mal schnellere Inferenz als PyTorch benötigen, oder für die Bereitstellung von Modellen mit Quantisierung (FP8/INT4), In-Flight-Batching und Multi-GPU-Skalierung.

orchestra-research·tensorrt·llm

18Installationen·1Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill tensorrt-llm

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

tensorrt-llm

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist tensorrt-llm?

Wie installiere ich tensorrt-llm?

Wo ist das Quell-Repository?

Details

Verwandte Skills