tensorrt-llm

Name: tensorrt-llm
Author: ovachiever

✓

Optimiert die LLM-Inferenz mit NVIDIA TensorRT für maximalen Durchsatz und niedrigste Latenz. Verwenden Sie es für die Produktionsbereitstellung auf NVIDIA-GPUs (A100/H100), wenn Sie eine 10–100-mal schnellere Inferenz als PyTorch benötigen, oder für die Bereitstellung von Modellen mit Quantisierung (FP8/INT4), In-Flight-Batching und Multi-GPU-Skalierung.

ovachiever·tensorrt·llm

21Installationen·0Trend·@ovachiever

Installation

$npx skills add https://github.com/ovachiever/droid-tings --skill tensorrt-llm

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-01

tensorrt-llm

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist tensorrt-llm?

Wie installiere ich tensorrt-llm?

Wo ist das Quell-Repository?

Details

Verwandte Skills