·tensorrt-llm

</>

tensorrt-llm

✓

ovachiever/droid-tings

使用 NVIDIA TensorRT 优化 LLM 推理，以实现最大吞吐量和最低延迟。当您需要比 PyTorch 快 10-100 倍的推理速度时，可用于 NVIDIA GPU (A100/H100) 上的生产部署，或者用于通过量化 (FP8/INT4)、动态批处理和多 GPU 扩展来服务模型。

ovachiever·tensorrt·llm

21安装·0热度·@ovachiever

安装

$npx skills add https://github.com/ovachiever/droid-tings --skill tensorrt-llm

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-01

相关 Skills

security-auditor

nextjs-shadcn-builder

threejs-graphics-optimizer

deep-reading-analyst

tailwind-v4-shadcn

react-hook-form-zod