tensorrt-llm

Name: tensorrt-llm
Author: orchestra-research

✓

orchestra-research/ai-research-skills

يعمل على تحسين استدلال LLM باستخدام NVIDIA TensorRT لتحقيق أقصى قدر من الإنتاجية وأقل زمن وصول. يُستخدم لنشر الإنتاج على وحدات معالجة الرسومات NVIDIA (A100/H100)، عندما تحتاج إلى استدلال أسرع بمقدار 10-100 مرة من PyTorch، أو لخدمة النماذج مع التكميم (FP8/INT4)، والتجميع على متن الطائرة، وتوسيع نطاق وحدات معالجة الرسومات المتعددة.

orchestra-research·tensorrt·llm

48التثبيتات·2الرائج·@orchestra-research