tensorrt-llm
✓NVIDIA TensorRT を使用して LLM 推論を最適化し、最大のスループットと最小のレイテンシを実現します。 PyTorch よりも 10 ~ 100 倍高速な推論が必要な場合、または量子化 (FP8/INT4)、インフライト バッチ処理、およびマルチ GPU スケーリングを使用したモデルの提供に使用する場合、NVIDIA GPU (A100/H100) での運用環境のデプロイメントに使用します。
SKILL.md
NVIDIA's open-source library for optimizing LLM inference with state-of-the-art performance on NVIDIA GPUs.
NVIDIA TensorRT を使用して LLM 推論を最適化し、最大のスループットと最小のレイテンシを実現します。 PyTorch よりも 10 ~ 100 倍高速な推論が必要な場合、または量子化 (FP8/INT4)、インフライト バッチ処理、およびマルチ GPU スケーリングを使用したモデルの提供に使用する場合、NVIDIA GPU (A100/H100) での運用環境のデプロイメントに使用します。 ソース: orchestra-research/ai-research-skills。
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill tensorrt-llm インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
安全認証済み、信頼性の高いコード ワンクリックインストール、簡単設定 Claude Code、Cursor などに対応
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/orchestra-research/ai-research-skills --skill tensorrt-llm- カテゴリ
- </>開発ツール
- 認証済み
- ✓
- 初回登録
- 2026-02-11
- 更新日
- 2026-02-18
クイックアンサー
tensorrt-llm とは?
NVIDIA TensorRT を使用して LLM 推論を最適化し、最大のスループットと最小のレイテンシを実現します。 PyTorch よりも 10 ~ 100 倍高速な推論が必要な場合、または量子化 (FP8/INT4)、インフライト バッチ処理、およびマルチ GPU スケーリングを使用したモデルの提供に使用する場合、NVIDIA GPU (A100/H100) での運用環境のデプロイメントに使用します。 ソース: orchestra-research/ai-research-skills。
tensorrt-llm のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/orchestra-research/ai-research-skills --skill tensorrt-llm インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/orchestra-research/ai-research-skills
詳細
- カテゴリ
- </>開発ツール
- ソース
- skills.sh
- 初回登録
- 2026-02-11