serving-llms-vllm

Name: serving-llms-vllm
Author: orchestra-research

✓

vLLM の PagedAttendance と連続バッチ処理を使用して、高スループットで LLM を提供します。実稼働 LLM API をデプロイする場合、推論レイテンシー/スループットを最適化する場合、または限られた GPU メモリでモデルを提供する場合に使用します。 OpenAI 互換エンドポイント、量子化 (GPTQ/AWQ/FP8)、テンソル並列処理をサポートします。

orchestra-research·serving·llms·vllm

17インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill serving-llms-vllm

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

serving-llms-vllm

インストール

SKILL.md

引用可能な情報

クイックアンサー

serving-llms-vllm とは？

serving-llms-vllm のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills