serving-llms-vllm

Name: serving-llms-vllm
Author: ovachiever

✓

ovachiever/droid-tings

vLLM の PagedAttendance と連続バッチ処理を使用して、高スループットで LLM を提供します。実稼働 LLM API をデプロイする場合、推論レイテンシー/スループットを最適化する場合、または限られた GPU メモリでモデルを提供する場合に使用します。 OpenAI 互換エンドポイント、量子化 (GPTQ/AWQ/FP8)、テンソル並列処理をサポートします。

ovachiever·serving·llms·vllm

27インストール·0トレンド·@ovachiever

インストール

$npx skills add https://github.com/ovachiever/droid-tings --skill serving-llms-vllm

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-03-03

serving-llms-vllm

インストール

serving-llms-vllm のインストール方法

SKILL.md

引用可能な情報

クイックアンサー

serving-llms-vllm とは？

serving-llms-vllm のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills