·high-performance-inference

</>

high-performance-inference

yonatangross/skillforge-claude-plugin

vLLM による高性能 LLM 推論、量子化 (AWQ、GPTQ、FP8)、投機的デコード、エッジ展開。推論レイテンシ、スループット、またはメモリを最適化する場合に使用します。

cached·yonatangross·high·performance·inference

0インストール·0トレンド·@yonatangross

インストール

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference

詳細

カテゴリ: </>開発ツール
ソース: user
初回登録: 2026-02-01

関連 Skills

domain-driven-design

10 インストール

zustand-patterns

9 インストール

8 インストール

code-review-playbook

8 インストール

8 インストール

8 インストール