·high-performance-inference

</>

high-performance-inference

yonatangross/skillforge-claude-plugin

具有 vLLM、量化（AWQ、GPTQ、FP8）、推測解碼和邊緣部署的高性能 LLM 推理。在優化推理延遲、吞吐量或內存時使用。

cached·yonatangross·high·performance·inference

0安裝·0熱度·@yonatangross

安裝

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference

詳情

分類: </>開發工具
來源: user
收錄時間: 2026-02-01

相關 Skills

domain-driven-design

zustand-patterns

code-review-playbook