·high-performance-inference

</>

high-performance-inference

yonatangross/skillforge-claude-plugin

具有 vLLM、量化（AWQ、GPTQ、FP8）、推测解码和边缘部署的高性能 LLM 推理。在优化推理延迟、吞吐量或内存时使用。

cached·yonatangross·high·performance·inference

0安装·0热度·@yonatangross

安装

$npx skills add https://github.com/yonatangross/skillforge-claude-plugin --skill high-performance-inference

详情

分类: </>开发工具
来源: user
收录时间: 2026-02-01

相关 Skills

domain-driven-design

zustand-patterns

code-review-playbook