·quantizing-models-bitsandbytes

</>

quantizing-models-bitsandbytes

✓

orchestra-research/ai-research-skills

将 LLM 量化为 8 位或 4 位，可减少 50-75% 的内存，同时将精度损失降至最低。当 GPU 内存有限、需要适应更大的模型或想要更快的推理时使用。支持 INT8、NF4、FP4 格式、QLoRA 训练和 8 位优化器。与 HuggingFace 变形金刚一起使用。

orchestra-research·quantizing·models·bitsandbytes

15安装·0热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill quantizing-models-bitsandbytes

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm