·quantizing-models-bitsandbytes

</>

quantizing-models-bitsandbytes

✓

ovachiever/droid-tings

将 LLM 量化为 8 位或 4 位，可减少 50-75% 的内存，同时将精度损失降至最低。当 GPU 内存有限、需要适应更大的模型或想要更快的推理时使用。支持 INT8、NF4、FP4 格式、QLoRA 训练和 8 位优化器。与 HuggingFace 变形金刚一起使用。

ovachiever·quantizing·models·bitsandbytes

28安装·0热度·@ovachiever

安装

$npx skills add https://github.com/ovachiever/droid-tings --skill quantizing-models-bitsandbytes

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-03-03

相关 Skills

security-auditor

react-hook-form-zod

nextjs-shadcn-builder

deep-reading-analyst

react-native-expo

threejs-graphics-optimizer