qlora
✓通过 4 位量化和 LoRA 适配器进行内存高效微调。当在消费类 GPU 上微调大型模型 (7B+)、VRAM 有限或标准 LoRA 仍超出内存时使用。以劳拉技能为基础。
SKILL.md
QLoRA enables fine-tuning of large language models on consumer GPUs by combining 4-bit quantization with LoRA adapters. A 65B model can be fine-tuned on a single 48GB GPU while matching 16-bit fine-tuning performance.
Prerequisites: This skill assumes familiarity with LoRA. See the lora skill for LoRA fundamentals (LoraConfig, targetmodules, training patterns).
QLoRA introduces three techniques that reduce memory usage without sacrificing performance:
通过 4 位量化和 LoRA 适配器进行内存高效微调。当在消费类 GPU 上微调大型模型 (7B+)、VRAM 有限或标准 LoRA 仍超出内存时使用。以劳拉技能为基础。 来源:itsmostafa/llm-engineering-skills。
可引用信息
为搜索与 AI 引用准备的稳定字段与命令。
- 安装命令
npx skills add https://github.com/itsmostafa/llm-engineering-skills --skill qlora- 分类
- </>开发工具
- 认证
- ✓
- 收录时间
- 2026-02-11
- 更新时间
- 2026-02-18
快速解答
什么是 qlora?
通过 4 位量化和 LoRA 适配器进行内存高效微调。当在消费类 GPU 上微调大型模型 (7B+)、VRAM 有限或标准 LoRA 仍超出内存时使用。以劳拉技能为基础。 来源:itsmostafa/llm-engineering-skills。
如何安装 qlora?
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/itsmostafa/llm-engineering-skills --skill qlora 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用
这个 Skill 的源码在哪?
https://github.com/itsmostafa/llm-engineering-skills
详情
- 分类
- </>开发工具
- 来源
- skills.sh
- 收录时间
- 2026-02-11