Che cos'è qlora?
Ottimizzazione efficiente della memoria con quantizzazione a 4 bit e adattatori LoRA. Da utilizzare per la messa a punto di modelli di grandi dimensioni (7B+) su GPU consumer, quando la VRAM è limitata o quando LoRA standard supera ancora la memoria. Si basa sull'abilità Lora. Fonte: itsmostafa/llm-engineering-skills.