Frameworks and techniques for training and finetuning large language models.
| Framework | Best For | Multi-GPU | Memory Efficient |
| Accelerate | Simple distributed | Yes | Basic | | DeepSpeed | Large models, ZeRO | Yes | Excellent | | PyTorch Lightning | Clean training loops | Yes | Good | | Ray Train | Scalable, multi-node | Yes | Good | | TRL | RLHF, reward modeling | Yes | Good | | Unsloth | Fast LoRA finetuning | Limited | Excellent |
Используйте при «обучении LLM», «тонкой настройке», «RLHF», «распределенном обучении», «DeepSpeed», «Accelerate», «PyTorch Lightning», «Ray Train», «TRL», «Unsloth», «обучении LoRA», «вспышке внимания», «контрольной точке градиента». Источник: eyadsibai/ltk.