什么是 gpu-optimizer?
针对现代消费类 GPU(8-24GB VRAM)的专家 GPU 优化。当您需要优化 GPU 训练、加速 CUDA 代码、减少 OOM 错误、调整 GPU 的 XGBoost、将 NumPy 迁移到 CuPy、使模型更快、管理 GPU 内存、优化 VRAM 使用或对 PyTorch 进行基准测试时,请使用此技能。涵盖混合精度、梯度检查点、XGBoost GPU 加速、CuPy/cuDF 迁移、矢量化、torch.compile 和诊断。仅限 NVIDIA GPU。 PyTorch、XGBoost 和 RAPIDS 框架。 来源:mathews-tom/praxis-skills。