Expert GPU optimization for consumer GPUs with 8–24GB VRAM. Evidence-based patterns only.
| GPU model | (e.g., RTX 4080 Mobile, RTX 3090, RTX 4090) | | VRAM | (e.g., 12GB, 16GB, 24GB) | | CUDA version | (nvidia-smi → top-right) | | TDP / power limit | (laptop vs desktop affects sustained throughput) | | Driver version | (nvidia-smi → top-left) |
Key constraint: VRAM capacity determines which strategies apply. Patterns below are annotated with minimum VRAM requirements where relevant.
최신 소비자 GPU(8~24GB VRAM)를 위한 전문적인 GPU 최적화. GPU 교육 최적화, CUDA 코드 속도 향상, OOM 오류 감소, GPU용 XGBoost 조정, NumPy를 CuPy로 마이그레이션, 모델 속도 향상, GPU 메모리 관리, VRAM 사용 최적화 또는 PyTorch 벤치마킹이 필요할 때 이 기술을 사용하세요. 혼합 정밀도, 그래디언트 체크포인트, XGBoost GPU 가속, CuPy/cuDF 마이그레이션, 벡터화, torch.compile 및 진단을 다룹니다. NVIDIA GPU만 해당. PyTorch, XGBoost 및 RAPIDS 프레임워크. 출처: mathews-tom/praxis-skills.