Qu'est-ce que cuda-kernel-refine ?
Optimisation itérative du noyau CUDA à l'aide des outils de profilage NVIDIA (nsys, ncu). À utiliser pour optimiser les noyaux, améliorer le débit, réduire la bande passante, analyser la ligne de toit, comparer des références ou enquêter sur la pression et l'occupation des registres. Source : trevors/dot-claude.