Che cos'è cuda-kernel-refine?
Ottimizzazione iterativa del kernel CUDA utilizzando gli strumenti di profilazione NVIDIA (nsys, ncu). Da utilizzare durante l'ottimizzazione dei kernel, il miglioramento del throughput, la riduzione della larghezza di banda, l'analisi della linea del tetto, il confronto dei benchmark o l'analisi della pressione e dell'occupazione del registro. Fonte: trevors/dot-claude.