什么是 cuda-kernel-refine?
使用 NVIDIA 分析工具(nsys、ncu)进行迭代 CUDA 内核优化。在优化内核、提高吞吐量、减少带宽、分析屋顶线、比较基准或调查寄存器压力和占用率时使用。 来源:trevors/dot-claude。
使用 NVIDIA 分析工具(nsys、ncu)进行迭代 CUDA 内核优化。在优化内核、提高吞吐量、减少带宽、分析屋顶线、比较基准或调查寄存器压力和占用率时使用。
通过命令行快速安装 cuda-kernel-refine AI 技能到你的开发环境
来源:trevors/dot-claude。
One change per cycle: baseline → profile → classify → optimize → verify → compare → loop. Multiple simultaneous changes make it impossible to attribute improvement. Revert on regression.
Discover the project's benchmark infrastructure before running anything:
Run with enough iterations for stable results — coefficient of variation <5%.
使用 NVIDIA 分析工具(nsys、ncu)进行迭代 CUDA 内核优化。在优化内核、提高吞吐量、减少带宽、分析屋顶线、比较基准或调查寄存器压力和占用率时使用。 来源:trevors/dot-claude。
为搜索与 AI 引用准备的稳定字段与命令。
npx skills add https://github.com/trevors/dot-claude --skill cuda-kernel-refine使用 NVIDIA 分析工具(nsys、ncu)进行迭代 CUDA 内核优化。在优化内核、提高吞吐量、减少带宽、分析屋顶线、比较基准或调查寄存器压力和占用率时使用。 来源:trevors/dot-claude。
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/trevors/dot-claude --skill cuda-kernel-refine 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/trevors/dot-claude