什麼是 cuda-kernel-refine?
使用 NVIDIA 分析工具(nsys、ncu)進行迭代 CUDA 核心最佳化。在優化內核、提高吞吐量、減少頻寬、分析屋頂線、比較基准或調查寄存器壓力和占用率時使用。 來源:trevors/dot-claude。
使用 NVIDIA 分析工具(nsys、ncu)進行迭代 CUDA 核心最佳化。在優化內核、提高吞吐量、減少頻寬、分析屋頂線、比較基准或調查寄存器壓力和占用率時使用。
透過命令列快速安裝 cuda-kernel-refine AI 技能到你的開發環境
來源:trevors/dot-claude。
One change per cycle: baseline → profile → classify → optimize → verify → compare → loop. Multiple simultaneous changes make it impossible to attribute improvement. Revert on regression.
Discover the project's benchmark infrastructure before running anything:
Run with enough iterations for stable results — coefficient of variation <5%.
使用 NVIDIA 分析工具(nsys、ncu)進行迭代 CUDA 核心最佳化。在優化內核、提高吞吐量、減少頻寬、分析屋頂線、比較基准或調查寄存器壓力和占用率時使用。 來源:trevors/dot-claude。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/trevors/dot-claude --skill cuda-kernel-refine使用 NVIDIA 分析工具(nsys、ncu)進行迭代 CUDA 核心最佳化。在優化內核、提高吞吐量、減少頻寬、分析屋頂線、比較基准或調查寄存器壓力和占用率時使用。 來源:trevors/dot-claude。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/trevors/dot-claude --skill cuda-kernel-refine 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/trevors/dot-claude