cuda-kernels
✓提供針對 HuggingFace 擴散器和變壓器庫的 NVIDIA GPU(H100、A100、T4)編寫和基準測試優化 CUDA 核心的指南。支援 LTX-Video、Stable Diffusion、LLaMA、Mistral 和 Qwen 等模型。包括與 HuggingFace Kernels Hub (get_kernel) 的集成,用於載入預先編譯的核心。包括基準測試腳本,用於將核心效能與基準實作進行比較。
SKILL.md
This skill provides patterns and guidance for developing optimized CUDA kernels targeting NVIDIA GPUs (H100, A100, T4) for use with HuggingFace diffusers and transformers libraries.
Load pre-compiled kernels from HuggingFace Hub (no local compilation):
| diffusers | LTX-Video, Stable Diffusion, FLUX, DiT | RMSNorm, GEGLU, RoPE, AdaLN | | transformers | LLaMA, Mistral, Qwen, Falcon | RMSNorm, Attention |
提供針對 HuggingFace 擴散器和變壓器庫的 NVIDIA GPU(H100、A100、T4)編寫和基準測試優化 CUDA 核心的指南。支援 LTX-Video、Stable Diffusion、LLaMA、Mistral 和 Qwen 等模型。包括與 HuggingFace Kernels Hub (get_kernel) 的集成,用於載入預先編譯的核心。包括基準測試腳本,用於將核心效能與基準實作進行比較。 來源:huggingface/kernels。
可引用資訊
為搜尋與 AI 引用準備的穩定欄位與指令。
- 安裝指令
npx skills add https://github.com/huggingface/kernels --skill cuda-kernels- 分類
- *創意媒體
- 認證
- ✓
- 收錄時間
- 2026-02-17
- 更新時間
- 2026-02-18
快速解答
什麼是 cuda-kernels?
提供針對 HuggingFace 擴散器和變壓器庫的 NVIDIA GPU(H100、A100、T4)編寫和基準測試優化 CUDA 核心的指南。支援 LTX-Video、Stable Diffusion、LLaMA、Mistral 和 Qwen 等模型。包括與 HuggingFace Kernels Hub (get_kernel) 的集成,用於載入預先編譯的核心。包括基準測試腳本,用於將核心效能與基準實作進行比較。 來源:huggingface/kernels。
如何安裝 cuda-kernels?
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/huggingface/kernels --skill cuda-kernels 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code 或 Cursor 中使用
這個 Skill 的原始碼在哪?
https://github.com/huggingface/kernels
詳情
- 分類
- *創意媒體
- 來源
- skills.sh
- 收錄時間
- 2026-02-17