Что такое cuda-kernels?
Содержит рекомендации по написанию и тестированию оптимизированных ядер CUDA для графических процессоров NVIDIA (H100, A100, T4) с использованием библиотек диффузоров и преобразователей HuggingFace. Поддерживает такие модели, как LTX-Video, Stable Diffusion, LLaMA, Mistral и Qwen. Включает интеграцию с HuggingFace Kernels Hub (get_kernel) для загрузки предварительно скомпилированных ядер. Включает сценарии сравнительного тестирования для сравнения производительности ядра с базовыми реализациями. Источник: huggingface/kernels.