optimizing-attention-flash

Name: optimizing-attention-flash
Author: ovachiever

✓

ovachiever/droid-tings

Оптимизирует внимание трансформера с помощью Flash Attention для ускорения в 2–4 раза и сокращения памяти в 10–20 раз. Используйте при обучении/запуске преобразователей с длинными последовательностями (>512 токенов), при возникновении проблем с памятью графического процессора или при необходимости более быстрого вывода. Поддерживает встроенный SDPA PyTorch, библиотеку flash-attn, H100 FP8 и внимание скользящего окна.

ovachiever·optimizing·attention·flash

27Установки·0Тренд·@ovachiever

Установка

$npx skills add https://github.com/ovachiever/droid-tings --skill optimizing-attention-flash

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-03-03

optimizing-attention-flash

Установка

Как установить optimizing-attention-flash

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое optimizing-attention-flash?

Как установить optimizing-attention-flash?

Где находится исходный репозиторий?

Детали

Похожие навыки