optimizing-attention-flash

Name: optimizing-attention-flash
Author: orchestra-research

✓

orchestra-research/ai-research-skills

Оптимизирует внимание трансформера с помощью Flash Attention для ускорения в 2–4 раза и сокращения памяти в 10–20 раз. Используйте при обучении/запуске преобразователей с длинными последовательностями (>512 токенов), при возникновении проблем с памятью графического процессора или при необходимости более быстрого вывода. Поддерживает встроенный SDPA PyTorch, библиотеку flash-attn, H100 FP8 и внимание к скользящему окну.

orchestra-research·optimizing·attention·flash

39Установки·2Тренд·@orchestra-research

Установка

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill optimizing-attention-flash

Детали

Категория: </>Разработка
Источник: skills.sh
Впервые замечено: 2026-02-11

optimizing-attention-flash

Установка

Как установить optimizing-attention-flash

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое optimizing-attention-flash?

Как установить optimizing-attention-flash?

Где находится исходный репозиторий?

Детали

Похожие навыки