optimizing-attention-flash

Name: optimizing-attention-flash
Author: orchestra-research

✓

フラッシュアテンションによりトランスアテンションを最適化し、2 ～ 4 倍のスピードアップと 10 ～ 20 倍のメモリ削減を実現します。長いシーケンス (>512 トークン) を使用してトランスフォーマーをトレーニング/実行する場合、GPU メモリの問題に注意が必要な場合、またはより高速な推論が必要な場合に使用します。 PyTorch ネイティブ SDPA、フラッシュ attn ライブラリ、H100 FP8、およびスライディングウィンドウアテンションをサポートします。

orchestra-research·optimizing·attention·flash

15インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill optimizing-attention-flash

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

optimizing-attention-flash

インストール

SKILL.md

引用可能な情報

クイックアンサー

optimizing-attention-flash とは？

optimizing-attention-flash のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills