optimizing-attention-flash

Name: optimizing-attention-flash
Author: ovachiever

✓

ovachiever/droid-tings

2~4배 속도 향상 및 10~20배 메모리 감소를 위한 Flash Attention으로 변환기 주의를 최적화합니다. 긴 시퀀스(512개 이상의 토큰)로 변환기를 훈련/실행하거나 GPU 메모리 문제가 주의를 끌거나 더 빠른 추론이 필요한 경우에 사용합니다. PyTorch 기본 SDPA, 플래시 attn 라이브러리, H100 FP8 및 슬라이딩 윈도우 어텐션을 지원합니다.

ovachiever·optimizing·attention·flash

27설치·0트렌드·@ovachiever

설치

$npx skills add https://github.com/ovachiever/droid-tings --skill optimizing-attention-flash

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-03-03

optimizing-attention-flash

설치

optimizing-attention-flash 설치 방법

SKILL.md

인용 가능한 정보

빠른 답변

optimizing-attention-flash이란?

optimizing-attention-flash 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills