optimizing-attention-flash

Name: optimizing-attention-flash
Author: orchestra-research

✓

2~4배 속도 향상 및 10~20배 메모리 감소를 위한 Flash Attention으로 변환기 주의를 최적화합니다. 긴 시퀀스(512개 이상의 토큰)로 변환기를 훈련/실행하거나, GPU 메모리 문제가 주의 깊게 발생하거나, 더 빠른 추론이 필요한 경우에 사용합니다. PyTorch 기본 SDPA, 플래시 attn 라이브러리, H100 FP8 및 슬라이딩 윈도우 어텐션을 지원합니다.

orchestra-research·optimizing·attention·flash

16설치·1트렌드·@orchestra-research

설치

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill optimizing-attention-flash

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-11

optimizing-attention-flash

설치

SKILL.md

인용 가능한 정보

빠른 답변

optimizing-attention-flash이란?

optimizing-attention-flash 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills