awq-quantization

Name: awq-quantization
Author: orchestra-research

✓

3배의 속도 향상과 최소한의 정확도 손실로 4비트 LLM 압축을 위한 활성화 인식 가중치 양자화입니다. 제한된 GPU 메모리에 대규모 모델(7B-70B)을 배포할 때, 더 나은 정확도 보존으로 GPTQ보다 빠른 추론이 필요한 경우 또는 명령 조정 및 다중 모드 모델에 사용합니다. MLSys 2024 최우수 논문상 수상자.

orchestra-research·awq·quantization

16설치·1트렌드·@orchestra-research

설치

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill awq-quantization

상세

카테고리: </>개발 도구
출처: skills.sh
최초 등록: 2026-02-11

awq-quantization

설치

SKILL.md

인용 가능한 정보

빠른 답변

awq-quantization이란?

awq-quantization 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills