awq-quantization

Name: awq-quantization
Author: orchestra-research

✓

アクティベーションを意識した重み量子化による 4 ビット LLM 圧縮により、3 倍のスピードアップと最小限の精度損失が実現します。限られた GPU メモリに大規模なモデル (7B ～ 70B) をデプロイする場合、精度を維持しながら GPTQ よりも高速な推論が必要な場合、または命令調整されたマルチモーダルモデルに使用します。 MLSys 2024 Best Paper Award受賞。

orchestra-research·awq·quantization

15インストール·1トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill awq-quantization

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

awq-quantization

インストール

SKILL.md

引用可能な情報

クイックアンサー

awq-quantization とは？

awq-quantization のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills