awq-quantization

Name: awq-quantization
Author: orchestra-research

✓

Aktivierungsbewusste Gewichtsquantisierung für 4-Bit-LLM-Komprimierung mit 3-facher Beschleunigung und minimalem Genauigkeitsverlust. Verwenden Sie diese Option, wenn Sie große Modelle (7B-70B) auf begrenztem GPU-Speicher bereitstellen, wenn Sie eine schnellere Inferenz als GPTQ mit besserer Genauigkeitserhaltung benötigen, oder für anweisungsabgestimmte und multimodale Modelle. Gewinner des MLSys 2024 Best Paper Award.

orchestra-research·awq·quantization

15Installationen·1Trend·@orchestra-research

Installation

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill awq-quantization

Details

Kategorie: </>Entwicklung
Quelle: skills.sh
Erstes Auftreten: 2026-02-11

awq-quantization

Installation

SKILL.md

Fakten (zitierbereit)

Schnelle Antworten

Was ist awq-quantization?

Wie installiere ich awq-quantization?

Wo ist das Quell-Repository?

Details

Verwandte Skills