awq-quantization

Name: awq-quantization
Author: orchestra-research

Что такое awq-quantization?

Весовое квантование с учетом активации для 4-битного LLM-сжатия с трехкратным ускорением и минимальной потерей точности. Используйте при развертывании больших моделей (7B–70B) на ограниченной памяти графического процессора, когда вам нужен более быстрый вывод, чем GPTQ, с лучшим сохранением точности, или для настраиваемых инструкций и мультимодальных моделей. Победитель премии MLSys за лучшую бумагу 2024 года. Источник: orchestra-research/ai-research-skills.

Как установить awq-quantization?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/orchestra-research/ai-research-skills --skill awq-quantization После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/orchestra-research/ai-research-skills

Установка

Детали

Похожие навыки

awq-quantization

Установка

Как установить awq-quantization

SKILL.md

Факты (для цитирования)

Короткие ответы

Что такое awq-quantization?

Как установить awq-quantization?

Где находится исходный репозиторий?

Детали

Похожие навыки