·gguf-quantization

</>

gguf-quantization

✓

orchestra-research/ai-research-skills

GGUF 格式和 llama.cpp 量化可实现高效的 CPU/GPU 推理。在消费类硬件、Apple Silicon 上部署模型时，或者需要从 2-8 位进行灵活量化且无需 GPU 时使用。

orchestra-research·gguf·quantization

15安装·0热度·@orchestra-research

安装

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill gguf-quantization

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-11

相关 Skills

ml-paper-writing

serving-llms-vllm