·gguf-quantization

</>

gguf-quantization

✓

orchestra-research/ai-research-skills

GGUF 形式と llama.cpp 量子化による効率的な CPU/GPU 推論。消費者向けハードウェアや Apple Silicon にモデルをデプロイする場合、または GPU を必要とせずに 2 ～ 8 ビットの柔軟な量子化が必要な場合に使用します。

orchestra-research·gguf·quantization

15インストール·0トレンド·@orchestra-research

インストール

$npx skills add https://github.com/orchestra-research/ai-research-skills --skill gguf-quantization

詳細

カテゴリ: </>開発ツール
ソース: skills.sh
初回登録: 2026-02-11

関連 Skills

ml-paper-writing

41 インストール

18 インストール

18 インストール

17 インストール

serving-llms-vllm

17 インストール

17 インストール