gguf-quantization

Name: gguf-quantization
Author: orchestra-research

✓

orchestra-research/ai-research-skills

تنسيق GGUF وتكميم llama.cpp لاستدلال وحدة المعالجة المركزية/وحدة معالجة الرسومات بكفاءة. يُستخدم عند نشر النماذج على الأجهزة الاستهلاكية، أو Apple Silicon، أو عند الحاجة إلى تكميم مرن من 2 إلى 8 بت دون متطلبات وحدة معالجة الرسومات.

orchestra-research·gguf·quantization

40التثبيتات·2الرائج·@orchestra-research