high-performance-inference

Name: high-performance-inference
Author: yonatangross

✓

yonatangross/orchestkit

استدلال LLM عالي الأداء باستخدام vLLM، والتكميم (AWQ، وGPTQ، وFP8)، وفك تشفير المضاربة، ونشر الحافة. يُستخدم عند تحسين زمن وصول الاستدلال أو الإنتاجية أو الذاكرة.

yonatangross·high·performance·inference

11التثبيتات·0الرائج·@yonatangross