·model-serving
</>

model-serving

نشر نموذج LLM وML للاستدلال. يُستخدم عند تقديم النماذج في الإنتاج أو إنشاء واجهات برمجة تطبيقات الذكاء الاصطناعي أو تحسين الاستدلال. يغطي vLLM (تقديم LLM)، وTensorRT-LLM (تحسين GPU)، وOllama (محلي)، وBentoML (نشر ML)، وTriton (متعدد النماذج)، وLangChain (التنسيق)، وLlamaIndex (RAG)، وأنماط البث.

12التثبيتات·0الرائج·@ancoleman

التثبيت

$npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving

كيفية تثبيت model-serving

ثبّت مهارة الذكاء الاصطناعي model-serving بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: ancoleman/ai-design-components.

Deploy LLM and ML models for production inference with optimized serving engines, streaming response patterns, and orchestration frameworks. Focuses on self-hosted model serving, GPU optimization, and integration with frontend applications.

This skill provides the backend serving layer for the ai-chat skill.

See references/langchain-orchestration.md and examples/langchain-rag-qdrant/ for complete patterns.

نشر نموذج LLM وML للاستدلال. يُستخدم عند تقديم النماذج في الإنتاج أو إنشاء واجهات برمجة تطبيقات الذكاء الاصطناعي أو تحسين الاستدلال. يغطي vLLM (تقديم LLM)، وTensorRT-LLM (تحسين GPU)، وOllama (محلي)، وBentoML (نشر ML)، وTriton (متعدد النماذج)، وLangChain (التنسيق)، وLlamaIndex (RAG)، وأنماط البث. المصدر: ancoleman/ai-design-components.

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-01
آخر تحديث
2026-03-10

Browse more skills from ancoleman/ai-design-components

إجابات سريعة

ما هي model-serving؟

نشر نموذج LLM وML للاستدلال. يُستخدم عند تقديم النماذج في الإنتاج أو إنشاء واجهات برمجة تطبيقات الذكاء الاصطناعي أو تحسين الاستدلال. يغطي vLLM (تقديم LLM)، وTensorRT-LLM (تحسين GPU)، وOllama (محلي)، وBentoML (نشر ML)، وTriton (متعدد النماذج)، وLangChain (التنسيق)، وLlamaIndex (RAG)، وأنماط البث. المصدر: ancoleman/ai-design-components.

كيف أثبّت model-serving؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/ancoleman/ai-design-components --skill model-serving بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/ancoleman/ai-design-components