·voice-agents

تمثل العوامل الصوتية حدود تفاعل الذكاء الاصطناعي، حيث يتحدث البشر بشكل طبيعي مع أنظمة الذكاء الاصطناعي. لا يقتصر التحدي على التعرف على الكلام وتركيبه فحسب، بل يتمثل في تحقيق تدفق طبيعي للمحادثة مع زمن وصول يقل عن 800 مللي ثانية أثناء التعامل مع المقاطعات وضوضاء الخلفية والفروق الدقيقة العاطفية. تغطي هذه المهارة بنيتين: تحويل الكلام إلى كلام (OpenAI Realtime API، زمن الوصول الأقل، الأكثر طبيعية) وخط الأنابيب (STT → LLM → TTS، مزيد من التحكم، أسهل في التصحيح). البصيرة الرئيسية: الكمون هو القيد. هو

313التثبيتات·3الرائج·@sickn33

التثبيت

$npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents

كيفية تثبيت voice-agents

ثبّت مهارة الذكاء الاصطناعي voice-agents بسرعة في بيئة التطوير لديك عبر سطر الأوامر

  1. افتح الطرفية: افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal
  2. نفّذ أمر التثبيت: انسخ ونفّذ هذا الأمر: npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents
  3. تحقق من التثبيت: بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

المصدر: sickn33/antigravity-awesome-skills.

You are a voice AI architect who has shipped production voice agents handling millions of calls. You understand the physics of latency - every component adds milliseconds, and the sum determines whether conversations feel natural or awkward.

Your core insight: Two architectures exist. Speech-to-speech (S2S) models like OpenAI Realtime API preserve emotion and achieve lowest latency but are less controllable. Pipeline architectures (STT→LLM→TTS) give you control at each step but add latency. Mos

| Issue | critical | # Measure and budget latency for each component: | | Issue | high | # Target jitter metrics: | | Issue | high | # Use semantic VAD: | | Issue | high | # Implement barge-in detection: | | Issue | medium | # Constrain response length in prompts: | | Issue | medium | # Prompt for spoken format: |

حقائق جاهزة للاقتباس

حقول وأوامر مستقرة للاقتباس في أنظمة الذكاء الاصطناعي والبحث.

أمر التثبيت
npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents
الفئة
</>أدوات التطوير
موثق
أول ظهور
2026-02-01
آخر تحديث
2026-03-10

Browse more skills from sickn33/antigravity-awesome-skills

إجابات سريعة

ما هي voice-agents؟

تمثل العوامل الصوتية حدود تفاعل الذكاء الاصطناعي، حيث يتحدث البشر بشكل طبيعي مع أنظمة الذكاء الاصطناعي. لا يقتصر التحدي على التعرف على الكلام وتركيبه فحسب، بل يتمثل في تحقيق تدفق طبيعي للمحادثة مع زمن وصول يقل عن 800 مللي ثانية أثناء التعامل مع المقاطعات وضوضاء الخلفية والفروق الدقيقة العاطفية. تغطي هذه المهارة بنيتين: تحويل الكلام إلى كلام (OpenAI Realtime API، زمن الوصول الأقل، الأكثر طبيعية) وخط الأنابيب (STT → LLM → TTS، مزيد من التحكم، أسهل في التصحيح). البصيرة الرئيسية: الكمون هو القيد. هو المصدر: sickn33/antigravity-awesome-skills.

كيف أثبّت voice-agents؟

افتح الطرفية أو أداة سطر الأوامر لديك مثل Terminal أو iTerm أو Windows Terminal انسخ ونفّذ هذا الأمر: npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents بعد التثبيت، سيتم إعداد المهارة تلقائيا في بيئة البرمجة بالذكاء الاصطناعي لديك وتصبح جاهزة للاستخدام في Claude Code أو Cursor أو OpenClaw

أين مستودع المصدر؟

https://github.com/sickn33/antigravity-awesome-skills