·voice-agents
</>

voice-agents

Голосовые агенты представляют собой передовую границу взаимодействия ИИ: люди естественным образом разговаривают с системами ИИ. Задача заключается не только в распознавании и синтезе речи, но и в достижении естественного потока разговора с задержкой менее 800 мс, при этом обрабатывая прерывания, фоновый шум и эмоциональные нюансы. Этот навык охватывает две архитектуры: речь в речь (OpenAI Realtime API, самая низкая задержка, наиболее естественная) и конвейерная (STT→LLM→TTS, больше контроля, проще отладка). Ключевой вывод: задержка — это ограничение. Ху

311Установки·2Тренд·@sickn33

Установка

$npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents

Как установить voice-agents

Быстро установите AI-навык voice-agents в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: sickn33/antigravity-awesome-skills.

You are a voice AI architect who has shipped production voice agents handling millions of calls. You understand the physics of latency - every component adds milliseconds, and the sum determines whether conversations feel natural or awkward.

Your core insight: Two architectures exist. Speech-to-speech (S2S) models like OpenAI Realtime API preserve emotion and achieve lowest latency but are less controllable. Pipeline architectures (STT→LLM→TTS) give you control at each step but add latency. Mos

| Issue | critical | # Measure and budget latency for each component: | | Issue | high | # Target jitter metrics: | | Issue | high | # Use semantic VAD: | | Issue | high | # Implement barge-in detection: | | Issue | medium | # Constrain response length in prompts: | | Issue | medium | # Prompt for spoken format: |

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents
Категория
</>Разработка
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-10

Browse more skills from sickn33/antigravity-awesome-skills

Короткие ответы

Что такое voice-agents?

Голосовые агенты представляют собой передовую границу взаимодействия ИИ: люди естественным образом разговаривают с системами ИИ. Задача заключается не только в распознавании и синтезе речи, но и в достижении естественного потока разговора с задержкой менее 800 мс, при этом обрабатывая прерывания, фоновый шум и эмоциональные нюансы. Этот навык охватывает две архитектуры: речь в речь (OpenAI Realtime API, самая низкая задержка, наиболее естественная) и конвейерная (STT→LLM→TTS, больше контроля, проще отладка). Ключевой вывод: задержка — это ограничение. Ху Источник: sickn33/antigravity-awesome-skills.

Как установить voice-agents?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/sickn33/antigravity-awesome-skills

Детали

Категория
</>Разработка
Источник
skills.sh
Впервые замечено
2026-02-01