Что такое voice-agents?
Голосовые агенты представляют собой передовую границу взаимодействия ИИ: люди естественным образом разговаривают с системами ИИ. Задача заключается не только в распознавании и синтезе речи, но и в достижении естественного потока разговора с задержкой менее 800 мс, при этом обрабатывая прерывания, фоновый шум и эмоциональные нюансы. Этот навык охватывает две архитектуры: речь в речь (OpenAI Realtime API, самая низкая задержка, наиболее естественная) и конвейерная (STT→LLM→TTS, больше контроля, проще отладка). Ключевой вывод: задержка — это ограничение. Ху Источник: sickn33/antigravity-awesome-skills.