Что такое audio-language-models?
Gemini Live API, голосовой агент Grok, GPT-4o-Transcribe, шаблоны AssemblyAI для передачи голоса в реальном времени, преобразования речи в текст и TTS. Используйте при реализации голосовых агентов, транскрипции звука или диалогового искусственного интеллекта. Источник: yonatangross/orchestkit.