Che cos'è audio-language-models?
API Gemini Live, Grok Voice Agent, GPT-4o-Transcribe, pattern AssemblyAI per voce in tempo reale, sintesi vocale e TTS. Da utilizzare durante l'implementazione di agenti vocali, trascrizione audio o intelligenza artificiale conversazionale. Fonte: yonatangross/orchestkit.