·audio-language-models
*

audio-language-models

API Gemini Live, Grok Voice Agent, GPT-4o-Transcribe, pattern AssemblyAI per voce in tempo reale, sintesi vocale e TTS. Da utilizzare durante l'implementazione di agenti vocali, trascrizione audio o intelligenza artificiale conversazionale.

13Installazioni·0Tendenza·@yonatangross

Installazione

$npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models

Come installare audio-language-models

Installa rapidamente la skill AI audio-language-models nel tuo ambiente di sviluppo tramite riga di comando

  1. Apri il terminale: Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.)
  2. Esegui il comando di installazione: Copia ed esegui questo comando: npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models
  3. Verifica l'installazione: Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Fonte: yonatangross/orchestkit.

Build real-time voice agents and audio processing using the latest native speech-to-speech models.

| Model | Latency | Languages | Price | Best For |

| Grok Voice Agent | <1s TTFA | 100+ | $0.05/min | Fastest, #1 Big Bench | | Gemini Live API | Low | 24 (30 voices) | Usage-based | Emotional awareness | | OpenAI Realtime | 1s | 50+ | $0.10/min | Ecosystem integration |

API Gemini Live, Grok Voice Agent, GPT-4o-Transcribe, pattern AssemblyAI per voce in tempo reale, sintesi vocale e TTS. Da utilizzare durante l'implementazione di agenti vocali, trascrizione audio o intelligenza artificiale conversazionale. Fonte: yonatangross/orchestkit.

Fatti (pronti per citazione)

Campi e comandi stabili per citazioni AI/ricerca.

Comando di installazione
npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models
Categoria
*Creatività
Verificato
Prima apparizione
2026-02-01
Aggiornato
2026-03-10

Browse more skills from yonatangross/orchestkit

Risposte rapide

Che cos'è audio-language-models?

API Gemini Live, Grok Voice Agent, GPT-4o-Transcribe, pattern AssemblyAI per voce in tempo reale, sintesi vocale e TTS. Da utilizzare durante l'implementazione di agenti vocali, trascrizione audio o intelligenza artificiale conversazionale. Fonte: yonatangross/orchestkit.

Come installo audio-language-models?

Apri il tuo terminale o strumento da riga di comando (Terminal, iTerm, Windows Terminal, ecc.) Copia ed esegui questo comando: npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models Dopo l'installazione, la skill verrà configurata automaticamente nel tuo ambiente AI di coding e sarà pronta all'uso in Claude Code, Cursor o OpenClaw

Dov'è il repository sorgente?

https://github.com/yonatangross/orchestkit