·audio-language-models
*

audio-language-models

Gemini Live API, голосовой агент Grok, GPT-4o-Transcribe, шаблоны AssemblyAI для передачи голоса в реальном времени, преобразования речи в текст и TTS. Используйте при реализации голосовых агентов, транскрипции звука или диалогового искусственного интеллекта.

13Установки·0Тренд·@yonatangross

Установка

$npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models

Как установить audio-language-models

Быстро установите AI-навык audio-language-models в вашу среду разработки через командную строку

  1. Откройте терминал: Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.)
  2. Выполните команду установки: Скопируйте и выполните эту команду: npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models
  3. Проверьте установку: После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Источник: yonatangross/orchestkit.

Build real-time voice agents and audio processing using the latest native speech-to-speech models.

| Model | Latency | Languages | Price | Best For |

| Grok Voice Agent | <1s TTFA | 100+ | $0.05/min | Fastest, #1 Big Bench | | Gemini Live API | Low | 24 (30 voices) | Usage-based | Emotional awareness | | OpenAI Realtime | 1s | 50+ | $0.10/min | Ecosystem integration |

Gemini Live API, голосовой агент Grok, GPT-4o-Transcribe, шаблоны AssemblyAI для передачи голоса в реальном времени, преобразования речи в текст и TTS. Используйте при реализации голосовых агентов, транскрипции звука или диалогового искусственного интеллекта. Источник: yonatangross/orchestkit.

Факты (для цитирования)

Стабильные поля и команды для ссылок в AI/поиске.

Команда установки
npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models
Источник
yonatangross/orchestkit
Категория
*Креатив
Проверено
Впервые замечено
2026-02-01
Обновлено
2026-03-11

Browse more skills from yonatangross/orchestkit

Короткие ответы

Что такое audio-language-models?

Gemini Live API, голосовой агент Grok, GPT-4o-Transcribe, шаблоны AssemblyAI для передачи голоса в реальном времени, преобразования речи в текст и TTS. Используйте при реализации голосовых агентов, транскрипции звука или диалогового искусственного интеллекта. Источник: yonatangross/orchestkit.

Как установить audio-language-models?

Откройте терминал или инструмент командной строки (Terminal, iTerm, Windows Terminal и т.д.) Скопируйте и выполните эту команду: npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models После установки навык будет автоматически настроен в вашей AI-среде разработки и готов к использованию в Claude Code, Cursor или OpenClaw

Где находится исходный репозиторий?

https://github.com/yonatangross/orchestkit