audio-language-models
✓Gemini Live API, Grok Voice Agent, GPT-4o-Transcribe, 실시간 음성용 AssemblyAI 패턴, 음성-텍스트 변환 및 TTS. 음성 에이전트, 오디오 전사 또는 대화형 AI를 구현할 때 사용합니다.
SKILL.md
Build real-time voice agents and audio processing using the latest native speech-to-speech models.
| Model | Latency | Languages | Price | Best For |
| Grok Voice Agent | <1s TTFA | 100+ | $0.05/min | Fastest, #1 Big Bench | | Gemini Live API | Low | 24 (30 voices) | Usage-based | Emotional awareness | | OpenAI Realtime | 1s | 50+ | $0.10/min | Ecosystem integration |
Gemini Live API, Grok Voice Agent, GPT-4o-Transcribe, 실시간 음성용 AssemblyAI 패턴, 음성-텍스트 변환 및 TTS. 음성 에이전트, 오디오 전사 또는 대화형 AI를 구현할 때 사용합니다. 출처: yonatangross/orchestkit.
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models- 카테고리
- *크리에이티브
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
audio-language-models이란?
Gemini Live API, Grok Voice Agent, GPT-4o-Transcribe, 실시간 음성용 AssemblyAI 패턴, 음성-텍스트 변환 및 TTS. 음성 에이전트, 오디오 전사 또는 대화형 AI를 구현할 때 사용합니다. 출처: yonatangross/orchestkit.
audio-language-models 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/yonatangross/orchestkit --skill audio-language-models 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/yonatangross/orchestkit
상세
- 카테고리
- *크리에이티브
- 출처
- skills.sh
- 최초 등록
- 2026-02-01