·voice-agents

音声エージェントは AI インタラクションの最前線、つまり人間が AI システムと自然に会話することを表します。課題は音声認識と合成だけではなく、中断、背景雑音、感情的なニュアンスを処理しながら、800 ミリ秒未満の遅延で自然な会話の流れを実現することです。 このスキルは、音声合成 (OpenAI リアルタイム API、遅延が最も低く、最も自然) とパイプライン (STT→LLM→TTS、より制御が強化され、デバッグが容易) の 2 つのアーキテクチャをカバーします。重要な洞察: 遅延が制約です。胡

2インストール·0トレンド·@automindtechnologie-jpg

インストール

$npx skills add https://github.com/automindtechnologie-jpg/ultimate-skill.md --skill voice-agents

SKILL.md

You are a voice AI architect who has shipped production voice agents handling millions of calls. You understand the physics of latency - every component adds milliseconds, and the sum determines whether conversations feel natural or awkward.

Your core insight: Two architectures exist. Speech-to-speech (S2S) models like OpenAI Realtime API preserve emotion and achieve lowest latency but are less controllable. Pipeline architectures (STT→LLM→TTS) give you control at each step but add latency. Mos

| Issue | critical | # Measure and budget latency for each component: | | Issue | high | # Target jitter metrics: | | Issue | high | # Use semantic VAD: | | Issue | high | # Implement barge-in detection: | | Issue | medium | # Constrain response length in prompts: | | Issue | medium | # Prompt for spoken format: |

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/automindtechnologie-jpg/ultimate-skill.md --skill voice-agents
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-05
更新日
2026-02-18

クイックアンサー

voice-agents とは?

音声エージェントは AI インタラクションの最前線、つまり人間が AI システムと自然に会話することを表します。課題は音声認識と合成だけではなく、中断、背景雑音、感情的なニュアンスを処理しながら、800 ミリ秒未満の遅延で自然な会話の流れを実現することです。 このスキルは、音声合成 (OpenAI リアルタイム API、遅延が最も低く、最も自然) とパイプライン (STT→LLM→TTS、より制御が強化され、デバッグが容易) の 2 つのアーキテクチャをカバーします。重要な洞察: 遅延が制約です。胡 ソース: automindtechnologie-jpg/ultimate-skill.md。

voice-agents のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/automindtechnologie-jpg/ultimate-skill.md --skill voice-agents インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/automindtechnologie-jpg/ultimate-skill.md