·voice-agents
</>

voice-agents

sickn33/antigravity-awesome-skills

Sprachagenten stellen die Grenze der KI-Interaktion dar – Menschen sprechen auf natürliche Weise mit KI-Systemen. Die Herausforderung besteht nicht nur in der Spracherkennung und -synthese, sondern darin, einen natürlichen Gesprächsfluss mit einer Latenz von unter 800 ms zu erreichen und gleichzeitig Unterbrechungen, Hintergrundgeräusche und emotionale Nuancen zu bewältigen. Diese Fähigkeit deckt zwei Architekturen ab: Speech-to-Speech (OpenAI Realtime API, niedrigste Latenz, am natürlichsten) und Pipeline (STT→LLM→TTS, mehr Kontrolle, einfacher zu debuggen). Wichtigste Erkenntnis: Latenz ist die Einschränkung. Hu

237Installationen·4Trend·@sickn33

Installation

$npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents

SKILL.md

You are a voice AI architect who has shipped production voice agents handling millions of calls. You understand the physics of latency - every component adds milliseconds, and the sum determines whether conversations feel natural or awkward.

Your core insight: Two architectures exist. Speech-to-speech (S2S) models like OpenAI Realtime API preserve emotion and achieve lowest latency but are less controllable. Pipeline architectures (STT→LLM→TTS) give you control at each step but add latency. Mos

| Issue | critical | # Measure and budget latency for each component: | | Issue | high | # Target jitter metrics: | | Issue | high | # Use semantic VAD: | | Issue | high | # Implement barge-in detection: | | Issue | medium | # Constrain response length in prompts: | | Issue | medium | # Prompt for spoken format: |

Original anzeigen

Fakten (zitierbereit)

Stabile Felder und Befehle für KI/Such-Zitate.

Installationsbefehl
npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents
Kategorie
</>Entwicklung
Verifiziert
Erstes Auftreten
2026-02-01
Aktualisiert
2026-02-18

Schnelle Antworten

Was ist voice-agents?

Sprachagenten stellen die Grenze der KI-Interaktion dar – Menschen sprechen auf natürliche Weise mit KI-Systemen. Die Herausforderung besteht nicht nur in der Spracherkennung und -synthese, sondern darin, einen natürlichen Gesprächsfluss mit einer Latenz von unter 800 ms zu erreichen und gleichzeitig Unterbrechungen, Hintergrundgeräusche und emotionale Nuancen zu bewältigen. Diese Fähigkeit deckt zwei Architekturen ab: Speech-to-Speech (OpenAI Realtime API, niedrigste Latenz, am natürlichsten) und Pipeline (STT→LLM→TTS, mehr Kontrolle, einfacher zu debuggen). Wichtigste Erkenntnis: Latenz ist die Einschränkung. Hu Quelle: sickn33/antigravity-awesome-skills.

Wie installiere ich voice-agents?

Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/sickn33/antigravity-awesome-skills --skill voice-agents Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor

Wo ist das Quell-Repository?

https://github.com/sickn33/antigravity-awesome-skills