audio-transcribe
✓Transkribiert Audio in Text mit Zeitstempeln und optionaler Sprecheridentifizierung. Verwenden Sie es, wenn Sie Sprache in Text umwandeln, Untertitel erstellen, Besprechungen transkribieren oder Sprachaufzeichnungen verarbeiten müssen.
Installation
SKILL.md
Transcribes audio files to text with timestamps. Supports automatic language detection, speaker identification (diarization), and outputs structured JSON with segment-level timing.
| --in | Yes | Input audio file path or URL (supports mp3, wav, m4a, ogg) | | --diarize | No | Enable speaker identification | | --language | No | Language code (auto-detected if not provided) | | --speakers | No | Number of speakers hint for diarization | | --out | No | Output path, filename or directory (default: ./) |
| --provider | No | Provider to use (local, fal, replicate) |
Transkribiert Audio in Text mit Zeitstempeln und optionaler Sprecheridentifizierung. Verwenden Sie es, wenn Sie Sprache in Text umwandeln, Untertitel erstellen, Besprechungen transkribieren oder Sprachaufzeichnungen verarbeiten müssen. Quelle: agntswrm/agent-media.
Fakten (zitierbereit)
Stabile Felder und Befehle für KI/Such-Zitate.
- Installationsbefehl
npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe- Quelle
- agntswrm/agent-media
- Kategorie
- *Kreativität
- Verifiziert
- ✓
- Erstes Auftreten
- 2026-02-01
- Aktualisiert
- 2026-02-18
Schnelle Antworten
Was ist audio-transcribe?
Transkribiert Audio in Text mit Zeitstempeln und optionaler Sprecheridentifizierung. Verwenden Sie es, wenn Sie Sprache in Text umwandeln, Untertitel erstellen, Besprechungen transkribieren oder Sprachaufzeichnungen verarbeiten müssen. Quelle: agntswrm/agent-media.
Wie installiere ich audio-transcribe?
Öffnen Sie Ihr Terminal oder Kommandozeilen-Tool (Terminal, iTerm, Windows Terminal, etc.) Kopieren Sie diesen Befehl und führen Sie ihn aus: npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe Nach der Installation wird der Skill automatisch in Ihrer KI-Programmierumgebung konfiguriert und ist bereit zur Verwendung in Claude Code oder Cursor
Wo ist das Quell-Repository?
https://github.com/agntswrm/agent-media
Details
- Kategorie
- *Kreativität
- Quelle
- skills.sh
- Erstes Auftreten
- 2026-02-01