·audio-transcribe
*

audio-transcribe

agntswrm/agent-media

Transcrit l'audio en texte avec des horodatages et une identification facultative du locuteur. Utilisez-le lorsque vous devez convertir la parole en texte, créer des sous-titres, transcrire des réunions ou traiter des enregistrements vocaux.

16Installations·2Tendance·@agntswrm

Installation

$npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe

SKILL.md

Transcribes audio files to text with timestamps. Supports automatic language detection, speaker identification (diarization), and outputs structured JSON with segment-level timing.

| --in | Yes | Input audio file path or URL (supports mp3, wav, m4a, ogg) | | --diarize | No | Enable speaker identification | | --language | No | Language code (auto-detected if not provided) | | --speakers | No | Number of speakers hint for diarization | | --out | No | Output path, filename or directory (default: ./) |

| --provider | No | Provider to use (local, fal, replicate) |

Transcrit l'audio en texte avec des horodatages et une identification facultative du locuteur. Utilisez-le lorsque vous devez convertir la parole en texte, créer des sous-titres, transcrire des réunions ou traiter des enregistrements vocaux. Source : agntswrm/agent-media.

Voir l'original

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe
Catégorie
*Créativité
Vérifié
Première apparition
2026-02-01
Mis à jour
2026-02-18

Réponses rapides

Qu'est-ce que audio-transcribe ?

Transcrit l'audio en texte avec des horodatages et une identification facultative du locuteur. Utilisez-le lorsque vous devez convertir la parole en texte, créer des sous-titres, transcrire des réunions ou traiter des enregistrements vocaux. Source : agntswrm/agent-media.

Comment installer audio-transcribe ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code ou Cursor

Où se trouve le dépôt source ?

https://github.com/agntswrm/agent-media