audio-transcribe
✓タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。
SKILL.md
Transcribes audio files to text with timestamps. Supports automatic language detection, speaker identification (diarization), and outputs structured JSON with segment-level timing.
| --in | Yes | Input audio file path or URL (supports mp3, wav, m4a, ogg) | | --diarize | No | Enable speaker identification | | --language | No | Language code (auto-detected if not provided) | | --speakers | No | Number of speakers hint for diarization | | --out | No | Output path, filename or directory (default: ./) |
| --provider | No | Provider to use (local, fal, replicate) |
タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。 ソース: agntswrm/agent-media。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe- カテゴリ
- *クリエイティブ
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
audio-transcribe とは?
タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。 ソース: agntswrm/agent-media。
audio-transcribe のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/agntswrm/agent-media
詳細
- カテゴリ
- *クリエイティブ
- ソース
- skills.sh
- 初回登録
- 2026-02-01