·audio-transcribe
*

audio-transcribe

agntswrm/agent-media

タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。

16インストール·1トレンド·@agntswrm

インストール

$npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe

SKILL.md

Transcribes audio files to text with timestamps. Supports automatic language detection, speaker identification (diarization), and outputs structured JSON with segment-level timing.

| --in | Yes | Input audio file path or URL (supports mp3, wav, m4a, ogg) | | --diarize | No | Enable speaker identification | | --language | No | Language code (auto-detected if not provided) | | --speakers | No | Number of speakers hint for diarization | | --out | No | Output path, filename or directory (default: ./) |

| --provider | No | Provider to use (local, fal, replicate) |

タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。 ソース: agntswrm/agent-media。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe
カテゴリ
*クリエイティブ
認証済み
初回登録
2026-02-01
更新日
2026-02-18

クイックアンサー

audio-transcribe とは?

タイムスタンプとオプションの話者識別を使用して、音声をテキストに転写します。音声をテキストに変換したり、字幕を作成したり、会議を文字に起こしたり、音声録音を処理したりする必要がある場合に使用します。 ソース: agntswrm/agent-media。

audio-transcribe のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/agntswrm/agent-media --skill audio-transcribe インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/agntswrm/agent-media