whisper
✓OpenAI の汎用音声認識モデル。 99 の言語、文字起こし、英語への翻訳、言語識別をサポートします。小さなモデル (39M パラメータ) から大きなモデル (1550M パラメータ) までの 6 つのモデル サイズ。音声からテキストへの変換、ポッドキャストの文字起こし、または多言語音声処理に使用します。堅牢な多言語 ASR に最適です。
SKILL.md
| Model | Parameters | English-only | Multilingual | Speed | VRAM |
| tiny | 39M | ✓ | ✓ | 32x | 1 GB | | base | 74M | ✓ | ✓ | 16x | 1 GB | | small | 244M | ✓ | ✓ | 6x | 2 GB | | medium | 769M | ✓ | ✓ | 2x | 5 GB | | large | 1550M | ✗ | ✓ | 1x | 10 GB | | turbo | 809M | ✗ | ✓ | 8x | 6 GB |
Recommendation: Use turbo for best speed/quality, base for prototyping
OpenAI の汎用音声認識モデル。 99 の言語、文字起こし、英語への翻訳、言語識別をサポートします。小さなモデル (39M パラメータ) から大きなモデル (1550M パラメータ) までの 6 つのモデル サイズ。音声からテキストへの変換、ポッドキャストの文字起こし、または多言語音声処理に使用します。堅牢な多言語 ASR に最適です。 ソース: ovachiever/droid-tings。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/ovachiever/droid-tings --skill whisper- カテゴリ
- ""ライティング
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
whisper とは?
OpenAI の汎用音声認識モデル。 99 の言語、文字起こし、英語への翻訳、言語識別をサポートします。小さなモデル (39M パラメータ) から大きなモデル (1550M パラメータ) までの 6 つのモデル サイズ。音声からテキストへの変換、ポッドキャストの文字起こし、または多言語音声処理に使用します。堅牢な多言語 ASR に最適です。 ソース: ovachiever/droid-tings。
whisper のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/ovachiever/droid-tings --skill whisper インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/ovachiever/droid-tings
詳細
- カテゴリ
- ""ライティング
- ソース
- skills.sh
- 初回登録
- 2026-02-01