gemini-3-multimodal
✓Gemini 3 Pro を使用してマルチモーダル入力 (画像、ビデオ、オーディオ、PDF) を処理します。画像の理解、ビデオ分析、音声処理、ドキュメント抽出、メディア解像度制御、OCR、トークンの最適化をカバーします。画像の分析、ビデオの処理、音声の文字起こし、PDF コンテンツの抽出、またはマルチモーダル データの操作時に使用します。
SKILL.md
Comprehensive guide for processing multimodal inputs with Gemini 3 Pro, including image understanding, video analysis, audio processing, and PDF document extraction. This skill focuses on INPUT processing (analyzing media) - see gemini-3-image-generation for OUTPUT (generating images).
Gemini 3 Pro provides native multimodal capabilities for understanding and analyzing various media types. This skill covers all input processing operations with granular control over quality, performance, and token consumption.
| Resolution | Tokens per Image | Best For |
Gemini 3 Pro を使用してマルチモーダル入力 (画像、ビデオ、オーディオ、PDF) を処理します。画像の理解、ビデオ分析、音声処理、ドキュメント抽出、メディア解像度制御、OCR、トークンの最適化をカバーします。画像の分析、ビデオの処理、音声の文字起こし、PDF コンテンツの抽出、またはマルチモーダル データの操作時に使用します。 ソース: adaptationio/skrillz。
引用可能な情報
AI/検索での引用用の安定したフィールドとコマンド。
- インストールコマンド
npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal- カテゴリ
- #ドキュメント
- 認証済み
- ✓
- 初回登録
- 2026-02-01
- 更新日
- 2026-02-18
クイックアンサー
gemini-3-multimodal とは?
Gemini 3 Pro を使用してマルチモーダル入力 (画像、ビデオ、オーディオ、PDF) を処理します。画像の理解、ビデオ分析、音声処理、ドキュメント抽出、メディア解像度制御、OCR、トークンの最適化をカバーします。画像の分析、ビデオの処理、音声の文字起こし、PDF コンテンツの抽出、またはマルチモーダル データの操作時に使用します。 ソース: adaptationio/skrillz。
gemini-3-multimodal のインストール方法は?
ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/adaptationio/skrillz --skill gemini-3-multimodal インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります
ソースリポジトリはどこですか?
https://github.com/adaptationio/skrillz
詳細
- カテゴリ
- #ドキュメント
- ソース
- skills.sh
- 初回登録
- 2026-02-01