·multimodal-ai

multimodal-ai

Name: multimodal-ai
Author: omer-metin

✓

テキスト、画像、オーディオ、ビデオを組み合わせたマルチモーダル AI アプリケーションを構築するためのパターン。ビジョン API、音声転写、統合パイプラインをカバーします。「マルチモーダル AI、ビジョン API、画像理解、GPT-4V、クロードビジョン、音声転写、ウィスパー、文書抽出、画像からテキストへ」などの場合に使用します。

omer-metin·multimodal·ai

9インストール·0トレンド·@omer-metin

インストール

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

詳細

カテゴリ: *クリエイティブ
ソース: skills.sh
初回登録: 2026-02-01

multimodal-ai

インストール

SKILL.md

引用可能な情報

クイックアンサー

multimodal-ai とは？

multimodal-ai のインストール方法は？

ソースリポジトリはどこですか？

詳細

関連 Skills