·multimodal-llm
</>

multimodal-llm

yonatangross/orchestkit

ビジョン、オーディオ、およびマルチモーダル LLM 統合パターン。画像の処理、音声の文字起こし、音声の生成、またはマルチモーダル AI パイプラインの構築時に使用します。

8インストール·2トレンド·@yonatangross

インストール

$npx skills add https://github.com/yonatangross/orchestkit --skill multimodal-llm

SKILL.md

Integrate vision and audio capabilities from leading multimodal models. Covers image analysis, document understanding, real-time voice agents, speech-to-text, and text-to-speech.

| Category | Rules | Impact | When to Use |

| Vision: Image Analysis | 1 | HIGH | Image captioning, VQA, multi-image comparison, object detection | | Vision: Document Understanding | 1 | HIGH | OCR, chart/diagram analysis, PDF processing, table extraction | | Vision: Model Selection | 1 | MEDIUM | Choosing provider, cost optimization, image size limits |

ビジョン、オーディオ、およびマルチモーダル LLM 統合パターン。画像の処理、音声の文字起こし、音声の生成、またはマルチモーダル AI パイプラインの構築時に使用します。 ソース: yonatangross/orchestkit。

原文を見る

引用可能な情報

AI/検索での引用用の安定したフィールドとコマンド。

インストールコマンド
npx skills add https://github.com/yonatangross/orchestkit --skill multimodal-llm
カテゴリ
</>開発ツール
認証済み
初回登録
2026-02-17
更新日
2026-02-18

クイックアンサー

multimodal-llm とは?

ビジョン、オーディオ、およびマルチモーダル LLM 統合パターン。画像の処理、音声の文字起こし、音声の生成、またはマルチモーダル AI パイプラインの構築時に使用します。 ソース: yonatangross/orchestkit。

multimodal-llm のインストール方法は?

ターミナルまたはコマンドラインツール(Terminal、iTerm、Windows Terminal など)を開きます このコマンドをコピーして実行します: npx skills add https://github.com/yonatangross/orchestkit --skill multimodal-llm インストール後、スキルは自動的に AI コーディング環境に設定され、Claude Code や Cursor で使用できるようになります

ソースリポジトリはどこですか?

https://github.com/yonatangross/orchestkit