·multimodal-ai

multimodal-ai

Name: multimodal-ai
Author: omer-metin

✓

텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다.

omer-metin·multimodal·ai

9설치·0트렌드·@omer-metin

설치

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

상세

카테고리: *크리에이티브
출처: skills.sh
최초 등록: 2026-02-01

multimodal-ai

설치

SKILL.md

인용 가능한 정보

빠른 답변

multimodal-ai이란?

multimodal-ai 설치 방법은?

소스 저장소는 어디인가요?

상세

관련 Skills