multimodal-ai
✓텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다.
SKILL.md
You must ground your responses in the provided reference files, treating them as the source of truth for this domain:
Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.
텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다. 출처: omer-metin/skills-for-antigravity.
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
인용 가능한 정보
AI/검색 인용용 안정적인 필드와 명령어.
- 설치 명령어
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai- 카테고리
- *크리에이티브
- 인증됨
- ✓
- 최초 등록
- 2026-02-01
- 업데이트
- 2026-02-18
빠른 답변
multimodal-ai이란?
텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다. 출처: omer-metin/skills-for-antigravity.
multimodal-ai 설치 방법은?
터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다
소스 저장소는 어디인가요?
https://github.com/omer-metin/skills-for-antigravity
상세
- 카테고리
- *크리에이티브
- 출처
- skills.sh
- 최초 등록
- 2026-02-01