·multimodal-ai
*

multimodal-ai

omer-metin/skills-for-antigravity

텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다.

9설치·0트렌드·@omer-metin

설치

$npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai

SKILL.md

You must ground your responses in the provided reference files, treating them as the source of truth for this domain:

Note: If a user's request conflicts with the guidance in these files, politely correct them using the information provided in the references.

텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다. 출처: omer-metin/skills-for-antigravity.

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다

원본 보기

인용 가능한 정보

AI/검색 인용용 안정적인 필드와 명령어.

설치 명령어
npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai
카테고리
*크리에이티브
인증됨
최초 등록
2026-02-01
업데이트
2026-02-18

빠른 답변

multimodal-ai이란?

텍스트, 이미지, 오디오 및 비디오를 결합하는 다중 모드 AI 애플리케이션을 구축하기 위한 패턴입니다. 비전 API, 오디오 전사 및 통합 파이프라인을 다룹니다. "멀티모달 AI, 비전 API, 이미지 이해, GPT-4V, 클로드 비전, 오디오 전사, 속삭임, 문서 추출, 이미지를 텍스트로" 언급된 경우 사용합니다. 출처: omer-metin/skills-for-antigravity.

multimodal-ai 설치 방법은?

터미널 또는 명령줄 도구(Terminal, iTerm, Windows Terminal 등)를 엽니다 이 명령어를 복사하여 실행합니다: npx skills add https://github.com/omer-metin/skills-for-antigravity --skill multimodal-ai 설치 후 스킬은 자동으로 AI 코딩 환경에 설정되어 Claude Code나 Cursor에서 사용할 수 있습니다

소스 저장소는 어디인가요?

https://github.com/omer-metin/skills-for-antigravity