·multimodal-ai

multimodal-ai

Name: multimodal-ai
Author: omer-metin

✓

Modèles pour créer des applications d'IA multimodales combinant du texte, des images, de l'audio et de la vidéo. Couvre les API de vision, la transcription audio et les pipelines unifiés. À utiliser lorsque « IA multimodale, API de vision, compréhension d'image, GPT-4V, vision Claude, transcription audio, Whisper, extraction de document, image en texte », mentionné.

omer-metin·multimodal·ai

9Installations·0Tendance·@omer-metin