Что такое clip?
Модель OpenAI, соединяющая видение и язык. Обеспечивает нулевую классификацию изображений, сопоставление изображения и текста и кросс-модальный поиск. Обучено на 400 миллионах пар изображение-текст. Используйте для поиска изображений, модерации контента или задач визуального языка без тонкой настройки. Лучше всего подходит для общего понимания изображений. Источник: ovachiever/droid-tings.