Multimodal AI service that extracts semantic content from documents, video, audio, and image files for RAG and automated workflows.
Content Understanding operations are asynchronous long-running operations:
| prebuilt-documentSearch | Documents | Extract markdown for RAG applications | | prebuilt-imageSearch | Images | Extract content from images | | prebuilt-audioSearch | Audio | Transcribe audio with timing | | prebuilt-videoSearch | Video | Extract frames, transcripts, summaries | | prebuilt-invoice | Documents | Extract invoice fields |
Пакет SDK для понимания содержимого Azure AI для Python. Используйте для мультимодального извлечения контента из документов, изображений, аудио и видео. Триггеры: «azure-ai-contentunderstanding», «ContentUnderstandingClient», «мультимодальный анализ», «извлечение документов», «анализ видео», «транскрипция аудио». Источник: microsoft/agent-skills.