Что такое ray-data?
Масштабируемая обработка данных для рабочих нагрузок машинного обучения. Потоковое выполнение через CPU/GPU, поддерживает Parquet/CSV/JSON/images. Интегрируется с Ray Train, PyTorch, TensorFlow. Масштабируется от одной машины до сотен узлов. Используйте для пакетного вывода, предварительной обработки данных, мультимодальной загрузки данных или распределенных конвейеров ETL. Источник: orchestra-research/ai-research-skills.