·data-engineering-storage-formats
{}

data-engineering-storage-formats

Formats de sérialisation de données modernes : Parquet, Apache Arrow (Feather/IPC), Lance (ML-native), Zarr (tableaux fragmentés), Avro et ORC. Couvre la compression, le partitionnement et la sélection du format.

5Installations·0Tendance·@legout

Installation

$npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats

Comment installer data-engineering-storage-formats

Installez rapidement le skill IA data-engineering-storage-formats dans votre environnement de développement via la ligne de commande

  1. Ouvrir le Terminal: Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.)
  2. Exécuter la commande d'installation: Copiez et exécutez cette commande : npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats
  3. Vérifier l'installation: Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Source : legout/data-platform-agent-skills.

Comprehensive guide to modern data serialization formats for analytics and machine learning: Parquet, Apache Arrow, Lance, Zarr, Avro, and ORC. Learn compression tradeoffs, partitioning strategies, and when to use each format.

| Format | Type | Best For | Compression | Schema Evolution | Random Access |

| Parquet | Columnar | Analytics, data lakes | ✅ (Snappy, Zstd, LZ4) | ✅ (add/drop) | ✅ (row groups) | | Arrow/Feather | Columnar | In-memory, IPC, ML | ✅ (LZ4, Zstd) | Limited | ✅ (record batches) | | Lance | Columnar | ML pipelines, vectors | ✅ (Zstd, LZ4) | ✅ | ✅ (multi-modal) |

Formats de sérialisation de données modernes : Parquet, Apache Arrow (Feather/IPC), Lance (ML-native), Zarr (tableaux fragmentés), Avro et ORC. Couvre la compression, le partitionnement et la sélection du format. Source : legout/data-platform-agent-skills.

Faits (prêts à citer)

Champs et commandes stables pour les citations IA/recherche.

Commande d'installation
npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats
Catégorie
{}Analyse de Données
Vérifié
Première apparition
2026-02-22
Mis à jour
2026-03-10

Browse more skills from legout/data-platform-agent-skills

Réponses rapides

Qu'est-ce que data-engineering-storage-formats ?

Formats de sérialisation de données modernes : Parquet, Apache Arrow (Feather/IPC), Lance (ML-native), Zarr (tableaux fragmentés), Avro et ORC. Couvre la compression, le partitionnement et la sélection du format. Source : legout/data-platform-agent-skills.

Comment installer data-engineering-storage-formats ?

Ouvrez votre terminal ou outil de ligne de commande (Terminal, iTerm, Windows Terminal, etc.) Copiez et exécutez cette commande : npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats Une fois installé, le skill sera automatiquement configuré dans votre environnement de programmation IA et prêt à être utilisé dans Claude Code, Cursor ou OpenClaw

Où se trouve le dépôt source ?

https://github.com/legout/data-platform-agent-skills