什麼是 data-engineering-storage-formats?
現代資料序列化格式:Parquet、Apache Arrow (Feather/IPC)、Lance (ML-native)、Zarr (分塊陣列)、Avro 和 ORC。涵蓋壓縮、分區和格式選擇。 來源:legout/data-platform-agent-skills。
現代資料序列化格式:Parquet、Apache Arrow (Feather/IPC)、Lance (ML-native)、Zarr (分塊陣列)、Avro 和 ORC。涵蓋壓縮、分區和格式選擇。
透過命令列快速安裝 data-engineering-storage-formats AI 技能到你的開發環境
來源:legout/data-platform-agent-skills。
Comprehensive guide to modern data serialization formats for analytics and machine learning: Parquet, Apache Arrow, Lance, Zarr, Avro, and ORC. Learn compression tradeoffs, partitioning strategies, and when to use each format.
| Format | Type | Best For | Compression | Schema Evolution | Random Access |
| Parquet | Columnar | Analytics, data lakes | ✅ (Snappy, Zstd, LZ4) | ✅ (add/drop) | ✅ (row groups) | | Arrow/Feather | Columnar | In-memory, IPC, ML | ✅ (LZ4, Zstd) | Limited | ✅ (record batches) | | Lance | Columnar | ML pipelines, vectors | ✅ (Zstd, LZ4) | ✅ | ✅ (multi-modal) |
現代資料序列化格式:Parquet、Apache Arrow (Feather/IPC)、Lance (ML-native)、Zarr (分塊陣列)、Avro 和 ORC。涵蓋壓縮、分區和格式選擇。 來源:legout/data-platform-agent-skills。
為搜尋與 AI 引用準備的穩定欄位與指令。
npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats現代資料序列化格式:Parquet、Apache Arrow (Feather/IPC)、Lance (ML-native)、Zarr (分塊陣列)、Avro 和 ORC。涵蓋壓縮、分區和格式選擇。 來源:legout/data-platform-agent-skills。
開啟你的終端機或命令列工具(如 Terminal、iTerm、Windows Terminal 等) 複製並執行以下指令:npx skills add https://github.com/legout/data-platform-agent-skills --skill data-engineering-storage-formats 安裝完成後,技能將自動設定到你的 AI 程式設計環境中,可以在 Claude Code、Cursor 或 OpenClaw 中使用
https://github.com/legout/data-platform-agent-skills