| DataFrame | pandas | Tabular data, CSV/Parquet | | Array | NumPy | Numerical arrays, matrices | | Bag | list | Unstructured data, JSON logs | | Delayed | Custom | Arbitrary Python functions |
Key concept: All collections are lazy—computation happens only when you call .compute().
| dd.readcsv() | Lazy load | Large CSVs | | dd.readparquet() | Lazy load | Large Parquet | | Operations | Build graph | Chain transforms | | .compute() | Execute | Get final result |
Utilizzare quando "Dask", "calcolo parallelo", "calcolo distribuito", "più grande della memoria" o per chiedere informazioni su "panda paralleli", "numpy parallelo", "out-of-core", "elaborazione multi-file", "cluster computing", "dataframe di valutazione pigro" Fonte: eyadsibai/ltk.