懒惰地从 PostgreSQL / Cassandra 创建 Dask DataFrame

Question

据我了解，Dask DataFrame 是处理表格数据的正确方法。我在 PostgreSQL 中有一个表，我知道如何将它加载到pandas.Dataframe.

我知道，odo可用于转换pandas.DataFrame为 dask.dataframe。但这不是懒惰的操作：这种转换强制将整个 PostgeSQL 表加载到内存中，这很糟糕。我更喜欢一个一个或一个块地阅读项目。这该怎么做？

Answer 1

主要思想是创建一个目标名称包，然后将这些参数传递给加载程序。