将 Dask 标量转换为整数值(或将其保存到文本文件)

3 python csv pandas dask

我一直在使用计算dask

from dask import dataframe
all_data = dataframe.read_csv(path) 
total_sum = all_data.account_balance.sum()
Run Code Online (Sandbox Code Playgroud)

csv 文件有一列名为account_balance.

total_sum是一个dd.Scalar对象,似乎很难将其更改为整数。如何获得它的整数版本?或将其保存在.txt包含数字的文件中也可以。

我也试过了total_sum.compute()

谢谢。

mdu*_*ant 5

.compute() 确实给你带来了一个实数,正如你在这个例子中看到的:

In [18]: import dask.dataframe as dd

In [19]: d = dd.from_pandas(pd.DataFrame({'a': [3,3,3,3]}), npartitions=2)

In [20]: d.a.sum().compute()
Out[20]: 12
Run Code Online (Sandbox Code Playgroud)