我一直在使用计算dask的
from dask import dataframe
all_data = dataframe.read_csv(path)
total_sum = all_data.account_balance.sum()
Run Code Online (Sandbox Code Playgroud)
csv 文件有一列名为account_balance.
这total_sum是一个dd.Scalar对象,似乎很难将其更改为整数。如何获得它的整数版本?或将其保存在.txt包含数字的文件中也可以。
我也试过了total_sum.compute()。
谢谢。
.compute() 确实给你带来了一个实数,正如你在这个例子中看到的:
In [18]: import dask.dataframe as dd
In [19]: d = dd.from_pandas(pd.DataFrame({'a': [3,3,3,3]}), npartitions=2)
In [20]: d.a.sum().compute()
Out[20]: 12
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1353 次 |
| 最近记录: |