水壶的作者:水壶工作正常.我只是尝试了以下它,它的工作原理:
from jug import TaskGenerator
import pandas as pd
import numpy as np
@TaskGenerator
def gendata():
return pd.DataFrame(np.arange(343440).reshape((10,-1)))
@TaskGenerator
def compute(x):
return x.mean()
y = compute(gendata())
Run Code Online (Sandbox Code Playgroud)
它没有尽可能高效,因为它只是pickle内部使用它DataFrame(虽然它在运行中压缩它,所以它在内存使用方面并不可怕;只是比它可能慢).
我会接受一个更改,它将这些保存为jug目前为numpy数组所做的特殊情况:https://github.com/luispedro/jug/blob/master/jug/backends/file_store.py#L102
| 归档时间: |
|
| 查看次数: |
2872 次 |
| 最近记录: |