小编Thr*_*ule的帖子

dask的非确定性结果

我用dask获得了一些矩阵计算的非确定性结果.我把它缩小到这个简单的例子:

import numpy as np
import dask.array as da
seed = 1234
np.random.seed(seed)

N = 1000
p = 10
X = np.random.random((N, p + 1))
X = da.from_array(X, chunks=(N / 4, p + 1))
beta = np.random.random(p+1)
y = X.dot(beta)
test = X.T.dot(y)
for i in range(5):
    print(test.compute()[0])
Run Code Online (Sandbox Code Playgroud)

对于N = 1000,这是我得到的:

1468.52247693
1468.52247693
1468.52247693
1468.52247693
1468.52247693
Run Code Online (Sandbox Code Playgroud)

但是如果我提高N,例如N = 100000,则运行时的值不一样!

132623.076746
107791.947661
108065.532822
108228.788587
108065.532822
Run Code Online (Sandbox Code Playgroud)

知道发生了什么事吗?

python dask

5
推荐指数
1
解决办法
99
查看次数

标签 统计

dask ×1

python ×1