小编zen*_*apy的帖子

以附加到列表作为结果的多处理 for 循环

我需要并行化 for 循环。我当前的代码是循环遍历从 xarray 数据集中获取的 id 列表，从 xarray 数据集中获取具有当前 id 的行数据，调用函数（计算数据的三角分布），附加结果分布将函数转换为列表，完成后，它将列表转换为 xarray 数据集，其中每个结果都链接到当前的 id，因此稍后可以通过 ID 将这个数据集附加到“主”数据集。

我的代码看起来有点像这样：

from sklearn.preprocessing import MinMaxScaler
import xarray as xr
import scipy.stats as st

function call_func(data):
   scaler = MinMaxScaler()
   norm_data = scaler.fit_transform(np.reshape(data, (len(data),1)))
   params = st.triang.fit(norm_data)
   arg,loc,scale = params[:-2],params[-2],params[-1]
   dist = st.triang(loc=loc, scale=scale, *arg)
   return dist

if __name__ == "__main__":
for id in my_dataset['id'].values:
        row_data= my_dataset.sel(id=id)['data'].values[0]
        if len(row_data)>3 and all(row_data== 0) == False:
                result = call_func(row_data)
                result_list.append(result)
        else:
            result_list.append([])

new_dataset = xr.Dataset({'id': my_dataset['id'].values,
                          'dist_data':(['id','dist'],
                           np.reshape(np.array(result_list),(len(result_list),1))) …

Run Code Online (Sandbox Code Playgroud)

python for-loop append multiprocessing python-xarray

zen*_*apy

2020 07-07

3
推荐指数

1
解决办法

5203
查看次数