小编Ale*_*dro的帖子

使用 python 读取 .nc (netcdf) 文件

我正在尝试学习如何以最简单/最快的方式使用 Python 读取 .nc (netcdf) 文件。我听说它可以用 3 行代码完成,但我真的不知道如何。

我正在运行 MITgcm 数值模型。我试图找到一种简单的方法来可视化输出数据,其方式与 NCview 之类的程序相同,但使用 Python,因此我可以自定义要读取的参数和所有内容。

我找到了这个:

from matplotlib import pyplot as plt
import pandas as pd
import netCDF4
fp='uwstemp.nc'
nc = netCDF4.Dataset(fp)
plt.imshow(nc['Temp'][1,:,0,:])
plt.show()
Run Code Online (Sandbox Code Playgroud)

它大致按照我想要的方式工作,但我想逐字逐句地了解它在做什么。我猜 'Temp' 是我的变量之一,但我不知道如何弄清楚我所有的变量是什么。

特别是,我不明白plt.imshow(nc['Temp'][1,:,0,:])[1,:,0,:] 我试图改变它并且没有编译; 但我不明白它在做什么以及为什么这个数字。

python

6
推荐指数
2
解决办法
2万
查看次数

GridSearchCV的并行错误,适用于其他方法

我使用GridSearchCV遇到以下问题:它在使用时给我一个并行错误n_jobs > 1.同时n_jobs > 1与RadonmForestClassifier等单一模型一起工作正常.

下面是一个显示错误的简单工作示例:

train = np.random.rand(100,10)
targ = np.random.randint(0,2,100)

clf = ensemble.RandomForestClassifier(n_jobs = 2)
clf.fit(train,targ)
train = np.random.rand(100,10)
targ = np.random.randint(0,2,100)
?
clf = ensemble.RandomForestClassifier(n_jobs = 2)
clf.fit(train,targ)
Out[349]: RandomForestClassifier(bootstrap=True, class_weight=None,     criterion='gini',
            max_depth=None, max_features='auto', max_leaf_nodes=None,
            min_impurity_split=1e-07, min_samples_leaf=1,
            min_samples_split=2, min_weight_fraction_leaf=0.0,
            n_estimators=10, n_jobs=2, oob_score=False, random_state=None,
            verbose=0, warm_start=False)
Run Code Online (Sandbox Code Playgroud)

这个例子工作正常.

同时以下不起作用:

clf = ensemble.RandomForestClassifier()
param_grid = {'n_estimators': [10,20]}
grid_s= model_selection.GridSearchCV(clf, param_grid=param_grid_gb,n_jobs=-1,verbose=1)
grid_s.fit(train, targ)
Run Code Online (Sandbox Code Playgroud)

并给出以下错误:

Fitting 3 folds for each of 2 candidates, totalling 6 fits

ImportErrorTraceback (most …
Run Code Online (Sandbox Code Playgroud)

python parallel-processing scikit-learn grid-search

4
推荐指数
1
解决办法
4950
查看次数

更改 spark _temporary 目录路径

是否可以_temporary在写入之前更改spark 保存其临时文件的目录?

特别是,由于我正在编写表的单个分区,因此我希望临时文件夹位于分区文件夹中。

有可能吗?

hadoop partitioning apache-spark pyspark

4
推荐指数
1
解决办法
1619
查看次数

从3个列表中制作数据框/ numpy数组

我正在尝试从这三个列表中创建一个矩阵或数据框:

x = ["col1","col2","col3","col4","col5","col6","col7","col8","col9","col10"]
y = ["a","b","c"]
z = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30]
Run Code Online (Sandbox Code Playgroud)

我的目标是获得一个看起来像这样的数据框:

  col1 col2 col3 col4 col5 col6 col7 col8 col9 col10
a   1    2   3    4    5   6     7    8    9    10
b   11   12  13   14   15  16    17   18   19   20 
c   21   22  23   24   25  26    27   28   29   30
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

1
推荐指数
1
解决办法
38
查看次数