我正在尝试学习如何以最简单/最快的方式使用 Python 读取 .nc (netcdf) 文件。我听说它可以用 3 行代码完成,但我真的不知道如何。
我正在运行 MITgcm 数值模型。我试图找到一种简单的方法来可视化输出数据,其方式与 NCview 之类的程序相同,但使用 Python,因此我可以自定义要读取的参数和所有内容。
我找到了这个:
from matplotlib import pyplot as plt
import pandas as pd
import netCDF4
fp='uwstemp.nc'
nc = netCDF4.Dataset(fp)
plt.imshow(nc['Temp'][1,:,0,:])
plt.show()
Run Code Online (Sandbox Code Playgroud)
它大致按照我想要的方式工作,但我想逐字逐句地了解它在做什么。我猜 'Temp' 是我的变量之一,但我不知道如何弄清楚我所有的变量是什么。
特别是,我不明白plt.imshow(nc['Temp'][1,:,0,:])[1,:,0,:] 我试图改变它并且没有编译; 但我不明白它在做什么以及为什么这个数字。
我使用GridSearchCV遇到以下问题:它在使用时给我一个并行错误n_jobs > 1.同时n_jobs > 1与RadonmForestClassifier等单一模型一起工作正常.
下面是一个显示错误的简单工作示例:
train = np.random.rand(100,10)
targ = np.random.randint(0,2,100)
clf = ensemble.RandomForestClassifier(n_jobs = 2)
clf.fit(train,targ)
train = np.random.rand(100,10)
targ = np.random.randint(0,2,100)
?
clf = ensemble.RandomForestClassifier(n_jobs = 2)
clf.fit(train,targ)
Out[349]: RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',
max_depth=None, max_features='auto', max_leaf_nodes=None,
min_impurity_split=1e-07, min_samples_leaf=1,
min_samples_split=2, min_weight_fraction_leaf=0.0,
n_estimators=10, n_jobs=2, oob_score=False, random_state=None,
verbose=0, warm_start=False)
Run Code Online (Sandbox Code Playgroud)
这个例子工作正常.
同时以下不起作用:
clf = ensemble.RandomForestClassifier()
param_grid = {'n_estimators': [10,20]}
grid_s= model_selection.GridSearchCV(clf, param_grid=param_grid_gb,n_jobs=-1,verbose=1)
grid_s.fit(train, targ)
Run Code Online (Sandbox Code Playgroud)
并给出以下错误:
Fitting 3 folds for each of 2 candidates, totalling 6 fits
ImportErrorTraceback (most …Run Code Online (Sandbox Code Playgroud) 是否可以_temporary在写入之前更改spark 保存其临时文件的目录?
特别是,由于我正在编写表的单个分区,因此我希望临时文件夹位于分区文件夹中。
有可能吗?
我正在尝试从这三个列表中创建一个矩阵或数据框:
x = ["col1","col2","col3","col4","col5","col6","col7","col8","col9","col10"]
y = ["a","b","c"]
z = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30]
Run Code Online (Sandbox Code Playgroud)
我的目标是获得一个看起来像这样的数据框:
col1 col2 col3 col4 col5 col6 col7 col8 col9 col10
a 1 2 3 4 5 6 7 8 9 10
b 11 12 13 14 15 16 17 18 19 20
c 21 22 23 24 25 26 27 28 29 30
Run Code Online (Sandbox Code Playgroud) python ×3
apache-spark ×1
grid-search ×1
hadoop ×1
numpy ×1
pandas ×1
partitioning ×1
pyspark ×1
scikit-learn ×1