小编dee*_*wal的帖子

快速numpy卷

我有一个2d numpy数组,我想以增量方式滚动每一行.我np.roll在for循环中使用这样做.但是因为我这几次打电话,我的代码真的很慢.你能帮我解决一下如何让它更快.

我的输入看起来像

array([[4,1],
       [0,2]])

Run Code Online (Sandbox Code Playgroud)

我的输出看起来像

array([[4,1],
       [2,0]])

Run Code Online (Sandbox Code Playgroud)

这里第0行[4,1]移动了0,第一行[0,2]移动了1.类似地,第二行将移动2,依此类推.

编辑

temp = np.zeros([dd,dd])
for i in range(min(t + 1, dd)):
    temp[i,:] = np.roll(y[i,:], i, axis=0)

Run Code Online (Sandbox Code Playgroud)

python arrays performance numpy

dee*_*wal

2017 02-08

5
推荐指数

1
解决办法

2211
查看次数

将nd数组转换为键值字典

在python中是否有一个函数将nd-array转换为字典,其中key是索引的元组,value是该索引处的矩阵值？

例如:

A = np.random.random([3,4,5])

Run Code Online (Sandbox Code Playgroud)

结果:

{(i,j,k): A[i,j,k]}

Run Code Online (Sandbox Code Playgroud)

python arrays numpy

dee*_*wal

2017 05-06

5
推荐指数

1
解决办法

5286
查看次数

如何处理H2O算法中的偏差响应

在我的问题数据集中,响应变量非常偏向左侧.我试图使用h2o.randomForest()和h2o.gbm()如下的模型.在这两种情况下,我可以调整min_split_improvement并min_rows避免过度拟合.但是对于这些模型,我发现尾部观察的误差很大.我曾尝试 weights_column过对尾部观察进行过采样,并对其他观察结果进行欠采样,但这并没有帮助.

h2o.model <- h2o.gbm(x = predictors, y = response, training_frame = train,valid = valid, seed = 1,
                              ntrees =150, max_depth = 10, min_rows = 2, model_id = "GBM_DD", balance_classes = T, nbins = 20, stopping_metric = "MSE", 
                     stopping_rounds = 10, min_split_improvement = 0.0005)


h2o.model <- h2o.randomForest(x = predictors, y = response, training_frame = train,valid = valid, seed = 1,ntrees =150, max_depth = 10, min_rows = 2, model_id = "DRF_DD", balance_classes …

Run Code Online (Sandbox Code Playgroud)

r h2o automl

dee*_*wal

2018 01-23

5
推荐指数

1
解决办法

413
查看次数

部署时 h2o MOJO 与 POJO 之间的性能差异

我使用训练了一个二元分类器模型h2o.GLM。我有大约 5-10 个功能。我想知道哪个生产速度更快？

在我的 java 代码中编码逻辑回归。
通过 h2o 使用 POJO。
使用h2o生成的MOJO。

如果我训练随机森林模型而不是 GLM，这个答案会改变吗？

我需要获得约 1 亿行的分数。我已经在分配不同观察结果的评分。

java h2o

dee*_*wal

lucky-day

2
推荐指数

1
解决办法

962
查看次数

如何在带有多列图的seaborn catplot中添加垂直网格线

我想使用以下代码绘制猫图。

import seaborn as sns
sns.set_theme(style="ticks")
exercise = sns.load_dataset("exercise")
sns.set_style({'axes.grid': True})
g = sns.catplot(x="time", y="pulse", hue="kind", data=exercise)

Run Code Online (Sandbox Code Playgroud)

但这不会绘制垂直网格线。我怎样才能添加它们？

matplotlib python-3.x seaborn

dee*_*wal

lucky-day

2
推荐指数

1
解决办法

4383
查看次数