小编gug*_*n1c的帖子

Scikit-learn,GroupKFold与洗牌组合?

我正在使用来自scikit-learn的StratifiedKFold,但现在我还要注意"团体".有很好的功能GroupKFold,但我的数据非常依赖于时间.与帮助中的相似,即周数是分组索引.但每周应该只有一个折叠.

假设我需要10倍.在我可以使用GroupKFold之前,我需要先将数据混洗.

洗牌是小组的 - 所以整个小组应该互相洗牌.

有办法做的是scikit - 以某种方式学习优雅吗?在我看来,GroupKFold首先可以自动调整数据.

如果没有办法用scikit做,有人可以写一些有效的代码吗?我有大量的数据集.

矩阵,标签,组作为输入

python shuffle scikit-learn cross-validation

8
推荐指数
1
解决办法
3040
查看次数

Reptree (WEKA),只对数值属性的值排序一次

我正在使用来自weka的Reptree算法。这个算法没有详细的文档,只有:

快速决策树学习器。使用信息增益/方差减少来构建决策/回归树,并使用减少错误修剪(使用反向拟合)对其进行修剪。仅对数值属性的值排序一次。缺失值通过将相应的实例分成几部分来处理(即在 C4.5 中)。

任何人都可以解释一下,这是什么意思:“仅对数字属性的值进行一次排序。”

我正在尝试重新实现这个算法,但仍然没有得到接近的结果。

谢谢

卢博米尔

algorithm machine-learning decision-tree weka

5
推荐指数
1
解决办法
4717
查看次数

如何在Python中将数组列表导出到csv中?

我在Python中有这个列表:

[array([1, 2, 3]), array([3., 4., 5., 6., 7.]), array([7, 8])]
Run Code Online (Sandbox Code Playgroud)

我想将此导出到csv看起来像这样 - 新行上的每个数组......

1, 2, 3

3., 4., 5., 6., 7.

7, 8
Run Code Online (Sandbox Code Playgroud)

每个阵列都有不同的长度.

我尝试使用numpy.savetxt,numpy.vstack但这些不同的长度给我带来了问题.

有人可以帮忙吗?

python csv arrays export numpy

5
推荐指数
1
解决办法
2787
查看次数

Keras,如何使用删除最后一层的模型进行预测

假设我有 100k x 400 的数据集。我创建了这个模型:

model = Sequential()
model.add(Dense(200, input_dim = 400, init = init_weights))
model.add(BatchNormalization())
model.add(SReLU())
model.add(Dropout(0.5))
model.add(Dense(200, init = init_weights))
model.add(BatchNormalization())
model.add(SReLU())
model.add(Dropout(0.5))
model.add(Dense(1, activation = 'linear', init = init_weights))
Run Code Online (Sandbox Code Playgroud)

比我打电话

model.compile(loss = ..
Run Code Online (Sandbox Code Playgroud)

model.fit(input_matrix,..
Run Code Online (Sandbox Code Playgroud)

训练后我可以调用 model.predict(.. 进行预测。

我想要得到的是没有最后一个线性层的模型的预测矩阵。

所以像这样:

model.remove_last_layer
pred_matrix = model.predict(input_matrix)
Run Code Online (Sandbox Code Playgroud)

输出是 100k x 200 数组,我该如何使用 keras 做到这一点?多谢

python matrix layer keras tensorflow

4
推荐指数
1
解决办法
2507
查看次数

朱莉娅 - 如何改组矩阵

在Julia(2d阵列)中给出矩阵的最佳方法是什么?

函数shuffle()不起作用.

我的意思是随机洗牌行(不是所有元素).

random shuffle permutation matrix julia

3
推荐指数
1
解决办法
2539
查看次数

Julia数组的空数组

抱歉愚蠢的简单问题,朱莉娅的新手:

我想像这样初始化数组:

folds = [[], [], [], [], [], [], [], []],但不是手动.

在Python中我只是写

folds = [[]] * 8,但这不适用于朱莉娅.

朱莉娅怎么可能这样呢?我试了几次,但现在成功了.你能解释一下吗?

谢谢.

arrays empty-list julia

2
推荐指数
1
解决办法
686
查看次数