我正在使用来自scikit-learn的StratifiedKFold,但现在我还要注意"团体".有很好的功能GroupKFold,但我的数据非常依赖于时间.与帮助中的相似,即周数是分组索引.但每周应该只有一个折叠.
假设我需要10倍.在我可以使用GroupKFold之前,我需要先将数据混洗.
洗牌是小组的 - 所以整个小组应该互相洗牌.
有办法做的是scikit - 以某种方式学习优雅吗?在我看来,GroupKFold首先可以自动调整数据.
如果没有办法用scikit做,有人可以写一些有效的代码吗?我有大量的数据集.
矩阵,标签,组作为输入
我正在使用来自weka的Reptree算法。这个算法没有详细的文档,只有:
快速决策树学习器。使用信息增益/方差减少来构建决策/回归树,并使用减少错误修剪(使用反向拟合)对其进行修剪。仅对数值属性的值排序一次。缺失值通过将相应的实例分成几部分来处理(即在 C4.5 中)。
任何人都可以解释一下,这是什么意思:“仅对数字属性的值进行一次排序。”
我正在尝试重新实现这个算法,但仍然没有得到接近的结果。
谢谢
卢博米尔
我在Python中有这个列表:
[array([1, 2, 3]), array([3., 4., 5., 6., 7.]), array([7, 8])]
Run Code Online (Sandbox Code Playgroud)
我想将此导出到csv看起来像这样 - 新行上的每个数组......
1, 2, 3
3., 4., 5., 6., 7.
7, 8
Run Code Online (Sandbox Code Playgroud)
每个阵列都有不同的长度.
我尝试使用numpy.savetxt,numpy.vstack但这些不同的长度给我带来了问题.
有人可以帮忙吗?
假设我有 100k x 400 的数据集。我创建了这个模型:
model = Sequential()
model.add(Dense(200, input_dim = 400, init = init_weights))
model.add(BatchNormalization())
model.add(SReLU())
model.add(Dropout(0.5))
model.add(Dense(200, init = init_weights))
model.add(BatchNormalization())
model.add(SReLU())
model.add(Dropout(0.5))
model.add(Dense(1, activation = 'linear', init = init_weights))
Run Code Online (Sandbox Code Playgroud)
比我打电话
model.compile(loss = ..
Run Code Online (Sandbox Code Playgroud)
和
model.fit(input_matrix,..
Run Code Online (Sandbox Code Playgroud)
训练后我可以调用 model.predict(.. 进行预测。
我想要得到的是没有最后一个线性层的模型的预测矩阵。
所以像这样:
model.remove_last_layer
pred_matrix = model.predict(input_matrix)
Run Code Online (Sandbox Code Playgroud)
输出是 100k x 200 数组,我该如何使用 keras 做到这一点?多谢
在Julia(2d阵列)中给出矩阵的最佳方法是什么?
函数shuffle()不起作用.
我的意思是随机洗牌行(不是所有元素).
抱歉愚蠢的简单问题,朱莉娅的新手:
我想像这样初始化数组:
folds = [[], [], [], [], [], [], [], []],但不是手动.
在Python中我只是写
folds = [[]] * 8,但这不适用于朱莉娅.
朱莉娅怎么可能这样呢?我试了几次,但现在成功了.你能解释一下吗?
谢谢.
python ×3
arrays ×2
julia ×2
matrix ×2
shuffle ×2
algorithm ×1
csv ×1
empty-list ×1
export ×1
keras ×1
layer ×1
numpy ×1
permutation ×1
random ×1
scikit-learn ×1
tensorflow ×1
weka ×1