在神经网络中,用于训练数据的样本数为 5000,在训练数据之前使用公式进行归一化
y - mean(y)
y' = -----------
stdev(y)
Run Code Online (Sandbox Code Playgroud)
现在我想在获得预测输出后对数据进行反规范化。通常用于预测的测试数据数据是 2000 个样本。为了反规范化,使用以下公式
y = y' * stdev(y) + mean(y)
Run Code Online (Sandbox Code Playgroud)
这种方法取自以下线程 [ How to denormalise (de-standardise) neural net predictions after normalizing input data
任何人都可以解释我如何使用相同的均值和标准差来规范化训练数据(5000 * 2100)可以用于对预测数据进行去规范化,正如您所知的预测测试数据(2000 * 2100)使用,两个计数是不同的。
我是python的新手,我不知道数据类型.
我希望输出在表单中
[[ 0.3120883 ]
[ 0.36910208]
[ 0.99886361]
...,
[-0.10729821]
[ 0.08311962]
[ 1.67302086]]
Run Code Online (Sandbox Code Playgroud)
但目前我的输出是表格
[-0.13562086 -0.11107482 0.1600553 ..., -0.3161786 -0.23419835
0.45029903]
Run Code Online (Sandbox Code Playgroud)
如何转换呢?
我需要为交叉验证生成拆分,比如s是记录索引
s = [1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20]
Run Code Online (Sandbox Code Playgroud)
现在我想随机地将数据随机分组和拆分5倍,通常我想输出这样的东西
s = [[1 5 4 6], [2,3, 19,20], [... ], [... ], [.. ]]
Run Code Online (Sandbox Code Playgroud)
注意:在每个数组中,数字应该是唯一的,不应该重复
我知道我可以使用chunk()但是在chunk中你只能像1-4,5-8那样按顺序执行....
谁可以帮我这个事 ?