小编mys*_*.06的帖子

使用python在高斯过程回归中对训练数据集进行数据增强

我正在研究 scikit-learn 的高斯过程回归问题。为了执行预测,我有一个数据集,其中包含 3D 坐标中传感器的 10 个不同位置:例如

传感器 1 坐标:

[[  30.1678 -173.569   725.724 ]
 [  29.9895 -173.34    725.76  ]
 [  29.9411 -173.111   725.768 ]
 [  29.9306 -173.016   725.98  ]
 [  29.6754 -172.621   725.795 ]
 [  29.5277 -172.274   725.903 ]
 [  29.585  -171.978   726.111 ]
 [  29.4114 -171.507   726.188 ]
 [  29.3951 -170.947   726.173 ]
 [  29.3577 -170.196   726.384 ]]
Run Code Online (Sandbox Code Playgroud)

我使用 Leave One Out 技术执行 GPR,因此在每次运行中我使用 9 个 3D 坐标。训练我的模型并在 1 个坐标上对其进行测试。然后我改变排列继续。

为了防止过拟合问题,我想使用数据增强来放大(或添加噪声)我的训练数据。不幸的是,我见过的大多数数据增强技术都用于图像(随机旋转、裁剪、翻转等)。我的问题是:

  1. 有什么方法可以为我在 python 中的数据做这件事吗?
  2. 是否有任何限制适用于我上述数据的扩充。我可以为特定的 3D 坐标添加多少噪声。?
  3. 为列添加的新噪声数据 …

python machine-learning scikit-learn

5
推荐指数
1
解决办法
624
查看次数

标签 统计

machine-learning ×1

python ×1

scikit-learn ×1