我是 tensorflow 的新手,我试图了解应该是什么大小batch。
我的数据的形状(119396, 12955)。我怎样才能最好batch_size地选择我的数据?什么依赖batch_size于数据形状或使用算法?
批量大小是您一次在模型中引入的输入数据值的数量。训练时很重要,测试时次要。对于标准的机器学习/深度学习算法,选择批量大小会在几个方面产生影响:
batch size,您将在模型中一次提供的数据越多。因此,RAM内存消耗几乎与 成线性关系 batch size,并且始终存在基于您的系统规格和模型大小的限制,超过该限制您的模型将溢出。batch size,您将在数据集上循环N 次以执行训练的速度越快。batch size会减慢您的模型训练速度,这意味着您的模型需要更长时间才能获得一次更新,因为该更新取决于更多数据。batch size将有更多的数据平均到模型的下一次更新,因此训练应该更平滑:更平滑的训练/测试准确度曲线。请注意,数据的大小仅与批大小有关,因为数据越大,最大值越小batch size(RAM 设置的限制)。模型的大小也有类似的关系。
在实践中,您应该遵循“2 的幂,越大越好,前提是该批次适合您的 (GPU) 内存”。有关更深入的详细信息,请查看/sf/answers/3265912681/。
| 归档时间: |
|
| 查看次数: |
531 次 |
| 最近记录: |