请考虑以下代码:
0.1 + 0.2 == 0.3 -> false
Run Code Online (Sandbox Code Playgroud)
0.1 + 0.2 -> 0.30000000000000004
Run Code Online (Sandbox Code Playgroud)
为什么会出现这些不准确之处?
我知道可以冻结网络中的单个层,例如,仅训练预训练模型的最后一层.我正在寻找的是一种将某些学习率应用于不同层次的方法.
因此,例如,对于第一层,非常低的学习率为0.000001,然后对于以下每个层逐渐增加学习率.因此,最后一层最终学习率为0.01左右.
在pytorch中这可能吗?知道如何归档这个吗?