Dmi*_*try 8 performance tensorflow tensorflow-gpu
tensorflow-gpu与没有AVX和AVX2相比,AVX和AVX2的速度有多快?
我尝试使用Google找到答案,但没有成功.tensorflow-gpu对Windows 重新编译很困难.所以,我想知道它是否值得.
如果你的计算是CPU上的一个巨大的计算,你将在Xeon V3上获得3倍的加速(参见此处的基准测试).但是也有可能看不到加速,大概是因为没有足够的时间花在CPU上执行的高算术强度操作上.
这是"高性能模型"指南中的一个表,用于在CPU上训练resnet50并进行差异优化.看起来你可以通过最佳设置获得2.5加速
| Optimization | Data Format | Images/Sec | Intra threads | Inter Threads |
: : : (step time) : : :
| ------------ | ----------- | ------------ | ------------- | ------------- |
| AVX2 | NHWC | 6.8 (147ms) | 4 | 0 |
| MKL | NCHW | 6.6 (151ms) | 4 | 1 |
| MKL | NHWC | 5.95 (168ms) | 4 | 1 |
| AVX | NHWC | 4.7 (211ms) | 4 | 0 |
| SSE3 | NHWC | 2.7 (370ms) | 4 | 0 |
Run Code Online (Sandbox Code Playgroud)
如果你能够为Windows编译一个优化版本,那么在这个问题中将有助于提及它 - https://github.com/yaroslavvb/tensorflow-community-wheels/issues/13,似乎有一些需求一个构建
| 归档时间: |
|
| 查看次数: |
2971 次 |
| 最近记录: |