Ron*_*hen 5 performance machine-learning avx google-compute-engine tensorflow
有人知道这里的Tensorflow编译的可执行文件是否包括AVX支持?我已经在Google Compute Engine上运行Tensorflow的编译版本,并且运行缓慢。狗慢。冷糖蜜变慢。洛杉矶交通缓慢。本文说,使用AVX支持进行编译可以显着提高Google Compute Engine的性能,但是当我在该站点上执行编译过程时,它将失败。只是想知道AVX是否已在可执行文件中?
不,tensorflow 默认发行版是在没有 CPU 扩展的情况下构建的,例如 SSE4.1、SSE4.2、AVX、AVX2、FMA 等,因为这些构建(例如来自 的构建pip install tensorflow)旨在与尽可能多的 CPU 兼容。另一个论点是,即使有这些扩展,CPU 也比 GPU 慢很多,并且预计中型和大型机器学习训练将在 GPU 上执行。另请参阅此处的相关讨论。
文章说得对,AVX和FMA指令显着(高达300%!)加速线性代数计算,即点积,矩阵乘法,卷积等。 如果要使用它,我必须通过编译来自来源的张量流,在这个问题中讨论。
| 归档时间: |
|
| 查看次数: |
2461 次 |
| 最近记录: |