我怀疑是否在我的gpu盒上正确配置了tensorflow,因为在我的花式gpu机器上训练一个简单的线性回归模型(batchsize = 32,1500输入功能,150个输出变量)比在我的笔记本电脑上慢大约100倍.
我正在使用Titan X,带有现代cpu等.nvidia-smi说我只有10%的gpu利用率,但我希望这是因为批量小.我没有使用feed_dict将数据移动到计算图中.一切都来自tf.decode_csv和tf.train.shuffle_batch.
有没有人对如何轻松测试我的安装是否正确有任何建议?有没有简单的速度基准?我的笔记本电脑和gpu机器之间的速度差异非常大,以至于我预计事情配置不正确.
Yar*_*tov 18
试试tensorflow/tensorflow/models/image/mnist/convolutional.py,这将打印每步计时.
特斯拉K40c应该在16 ms每一步上得到,而120 ms在我3岁的机器上仅用于CPU
编辑:这移动到models存储库:https://github.com/tensorflow/models/blob/master/tutorials/image/mnist/convolutional.py.
该convolutional.py文件现在位于models/tutorials/image/mnist/convolutional.py
Pat*_*ker 17
延伸Yaroslavs回答:以下是如何进行整个测试过程(已安装CUDA和cudNN)
git clone https://github.com/tensorflow/models.git
Run Code Online (Sandbox Code Playgroud)
为tensorflow创建Virtuel环境并安装tensorflow
virtualenv --system-site-packages -p python3 tf-venv3
source tf-venv3/bin/activate
pip install --upgrade pip
pip install --upgrade tensorflow-gpu
Run Code Online (Sandbox Code Playgroud)
在虚拟环境中运行模型
python models/tutorials/image/mnist/convolutional.py
Run Code Online (Sandbox Code Playgroud)
我的GTX 1070每步需要大约5毫秒
注意:在Geforce 1050 Ti上,每步需要大约10毫秒

| 归档时间: |
|
| 查看次数: |
11435 次 |
| 最近记录: |