我在Keras上安装了Tensorflow后端和CUDA.我想有时需要强迫Keras使用CPU.这可以在没有在虚拟环境中安装单独的CPU Tensorflow的情况下完成吗?如果是这样的话?如果后端是Theano,可以设置标志,但我还没有听说过可通过Keras访问的Tensorflow标志.
我们在许多TensorFlow教程中经常看到这一点:
sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True,
log_device_placement=True))
Run Code Online (Sandbox Code Playgroud)
是什么allow_soft_placement和log_device_placement意味着什么?
我有一个64核的共享机器,我有一个很大的Keras功能管道,我想运行.事情是,似乎Keras自动使用所有可用的核心,我不能这样做.
我使用Python,我想在for循环中运行67个神经网络.我想使用一半的可用内核.
我找不到任何限制Keras核心数量的方法......你有什么线索吗?
我在以下场景中运行:
推理客户端所做的是从 4 个独立的摄像头(每个 1 个)获取图像,并将其传递给 TF-Serving 进行推理,以便了解在视频源上看到的内容。
我之前一直通过直接调用 TensorFlow 在推理客户端 Pod 中单独进行推理,但这在显卡的 RAM 上效果不佳。Tensorflow Serving 最近被引入到组合中,以优化 RAM,因为我们不会将重复的模型加载到显卡。
并且性能看起来并不好,对于 1080p 图像,它看起来像这样:
Direct TF:20ms 用于输入张量创建,70ms 用于推理。TF-Serving:80ms 用于 GRPC 序列化,700-800ms 用于推理。
TF-Serving Pod 是唯一一个可以访问 GPU 的容器,并且它是专门绑定的。其他一切都在 CPU 上运行。
我可以做任何性能调整吗?
我正在运行的模型是来自 TF Model Zoo 的 Faster R-CNN Inception V2。
提前谢谢了!
我想更多地了解这两个参数:intra 和 inter op parallelism threads
session_conf = tf.ConfigProto(
intra_op_parallelism_threads=1,
inter_op_parallelism_threads=1)
Run Code Online (Sandbox Code Playgroud)
我读了这篇文章,其中有一个很好的解释:TensorFlow: inter- and intra-op parallelism configuration
但我正在寻求确认并在下面提出新问题。我在 keras 2.0.9、tensorflow 1.3.0 中运行我的任务:
提前谢谢了
Tensorflow 有几个基准测试工具:
我对 .pb 基准工具的参数有几个问题:
num_threads相关的单线程实验或通过使用tensorflow内螺纹平行运行次数?还有一些关于结果解释的问题:
count在结果输出?如何Timings (microseconds): count=相关--max_num_runs的参数?例子:
Run --num_threads=-1 --max_num_runs=1000:
2019-03-20 14:30:33.253584: I tensorflow/core/util/stat_summarizer.cc:85] Timings (microseconds): count=1000 first=3608 curr=3873 min=3566 max=8009 avg=3766.49 std=202
2019-03-20 14:30:33.253584: I tensorflow/core/util/stat_summarizer.cc:85] Memory (bytes): count=1000 curr=3301344(all same)
2019-03-20 14:30:33.253591: I tensorflow/core/util/stat_summarizer.cc:85] 207 nodes observed
2019-03-20 14:30:33.253597: I tensorflow/core/util/stat_summarizer.cc:85]
2019-03-20 14:30:33.378352: I tensorflow/tools/benchmark/benchmark_model.cc:636] FLOPs estimate: 116.65M
2019-03-20 14:30:33.378390: I tensorflow/tools/benchmark/benchmark_model.cc:638] FLOPs/second: 46.30B
Run --num_threads=1 --max_num_runs=1000:
2019-03-20 …Run Code Online (Sandbox Code Playgroud)