`intra_op_parallelism_threads`和`inter_op_parallelism_threads`选项如何在TensorFlow中工作？

Min*_*ark 7 configuration multithreading gpu tensorflow

我的理解是TensorFlow在每个设备上创建两个线程池:一个用于帧内并行操作,一个用于操作间并行.

假设有3个独立的操作A,B,C放在/gpu:0和intra_op_parallelism_threads=5.假设A和B具有单线程GPU内核实现,并且C具有多线程内核实现,这意味着它们都可以在同一设备上并行运行,A和B仅使用1个GPU线程而C耗尽到3个GPU线程？

现在假设inter_op_parallelism_threads=2,这是否意味着只能同时评估3个操作中的2个/gpu:0,所以在上面的例子中,它可能是A + B,B + C或A + C,具体取决于谁首先到达那里？

注意:我试图理解@mrry对这个问题的回答:Tensorflow:执行具有CPU特定核心的操作

归档时间：	9 年，7 月前
查看次数：	2153 次
最近记录：	9 年，7 月前

Tensorflow:执行具有CPU特定核心的操作 10

更多相关链接

为什么并发修改数组这么慢？ 31

什么是Java相当于ManualResetEvent？ 30

如何明确地广播张量以匹配张量流中的另一个形状？ 13

当类型不是Integral时,如何使用std :: atomic执行基本操作？ 10

无法读取配置文件,因为它超过了最大文件大小 7

不稳定的StampedLock.unlock(长)行为？ 7

我的多线程HttpClient有什么问题吗？ 6

ASP.NET Core Web API json配置未复制到调试文件夹 5

Docker-如何在现有Docker映像中添加新的python依赖项？ 4

Spring Boot-从属性文件注入映射 2

如何在提交前撤消'git add'？ 8567

如何判断Bash中是否存在常规文件？ 3069

我遇到了合并冲突.我怎样才能中止合并？ 2391

.prop()vs .attr() 2249

如何使用Git将标签推送到远程存储库？ 2091

如何将Git托管项目中的所有本地更改还原到以前的状态？ 1830

C#在foreach中重用变量是否有原因？ 1631

为什么Java有瞬态字段？ 1406

如何获取MySQL用户帐户列表 1320

如何按值排序多维数组？ 1058