目前,我知道jobtracker可以向您展示每个地图任务所花费的时间,但我想要的不是每个地图任务,而是从第一个地图任务到最后一个节点所需的时间.簇.例如:1地图需要2秒,但是如果您有100个地图任务而不是所有地图都可以并行执行,那么我如何测量每个节点的时间?
是否有可能知道每个节点执行整个地图阶段(所有地图任务)所需的时间?
我有一个并行应用程序,其中我根据计算的平均值在每个节点中计算数据点每个分区的方差,但如何计算全局方差(所有方差的总和)?
我认为这将是方差的简单总和除以节点数,但它并没有给我一个接近的结果......
我正在做一些测试,我意识到在编译时使用-G参数会给我一个糟糕的表现,而不是没有它.
我查看了Nvidia的文档:
--device-debug (-G)
Generate debug information for device code.
Run Code Online (Sandbox Code Playgroud)
但它并没有帮助我知道为什么给我这么糟糕的表现.它在哪里产生这个调试信息?何时?这可能是造成这种糟糕表现的原因?