相关疑难解决方法(0)

class Network():
    def __init__(self, ***some args here***):
        self._graph = tf.Graph()
        os.environ['CUDA_VISIBLE_DIVICES'] = ','.join([str(i) for i in ray.get_gpu_ids()])
        with self._graph.as_default():
            with tf.device('/gpu:0'):
                # network, loss, and optimizer are defined here

        sess_config = tf.ConfigProto(allow_soft_placement=True)
        sess_config.gpu_options.allow_growth=True
        self.sess = tf.Session(graph=self._graph, config=sess_config)
        self.sess.run(tf.global_variables_initializer())
        atexit.register(self.sess.close)

        self.variables = ray.experimental.TensorFlowVariables(self.loss, self.sess)

Run Code Online (Sandbox Code Playgroud)

然后定义工人阶级

@ray.remote(num_gpus=1)
class Worker(Network):
    # do something

Run Code Online (Sandbox Code Playgroud)

定义学习者类别

@ray.remote(num_gpus=1)
class Learner(Network):
    # do something

Run Code Online (Sandbox Code Playgroud)

训练功能

def train():
    ray.init(num_gpus=1)
    leaner = Learner.remote(...)
    workers = [Worker.remote(...) for i in range(10)] …

Run Code Online (Sandbox Code Playgroud)

python ray tensorflow

May*_*ybe

2019 02-03

4
推荐指数

1
解决办法

3771
查看次数

标签统计

cuda ×2

gpu ×2

gpgpu ×1

kepler ×1

nvidia ×1

python ×1

ray ×1

tensorflow ×1

多个进程并行启动CUDA内核

如何使用Nvidia多进程服务(MPS)运行多个非MPI CUDA应用程序？

Ray：如何在一个 GPU 上运行多个 Actor？

标签 统计

标签统计