标签: gpu

并行神经网络训练,更好地使用Hadoop或gpu？

我需要训练一个有2-4个隐藏层的神经网络,不确定实际网络的结构.我正在考虑使用Hadoop map reduce(12个集群)或gpu来训练它以获得更快的结果.你觉得哪个更好？还有任何可用的库已经实现了吗？谢谢

hadoop gpu neural-network

STE*_*STE

2013 07-26

22
推荐指数

1
解决办法

1万
查看次数

如何解释TensorFlow输出？

如何解释TensorFlow输出以在GPGPU上构建和执行计算图？

给定以下命令,使用python API执行任意tensorflow脚本.

python3 tensorflow_test.py> out

第一部分stream_executor似乎是它的加载依赖.

I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcudnn.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:105] successfully opened CUDA library libcurand.so locally

Run Code Online (Sandbox Code Playgroud)

什么是NUMA节点？

I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:900] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero

Run Code Online (Sandbox Code Playgroud)

我认为这是它找到可用GPU的时候

I …

Run Code Online (Sandbox Code Playgroud)

python gpu tensorflow

Ale*_*sen

2017 05-23

22
推荐指数

1
解决办法

8446
查看次数

基于Intel的显卡是否与tensorflow/GPU兼容？

此显卡是否与tensorflow/GPU兼容？

*-display               
   description: VGA compatible controller
   product: Haswell-ULT Integrated Graphics Controller
   vendor: Intel Corporation
   physical id: 2
   bus info: pci@0000:00:02.0
   version: 09
   width: 64 bits
   clock: 33MHz
   capabilities: msi pm vga_controller bus_master cap_list rom
   configuration: driver=i915 latency=0
   resources: irq:44 memory:c2000000-c23fffff memory:b0000000-bfffffff ioport:7000(size=64)

Run Code Online (Sandbox Code Playgroud)

gpu intel graphic tensorflow

Moh*_*raf

lucky-day

22
推荐指数

1
解决办法

2万
查看次数

使用 pytorch 获取可用的 GPU 内存总量

我正在使用 google colab 免费 Gpu 进行实验，并想知道有多少 GPU 内存可用于播放，torch.cuda.memory_allocated() 返回当前占用的 GPU 内存，但我们如何使用 PyTorch 确定总可用内存。

gpu pytorch google-colaboratory

Har*_*sad

2019 10-04

22
推荐指数

2
解决办法

3万
查看次数

GPU在计算方面的未来是什么？

你的CPU可能是四核的,但你知道今天有些显卡有超过200个内核吗？我们已经看到了当今显卡的GPU在图形方面的功能.现在它们也可用于非图形任务,在我看来,结果简直令人惊讶.一种适用于并行性的算法在GPU上可能比在CPU上更快,更快.

有一些技术可以实现所有这些:

1.)NVIDIA的CUDA.它似乎是最知名的,有据可查的.不幸的是,它只适用于NVidia显卡.我已经下载了SDK,尝试了一些样本,并且在CUDA中有一些很棒的东西.但它仅限于NVidia显卡这一事实让我质疑它的未来.

2.)ATI 流.ATI相当于CUDA.正如您所料,它只适用于ATI卡.

3.)OpenCL - Khronos集团已经制定了这个标准,但它仍然处于初期阶段.我喜欢OpenCL的想法.希望它应该得到大多数视频卡制造商的支持,并且应该使交叉视频卡开发变得更加容易.

但是,非图形化GPU编程的其他技术即将到来,最有希望的是什么呢？您是否看到或者您是否希望将这些技术构建到某些主流开发框架(如.NET)中以使其更容易？

parallel-processing cuda gpu opencl

Ste*_*ham

2009 07-15

21
推荐指数

3
解决办法

5412
查看次数

GPU上的图形算法

当前的GPU线程在某种程度上是有限的(内存限制,数据结构的限制,没有递归...).

你认为在GPU上实现图论问题是可行的吗？例如顶点覆盖？主导集？独立集？max clique？....

在GPU上使用分支定界算法是否可行？递归回溯？

cuda gpu graph-theory

sca*_*man

lucky-day

21
推荐指数

2
解决办法

1万
查看次数

iOS Safari使用"-webkit-transform"耗尽内存

http://jsfiddle.net/ES4xG/8/使大多数视网膜设备崩溃.

iOS Safari"轻松"耗尽内存并在使用某些-webkit-transform指令时崩溃.这种方法提供了令人印象深刻的图形,但尤其是在视网膜显示器上,似乎消耗了大量内存并导致崩溃.

上面的演示显示的文本显示150次,否则将在PC浏览器上正常运行:

字体大小和元素数量被夸大以引起崩溃.的-webkit-transform: translate3d(0,0,0)意图强制每个元件的GPU加速绘图.

在实际应用中,我们使用translateX,Y,Z,scale和其他人,似乎被连接到GPU使用相同的方式.还使用了图像和精灵,但它们没有直接连接到崩溃.

鉴于以上情况:

1)iOS Safari崩溃是一个错误吗？

2)插入Apple仪器内存监视器,虚拟内存攀升,似乎是崩溃的罪魁祸首.究竟是什么使用这个记忆？

3)是否有其他GPU加速方法不会占用大量内存？

gpu mobile-safari css3 webgl ios

Zer*_*ion

2014 09-29

21
推荐指数

2
解决办法

2万
查看次数

在Visual Studio 2017中使用CUDA

我正在尝试安装CUDA,但是我收到一条消息"没有找到支持的visual studio版本".我认为这是因为我使用的是Visual Studio 2017(社区),而CUDA目前仅支持Visual Studio 2015.不幸的是,微软不允许我在不支付订阅费的情况下下载旧版本的Visual Studio.

有没有办法解决VS 2017的兼容性问题,还是我不能使用CUDA？

parallel-processing cuda gpu visual-studio

ace*_*ine

lucky-day

21
推荐指数

3
解决办法

4万
查看次数

如何使用TensorFlow GPU？

如何在Python 3.6 x64中使用TensorFlow GPU版本而不是CPU版本？

import tensorflow as tf

Run Code Online (Sandbox Code Playgroud)

Python正在使用我的CPU进行计算.
我可以注意到它,因为我有一个错误:

您的CPU支持未编译此TensorFlow二进制文件的指令:AVX2

我已经安装了tensorflow和tensorflow-gpu.

如何切换到GPU版本？

python gpu tensorflow

Gur*_*uku

2019 05-21

21
推荐指数

4
解决办法

6万
查看次数

How to define max_queue_size, workers and use_multiprocessing in keras fit_generator()?

I am applying transfer-learning on a pre-trained network using the GPU version of keras. I don't understand how to define the parameters max_queue_size, workers, and use_multiprocessing. If I change these parameters (primarily to speed-up learning), I am unsure whether all data is still seen per epoch.

max_queue_size:

maximum size of the internal training queue which is used to "precache" samples from the generator
Question: Does this refer to how many batches are prepared on CPU? How …

python gpu machine-learning keras tensorflow

Sop*_*nck

2019 04-16

21
推荐指数

1
解决办法

3606
查看次数