小编Mis*_*man的帖子

如何防止张量流分配GPU内存的全部?

我在一个共享计算资源的环境中工作,也就是说,我们有一些服务器机器配备了几个Nvidia Titan X GPU.

对于小到中等大小的型号,12GB的Titan X通常足以让2-3人在同一GPU上同时进行训练.如果模型足够小以至于单个模型没有充分利用Titan X的所有计算单元,那么与在另一个训练过程之后运行一个训练过程相比,这实际上可以导致加速.即使在并发访问GPU确实减慢了单个培训时间的情况下,仍然可以灵活地让多个用户同时在GPU上运行.

TensorFlow的问题在于,默认情况下,它在启动时会在GPU上分配全部可用内存.即使对于一个小的2层神经网络,我也看到12 GB的Titan X已用完.

有没有办法让TensorFlow只分配4GB的GPU内存,如果有人知道这个数量对于给定的模型来说足够了?

python tensorflow nvidia-titan

252
推荐指数
12
解决办法
13万
查看次数

如何获取新的Google Compute Engine实例的ssh密钥?

我是来自Amazon EC2世界的新Google Cloud试用用户,对于我如何通过ssh登录到新的Google Compute Engine VM实例,我感到非常困惑.

我通过Google Cloud Web控制台创建了一个新实例(如果重要的话,可以从CentOS 6.x映像中创建).我在创建表单上看到一个空白,我可以粘贴现有的ssh密钥,但由于这是我的第一个实例,我还没有.我认为它会带我完成像Amazon EC2那样的密钥创建过程.它没有.它似乎已经创建了实例,但我无法弄清楚如何获取它的ssh密钥.实例网页有一个显示"ssh"的按钮,它让我通过一个模拟ssh会话的弹出式Web浏览器窗口进行简短登录.但是,它只允许我进入用户级帐户,而不是root.弹出窗口有一个用于更改用户的菜单项,我将其更改为"root",之后它只会生成连接错误,现在我根本无法登录到我的实例.

我搜索过但找不到任何解释谷歌计算实例这方面的直接文档.我搜索了Web控制台,但找不到ssh密钥创建/选择机制,也没有找到创建或下载实例密钥的方法.

我是否必须在我的终端手动创建自己的ssh密钥并在创建过程中将它们粘贴到表单中,还是有一些其他明显的步骤我不知道了?

ssh virtual-machine ssh-keys google-compute-engine

41
推荐指数
3
解决办法
6万
查看次数

如何增加Google Compute Engine中根磁盘的大小?

GCE中的根磁盘大小为10演出.我该怎么做呢?我无法在控制台或gcutil标志中找到该选项.这可以在AWS中轻松完成.

cloud google-compute-engine google-cloud-platform

34
推荐指数
4
解决办法
4万
查看次数

重命名Google Compute Engine VM实例

如何重命名Google Compute Engine VM实例?

我创建了一个新的LAMP服务器,我想在"VM Instances"仪表板中重命名它.

我已经尝试重命名自定义元数据,但似乎没有复制到仪表板.

hostname virtual-machine google-compute-engine

31
推荐指数
6
解决办法
3万
查看次数

在Google Compute Engine VM之间共享永久磁盘

来自Google的文档:

可以将永久磁盘附加到多个实例.但是,如果将永久磁盘附加到多个实例,则所有实例都必须以只读模式附加永久磁盘.在读写模式下,无法将永久磁盘连接到多个实例.

如果以读写模式附加永久磁盘,然后尝试将磁盘附加到后续实例,则Google Compute Engine会返回错误.

所以,我需要一个共享持久磁盘作为我所有计算引擎的前端,好,你怎么能在这个共享磁盘上写?

我的猜测(我希望)是一个读/写持久磁盘只能附加1个计算引擎,但同一个磁盘可以只读共享给其他虚拟机,这是正确的吗?

假设我有2个计算引擎虚拟机和2个永久磁盘,这个流程是否可行?

  • compute1读/写disk1和只读disk2
  • compute2读/写disk2和只读disk1

google-compute-engine

28
推荐指数
2
解决办法
2万
查看次数

"计算引擎网络Internet出口"对Google Cloud意味着什么?

我已经在谷歌云平台上创建了一个简单的Tomcat网络服务器,本月我被指控为"从美洲到中国的计算引擎网络互联网出口:2636.552 Gibibyte(项目:xxx)"和服务'计算引擎网络互联网从美洲到美洲的出口.

"从美国到中国的计算机引擎网络出口"究竟意味着什么?

cloud google-cloud-storage google-compute-engine google-cloud-platform

26
推荐指数
1
解决办法
2万
查看次数

为什么Malloc()关心边界对齐?

我听说malloc()根据正在分配的类型来调整内存.例如,从" 理解和使用C指针 "一书中:

分配的内存将根据指针的数据类型进行对齐.例如,一个四字节整数将分配在一个可被4整除的地址边界上.

如果我遵循,这意味着 int *integer=malloc(sizeof(int));将分配在一个可被4整除的地址边界上.即使没有(int *)在malloc上施放.

我在聊天服务器上工作; 我读到了与s 类似的效果struct.

我不得不问:从逻辑上讲,为什么地址边界本身可以被整除呢?将一组内存分配到n*sizeof(int)地址上使用整数的调整有129什么问题?

我知道指针算法是如何工作的*(integer+1),但我无法弄清楚边界的重要性......

c c++ pointers memory-management

24
推荐指数
3
解决办法
1707
查看次数

`gcloud compute copy-files`:复制文件时权限被拒绝

我很难将文件复制到我的Google Compute Engine.我在Google Compute Engine上使用Ubuntu服务器.

我是从我的OS X终端这样做的,我已经被授权使用了gcloud.

local:$ gcloud compute copy-files /Users/Bryan/Documents/Websites/gce/index.php example-instance:/var/www/html --zone us-central1-a
Warning: Permanently added '<IP>' (RSA) to the list of known hosts.
scp: /var/www/html/index.php: Permission denied
ERROR: (gcloud.compute.copy-files) [/usr/bin/scp] exited with return code [1].
Run Code Online (Sandbox Code Playgroud)

linux permissions ubuntu google-compute-engine gcloud

22
推荐指数
2
解决办法
2万
查看次数

在app.yaml中为没有vm_settings的google cloud compute node.js app设置f1-micro资源限制

如果不使用已弃用的vm_settings -> machine_type设置,我的Google托管虚拟机会部署为g1-small.使用Node.js app.yaml作为模板,除了memory_gb部署为f1-micro机器类型之外还需要更改什么?现在,我有

resources:
  cpu: .5
  memory_gb: .6
  disk_size_gb: 10
Run Code Online (Sandbox Code Playgroud)

并使用

gcloud preview app deploy app.yaml --set-default
Run Code Online (Sandbox Code Playgroud)

vm_settings:
  machine_type: f1-micro
Run Code Online (Sandbox Code Playgroud)

......有效,但我警告说这个设置很快就会消失.

google-app-engine google-compute-engine

15
推荐指数
2
解决办法
1648
查看次数

在Google Cloud中保存Android应用程序数据

是否可以在使用应用程序时将Android应用程序数据保存在Google Cloud中并与应用程序同步?例如,我希望Google Cloud Storage就像我的应用程序的服务器一样.

我想在Google云端存储中创建一个文件夹,并在那里存储所有与应用相关的数据.我已阅读云存储文档并创建了API密钥.请告知是否可以这样做.

android google-api google-cloud-storage google-cloud-platform

14
推荐指数
2
解决办法
1万
查看次数