标签: gcp-ai-platform-notebook

(base)~/datascience$ sudo cp ./pip-bash-completion/pip /etc/bash_completion.d/\n\nWe trust you have received the usual lecture from the local System\nAdministrator. It usually boils down to these three things:\n\n    #1) Respect the privacy of others.\n    #2) Think before you type.\n    #3) With great power comes great responsibility.\n\n[sudo] password for jupyter: \n

Run Code Online (Sandbox Code Playgroud)\n

sudo根据我看到的信息，我应该有权访问 -

(base)~/datascience$ sudo cp ./pip-bash-completion/pip /etc/bash_completion.d/\n\nWe trust you …

Run Code Online (Sandbox Code Playgroud)

google-cloud-platform gcp-ai-platform-notebook

sri*_*rao

2021 04-24

7
推荐指数

1
解决办法

3982
查看次数

Google Cloud-ml的自定义代码容器以进行推断

我知道可以在Google Cloud上部署用于培训作业的自定义容器，并且我已经能够使用command来运行相同的容器。

gcloud ai-platform jobs submit training infer name --region some_region --master-image-uri=path/to/docker/image --config config.yaml

Run Code Online (Sandbox Code Playgroud)

训练工作已成功完成，并且模型已成功获得。现在，我想使用该模型进行推理，但是问题是我的代码具有系统级依赖关系，因此我必须对体系结构进行一些修改才能让它一直运行。这就是首先要为培训工作提供定制容器的原因。

该文档仅适用于培训部分和推断部分（如果可能的话），而据我所知，尚未使用自定义容器进行探索。

培训部分的文档可在此链接上找到

我的问题是，是否可以在Google Cloud-ml上出于推理目的部署自定义容器？

google-cloud-platform google-cloud-ml gcp-ai-platform-notebook

Ind*_*der

lucky-day

6
推荐指数

1
解决办法

98
查看次数

GCP（AI Platform Notebook）上的“服务器连接错误”

我在 GCP 和 AI Platform (Jupyterlab) 方面遇到了一些问题，似乎无法长时间与服务器保持稳定的连接。我不断收到“服务器连接错误”消息。从那里有两种可能性：

要么什么也没发生，我的手机继续运行，要么
单元已停止运行，我可以看到状态“无内核！” ' 在笔记本的右上角。每当我再次选择内核（python 3）时，根据我的运气，我可以继续工作，或者单元格将显示运行状态（左侧带有*），但左下角的内核状态将保持打开状态：“已连接”（而不是“忙”）。对于后者，我需要重新启动内核并再次运行所有单元，这可能会很长。

有时，当我在（重新）启动实例后运行第一个单元时，就会发生这种情况，有时会晚一点。我能够在笔记本上工作而没有任何问题的最长稳定时间是 20、30 分钟左右，这非常烦人。

我的主实例的配置： - 16 个 CPU - 60GB RAM - P100 NVIDIA GPU

我尝试过不同类型的实例，一直遇到同样的问题，家里网络稳定。

错误信息

google-cloud-platform google-cloud-ml jupyter-lab google-dl-platform gcp-ai-platform-notebook

hiy*_*iya

2020 03-02

6
推荐指数

1
解决办法

4601
查看次数

从 GCloud 深度学习虚拟机中的 Jupyter Notebook 下载压缩文件夹

这似乎是一个非常简单的问题，但我找不到方法。jyputer笔记本可以选择逐个下载文件。但是我的训练过程生成了太多文件，我想一次性下载所有文件。有什么办法可以做到吗？

google-cloud-platform gcp-ai-platform-notebook

jwy*_*yao

2020 01-30

5
推荐指数

1
解决办法

3216
查看次数

谷歌云AI笔记本保存不起作用

我在谷歌云的 AI 平台内创建了一个深度学习实例。我使用在浏览器上运行的内置 jupyterlab 笔记本（我使用 chrome）。最近我在保存代码时遇到了问题。自动保存以及保存笔记本文件不起作用。当我尝试保存时，我一直看到消息“保存开始”，但除此之外什么也没有发生，并且代码没有保存。我尝试重新启动内核以及重新启动实例，但问题不断出现。这里有人遇到过同样的事情吗？有解决办法吗？

谢谢

jupyter-lab gcp-ai-platform-notebook

Rac*_*lom

lucky-day

5
推荐指数

1
解决办法

1115
查看次数

重新启动 DLVM 后无法通过 Tensorflow/Pytorch 检测 GPU

这个问题发生在我今天重新启动我的云笔记本服务器时。可以使用以下步骤重现：

使用 Tensorflow 或 Pytorch 和 GPU 创建 Google Cloud Notebook 服务器
启动服务器后，打开python控制台：

>>> import torch
>>> torch.cuda.is_available()
True

Run Code Online (Sandbox Code Playgroud)

CUDA 设备目前可用。

重启服务器，再次打开笔记本。

>>> import torch
>>> torch.cuda.is_available()
/opt/conda/lib/python3.7/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero. (Triggered internally at  /opt/conda/conda-bld/pytorch_1614378098133/work/c10/cuda/CUDAFunctions.cpp:109.)
  return torch._C._cuda_getDeviceCount() > 0
False

Run Code Online (Sandbox Code Playgroud)

nvidia-smi 命令工作正常。

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.80.02    Driver Version: 450.80.02    CUDA Version: …

Run Code Online (Sandbox Code Playgroud)

google-cloud-platform pytorch google-dl-platform gcp-ai-platform-notebook

pal*_*ion

2021 06-21

5
推荐指数

1
解决办法

478
查看次数