我正在GCP使用特斯拉 GPU运行虚拟机。并尝试部署PyTorch基于 的应用程序以使用 GPU 对其进行加速。
我想让 docker 使用这个 GPU,可以从容器访问它。
我设法在主机上安装了所有驱动程序,并且该应用程序在那里运行良好,但是当我尝试在 docker(基于 nvidia/cuda 容器)中运行它时,pytorch 失败了:
File "/usr/local/lib/python3.6/dist-packages/torch/cuda/__init__.py", line 82,
in _check_driver http://www.nvidia.com/Download/index.aspx""")
AssertionError:
Found no NVIDIA driver on your system. Please check that you have an NVIDIA GPU and installed a driver from
Run Code Online (Sandbox Code Playgroud)
要获取有关容器可见的 nvidia 驱动程序的一些信息,我运行以下命令:
docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
但它抱怨: docker: Error response from daemon: Unknown runtime specified nvidia.
在主机上nvidia-smi输出如下所示:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
|-------------------------------+----------------------+----------------------+ …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用auto-sklearn pip install auto-sklearn,但它会引发错误:
Command "/usr/bin/python3.5 -u -c "
import setuptools, tokenize;
__file__='/tmp/pip-build-tl8y2tfg/psutil/setup.py';
f=getattr(tokenize, 'open', open)(__file__);
code=f.read().replace('\r\n', '\n');
f.close();
exec(compile(code, __file__, 'exec'))
"install
--record /tmp/pip-7t8rbku0-record/install-record.txt
--single-version-externally-managed --compile"
failed with error code 1 in /tmp/pip-build-tl8y2tfg/psutil/
Run Code Online (Sandbox Code Playgroud)
在我的/tmp/目录中没有以"pip-"开头的内容.
我完全按手动完成所有步骤,但仍然有此错误.
我也尝试使用这个问题的命令,但在两种情况下都得到了相同的错误.
我的操作系统是Ubuntu 16.04.2.
我该如何安装auto-sklearn?
我尝试生成元功能,因此我遵循了教程并编写了以下内容:
clf = tree.DecisionTreeClassifier()
clf.fit(X, y)
但这会引发ValueError。
File "/usr/local/lib/python2.7/dist-packages/sklearn/tree/tree.py", line 739, in fit
X_idx_sorted=X_idx_sorted)
File "/usr/local/lib/python2.7/dist-packages/sklearn/tree/tree.py", line 146, in fit
check_classification_targets(y)
File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/multiclass.py", line 172, in check_classification_targets
raise ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'unknown'
Run Code Online (Sandbox Code Playgroud)
为什么会加注?
数据集由浮点数和整数组成,类标签为整数。describe()返回以下内容:
x1 x2 x3 x4 x5 x6 x7 x8
count 3500.00 3500.00 3500.00 3500.00 3500.0 3500.00 3500.00 3500.00
unique 501.00 516.00 572.00 650.00 724.0 779.00 828.00 757.00
top 0.12 0.79 0.82 0.83 1.9 1.68 1.67 2.03
freq 23.00 25.00 22.00 …Run Code Online (Sandbox Code Playgroud) 我需要暂停和恢复线程,它会不断执行某些任务.start()调用时开始执行,不应该中断,必须从pause()调用时继续执行.
我怎样才能做到这一点?
我写的时候tf.keras.layers.LSTM得到警告
Note that this layer is not optimized for performance. Please use tf.keras.layers.CuDNNLSTM for better performance on GPU.
但是当我将图层更改tf.keras.layers.CuDNNLSTM为时,出现错误
AttributeError: module 'tensorflow.python.keras.api._v2.keras.layers' has no attribute 'CuDNNLSTM'
Tensorflow版本是2.0.0-alpha0,Keras版本是2.2.4-tf。
我该如何解决这个问题?
我在虚拟环境中使用 Jupyter Notebook。我安装了一个依赖项,但无法导入它:
单元格 1:
!pip3 install sent2vec
Requirement already satisfied: sent2vec in
venv/lib/python3.7/site-packages (0.0.0)
Run Code Online (Sandbox Code Playgroud)
单元格 2:
import sent2vec
ModuleNotFoundError Traceback (most recent call last)
<ipython-input-5-06231d291a17> in <module>
----> 1 import sent2vec
ModuleNotFoundError: No module named 'sent2vec'
Run Code Online (Sandbox Code Playgroud)
这怎么会发生?如何解决这个问题?
> pip3 list
Package Version
------------ ---------
certifi 2019.9.11
chardet 3.0.4
Cython 0.29.14
idna 2.8
joblib 0.14.0
langdetect 1.0.7
nltk 3.4.4
numpy 1.17.1
pip 19.3.1
requests 2.22.0
scikit-learn 0.21.3
scipy 1.3.2
sent2vec 0.0.0
setuptools 41.6.0
six 1.13.0
urllib3 1.25.7
wheel 0.33.6
Run Code Online (Sandbox Code Playgroud) 我在 Ubuntu 下安装 HPOlib 并尝试运行示例,但它不起作用。它引发 DistributionNotFound 异常,消息为:The 'pyparsingnose' distribution was not found and is required by HPOlib。pyparsing 已安装。我怎样才能消除那个错误?
示例来自http://hpolib.readthedocs.io/en/development/install.html
python ×5
pip ×2
python-3.x ×2
scikit-learn ×2
cuda ×1
docker ×1
gpu ×1
keras ×1
pyparsing ×1
python-2.7 ×1
tensorflow ×1