小编Man*_*ias的帖子

Pytorch 显示释放和张量释放的 CUDA 警告来源/处理

我正在使用 Pytorch、CUDA 和 torch.multiprocessing (torch.mp) 运行一些并行工作程序,并根据需要通过 torch.mp 队列、管道和共享内存传递信息。一切似乎都正常,但我偶尔会收到来自 CUDA 的释放警告。在程序退出过程中,还会出现“张量释放之前进程终止”警告:

[W CudaIPCTypes.cpp:92] Producer process tried to deallocate over 1000 memory blocks 
referred by consumer processes. Deallocation might be significantly slowed down. We 
assume it will never going to be the case, but if it is, please file but to 
https://github.com/pytorch/pytorch

[W CudaIPCTypes.cpp:15] Producer process has been terminated before all shared CUDA 
tensors released. See Note [Sharing CUDA tensors]
Run Code Online (Sandbox Code Playgroud)

我已采取措施为每个进程提供正常关闭的机会,但警告仍然存在。我在文档中读到,使用 CUDA 时,通过队列提供的信息必须保留在生产者进程中,直到消费者不再存在。由于数据是来回传递的,因此每个进程都可以被视为生产者和消费者。我是否需要在退出过程中追踪将共享的所有内容并手动删除消费者副本?

上述警告完全没有上下文给出,尽管添加了各种打印语句来帮助调试,但仍然不清楚代码的哪一部分导致了这些警告。有没有办法让警告更清楚地指出导致问题的原因?

另外,我尝试根据堆栈溢出问题实现 warn_with_traceback ,但它不会影响警告消息,即使添加到每个工作进程也是如此。

import …
Run Code Online (Sandbox Code Playgroud)

python warnings pytorch

8
推荐指数
0
解决办法
3133
查看次数

无法将 NumPy 数组转换为张量(不支持的对象类型tensorflow.python.framework.ops.EagerTensor)

我正在尝试使用 TensorFlow 实现一个简单的循环网络,但收到上述错误。我浏览了与以下内容相关的几个答案:

"Failed to convert a NumPy array to a Tensor (Unsupported object type ____)" 
Run Code Online (Sandbox Code Playgroud)

错误,但到目前为止还没有将“tensorflow.python.framework.ops.EagerTensor”解决为不受支持的类型。在尝试实现本教程中的代码(尽管使用不同的数据集)后,我收到此错误。

错误发生在history = model.fit行上:

# Define the network
epochs_qty = 50
batch_size_qty = 72
model = Sequential()
model.add(LSTM(epochs_qty, input_shape = (train_X.shape[1], train_X.shape[2])))
model.add(Dense(1))
model.compile(loss = 'mae', optimizer = 'adam')

# Fit the network
history = model.fit(train_X, train_y, epochs = epochs_qty, batch_size = batch_size_qty, validation_data = (test_X, test_y), verbose = 2, shuffle = False)
Run Code Online (Sandbox Code Playgroud)

数据集具有以下形状:

print(train_X.shape, train_y.shape, test_X.shape, test_y.shape)
>> (1762, …
Run Code Online (Sandbox Code Playgroud)

python tensorflow

5
推荐指数
0
解决办法
497
查看次数

标签 统计

python ×2

pytorch ×1

tensorflow ×1

warnings ×1