在装有 NVidia GeForce 820M 的 Windows 10 PC 上,我成功安装了 CUDA 9.2 和 cudnn 7.1,然后使用 pytorch.org 上的说明安装了 PyTorch。
具体我使用了命令
pip install torch==1.4.0+cu92 torchvision==0.5.0+cu92 -f https://download.pytorch.org/whl/torch_stable.html
Run Code Online (Sandbox Code Playgroud)
因为我使用 pip 而不是 Anaconda。
但我得到以下
>>> import torch
>>> torch.cuda.is_available()
False
Run Code Online (Sandbox Code Playgroud)
为什么会这样?
我正在尝试将稳定基线3库https://stable-baselines3.readthedocs.io/en/master/中的 PPO 算法应用到我制作的自定义环境中。
我不明白的一件事是下面这一行:
mean_reward, std_reward = evaluate_policy(model, env, n_eval_episodes=10, deterministic=True)
Run Code Online (Sandbox Code Playgroud)
我应该始终让确定性等于 True 吗?当我保持确定性=“真”时,我的自定义环境“以某种方式”总是得到解决(即总是返回 1 +/- 0 标准的奖励)。
当我将其更改为“False”时,它开始以合理的方式表现(即有时会成功(奖励=1),有时会失败(奖励=0)。
因此,我在一个学校项目中工作,必须处理较大的wav文件(> 250Mgb),我想知道为什么当我向audacity软件读取此类文件时,要花大约40秒钟才能读取和绘制,但是当使用script.io.wavfile.read将其读取到python时,它将永远持续下去。所以我的问题是,胆量软件如何使它这么快,这是我可以在python中做到的吗?
编辑:我在我的代码中添加了一个新部分,以计算和绘制WAV文件的包络,但是问题是尝试使用大型WAV文件时,这将花费数年时间。文件更快谢谢
这是我正在使用的代码:
import matplotlib.pyplot as plt
import numpy as np
from scipy.io.wavfile import read
from tkinter import filedialog
# Browse, read the signal and extract signal informations (fs, duration)
filename = filedialog.askopenfilename(filetypes = (("""
Template files""", "*.wav"), ("All files", "*")))
fs, data = read(filename, mmap=True)
T = len(data) / fs #duration
nsamples = T * fs #number of samples
time = np.linspace(0, T, nsamples)
# Compute the envelope of the signal
from scipy.signal import hilbert, chirp, resample
analytic_signal …Run Code Online (Sandbox Code Playgroud) 我想“视觉上”对马尔可夫链进行动画处理,如下所示: http: //markov.yoriz.co.uk/,但使用Python而不是html css和javascript。
我不知道是否有任何库可以使这变得简单,直到现在我设法使用 Networkx 库制作马尔可夫链的可视化表示,如下图所示,但无法将其动画化(或模拟)
到目前为止,这是我的代码:
from networkx.drawing.nx_pydot import write_dot
import networkx as nx
import matplotlib.pyplot as plt
states = [(0, 0),
(1, 0),
(2, 0),]
Q = [[5, 5, 0.4],
[1, 2, 3],
[4, 0.7, 0]
]
G = nx.MultiDiGraph()
labels={}
edge_labels={}
for i, origin_state in enumerate(states):
for j, destination_state in enumerate(states):
rate = Q[i][j]
if rate > 0:
G.add_edge(origin_state, destination_state, weight=rate, label="{:.02f}".format(rate))
edge_labels[(origin_state, destination_state)] = label="{:.02f}".format(rate)
plt.figure(figsize=(10,7))
node_size = 200
pos = {state:list(state) for state …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。然而,我在图书馆的网站上找不到这种可能性,尽管它存在于以前版本的 stable-baselines 中:https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines。 common.policies.MlpLstmPolicy。
在 stable-baselines3(不是 stable-baselines)中是否存在这种可能性?如果没有,我还有其他可能做到这一点吗?谢谢。
我尝试运行以下代码来测试 HalfCheetah-v2 环境:
import gym
env = gym.make('HalfCheetah-v2')
Run Code Online (Sandbox Code Playgroud)
但这给了我以下错误:ModuleNotFoundError:没有名为“mujoco_py”的模块
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "<pyshell#1>", line 1, in <module>
env = gym.make('HalfCheetah-v2')
File "C:\Users\Amine\AppData\Roaming\Python\Python36\site-packages\gym\envs\registration.py", line 145, in make
return registry.make(id, **kwargs)
File "C:\Users\Amine\AppData\Roaming\Python\Python36\site-packages\gym\envs\registration.py", line 90, in make
env = spec.make(**kwargs)
File "C:\Users\Amine\AppData\Roaming\Python\Python36\site-packages\gym\envs\registration.py", line 59, in make
cls = load(self.entry_point)
File "C:\Users\Amine\AppData\Roaming\Python\Python36\site-packages\gym\envs\registration.py", line 18, in load
mod = importlib.import_module(mod_name)
File "C:\Program Files\Python36\lib\importlib\__init__.py", line 126, in import_module
return _bootstrap._gcd_import(name[level:], package, level)
File …Run Code Online (Sandbox Code Playgroud) 我想为特定的文本生成任务编写一个类似 GPT 的转换器。类似 GPT 的模型仅使用解码器块(在堆栈中)[1]。我知道如何在 Pytorch 中编码如下所示的解码器块的所有子模块(从嵌入到 softmax 层)。但是,我不知道应该提供什么作为输入。它说(在图中)“输出右移”。
例如,这是我的数据(其中 < 和 > 是 sos 和 eos 令牌):
我应该为类似 GPT 的模型提供什么才能正确训练它?
另外,由于我没有使用编码器,我是否仍然应该向多头注意块提供输入?
抱歉,如果我的问题看起来有点愚蠢,我对变形金刚很陌生。
python ×3
pytorch ×2
animation ×1
audacity ×1
gpt-2 ×1
mujoco ×1
networkx ×1
openai-gym ×1
performance ×1
python-3.x ×1
simulation ×1