小编the*_*nac的帖子

Anaconda - 通过 anaconda 提示符更新包受到限制

我想更新我当前使用的所有软件包。进入 anaconda 提示符并输入

conda update --all

返回消息“所有请求的软件包已安装”。事实并非如此,因为我的包裹几乎有一半已经过时了。我知道 anaconda 这样做只是因为依赖冲突。所以我尝试手动更新 1 个软件包,在我的例子中是 pandas。

正在打字conda update pandas,给我留言

Updating pandas is constricted by 
anaconda -> requires pandas==0.25.1=py37ha925a31_0

If you are sure you want an update of your package either try `conda update --all` or install a 
specific version of the package you want using `conda install <pkg>=<version>`
Run Code Online (Sandbox Code Playgroud)

那么这是否意味着我无法将 pandas 更新到最新版本?或者就此而言,任何其他库(例如 numpy)都会向我产生相同的消息。这是正常现象还是我错过了什么?

python anaconda conda

5
推荐指数
1
解决办法
3274
查看次数

如何更改seaborn的pairplot()函数中的bin数?

我有一个 36000 行和 51 列的数据集。每行都是一个观察值,前 50 列是每个观察值的 50 个不同特征。第 51 列的值为 0 或 1,其中 0 表示观测值属于 A 类,1 表示观测值属于 B 类。

现在假设我想制作第一列的值的直方图,将其称为“Feature1”。据我所知,matplotlib的plt.hist()无法在同一个图中绘制2个直方图,其中一个对应于A类中Feature1的特征,另一个对应于B类中的特征。另外,seaborn 的 sns.distplot 也不能​​做到这一点。所以我决定尝试seaborn的pairplot如下

sns.pairplot(df, vars = ["Feature1"], hue= "Class", diag_kind = "hist", diag_kws= dict(alpha=0.55))
Run Code Online (Sandbox Code Playgroud)

Feature1 是第一列的名称,Class 是最后一列的名称,其中包含每个观测值的类标签。显示的直方图很好,但我想增加使用的垃圾箱数量。遗憾的是我没有找到任何方法来使用这个特定的函数来做到这一点。

有人知道这个问题的解决方案吗?谢谢

python seaborn pairplot histplot

3
推荐指数
1
解决办法
5775
查看次数

PyTorch:我可以按长度对批次进行分组吗?

我正在开发一个 ASR 项目,其中使用 HuggingFace ( ) 的模型wav2vec2。我现在的目标是将训练过程转移到 PyTorch,因此我尝试重新创建 HuggingFace\xe2\x80\x99sTrainer()类提供的所有内容。

\n

这些实用程序之一是能够按长度对批次进行分组并将其与动态填充相结合(通过数据整理器)。但说实话,我什至不知道如何在 PyTorch 中开始这一点。

\n

在我的例子中,输入是一维数组,表示 .wav 文件的原始波形。因此,在训练之前,我需要确保将相似大小的数组分批在一起。我是否需要创建一个自定义 Dataloader 类并对其进行更改,以便每次它都能为我提供长度尽可能接近的批量大小?

\n

我的一个想法是以某种方式将数据从最短到最长(或相反)排序,并每次从中提取batch_size样本。这样,第一批将包含最大长度的样本,第二批将包含第二大长度的样本,依此类推。

\n

尽管如此,我不确定如何实现这个实现。任何建议将不胜感激。

\n

提前致谢。

\n

pytorch pytorch-dataloader huggingface-datasets

1
推荐指数
1
解决办法
3196
查看次数