小编Hum*_*pty的帖子

如何在 Gensim 中将模型、字典和语料库保存到磁盘，然后再次加载它们？

在 Gensim 的文档中，它说：

您可以将经过训练的模型保存到磁盘，然后将其加载回来，以继续对新训练文档进行训练或转换新文档。

我想用字典、语料库和 tf.idf 模型来做到这一点。然而，文档似乎说这是可能的，但没有解释如何保存这些东西并再次加载它们。

你怎么做到这一点？

我一直在用Pickle，但不知道这是否正确......

import pickle
pickle.dump(tfidf, open("tfidf.p", "wb"))
tfidf_reloaded = pickle.load(open("tfidf.p", "rb"))

Run Code Online (Sandbox Code Playgroud)

python nlp gensim

Hum*_*pty

2019 11-21

7
推荐指数

2
解决办法

7408
查看次数

如何命名 HDF5 数据集中的列？

我在h5py中制作了一个数据集：

f = h5py.File("experimentReadings.hdf5", "w")
dset = f.create_dataset("physics", (5,4), dtype='f')

Run Code Online (Sandbox Code Playgroud)

我有一个变量名称列表：namesList = ['height', 'mass', 'velocity', 'gravity'].

我希望这些变量名称是dset.

目前，这些列仅以数字0,1,2,3作为名称，如下所示：

我想要这个：

我想我正在寻找这样的代码：

dset[:,0].column_name = namesList[0]
dset[:,1].column_name = namesList[1]
etc...

Run Code Online (Sandbox Code Playgroud)

无论解决方案是什么，它都需要处理我正在使用的真实数据集，其中namesList有 280,000 个单词长。

python hdf5 h5py

Hum*_*pty

lucky-day

5
推荐指数

1
解决办法

5866
查看次数

错误：无法为 pyzmq 构建轮子，这是安装基于 pyproject.toml 的项目所必需的

由于安装 ipykernel 时出现问题，我无法在虚拟环境中的 VS Code 上使用 Jupyter 笔记本。当我切换到全局环境时，ipykernel 安装正常，我可以运行我的笔记本。

如果我创建一个新文件夹，输入它，运行python3 -m venv venv，然后source venv/bin/activate运行code .，然后创建一个.ipynb文件并尝试在新单元中执行任何代码，然后 VS Code 会提示我安装 ipykernel。所以我这样做了，VS Code 显示如下：

Running cells with 'Python 3.8.9 ('venv': venv)' requires ipykernel package.\nRun the following command to install 'ipykernel' into the Python environment. \nCommand: '/Users/my.name/Documents/test/venv/bin/python -m pip install ipykernel -U --force-reinstall'\n

Run Code Online (Sandbox Code Playgroud)\n

所以我 pip install ipykernel，它向我抛出这个错误：

ERROR: Could not build wheels for pyzmq, which is required to install pyproject.toml-based projects

\n …

python python-3.x pyzmq jupyter-notebook

Hum*_*pty

lucky-day

5
推荐指数

1
解决办法

5922
查看次数