小编Mah*_*hsa的帖子

在ubuntu中安装pyrouge出现错误

我想在Ubuntu中安装pyrouge用于文本摘要评估。我使用this中的说明。

首先我写pip install pyrouge然后我必须写这个命令:pyrouge_set_rouge_path /absolute/path/to/ROUGE-1.5.5/directory.

在我的系统中,我写道:

pyrouge_set_rouge_path /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyrouge
Run Code Online (Sandbox Code Playgroud)

得到这个:

例外:无法设置数据目录,因为路径 /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyrouge/data 不存在。

并且

pyrouge_set_rouge_path /home/afsharizadeh/pyrouge-0.1.0/pyrouge
Run Code Online (Sandbox Code Playgroud)

得到这个:

例外:无法设置数据目录,因为路径 /home/afsharizadeh/pyrouge-0.1.0/pyrouge/data 不存在。

并且

pyrouge_set_rouge_path /home/afsharizadeh/pyrouge-0.1.0/pyrouge/test
Run Code Online (Sandbox Code Playgroud)

得到这个:

例外:在 /home/afsharizadeh/pyrouge-0.1.0/pyrouge/test/ROUGE-1.5.5.pl 中找不到 ROUGE 二进制文件。请通过运行pyrouge_set_rouge_path /path/to/rouge/home 设置正确的路径。

我知道关于这个问题的类似问题是在堆栈溢出中被问到的,但我无法解决我的问题,因为我根本不知道“ROUGE path”这个表达是什么意思。“通往 ROUGE-1.5.5 的路径”是什么意思?

我知道我有两个关于pyrouge的目录。其中一个是这个路径:~/anaconda3/lib/python3.6/site-packages/pyrouge另一个是我从站点下载的目录。这条路是:~/pyrouge-0.1.0。该目录还有其他三个目录,名称分别为:bin、pyrouge、pyrouge.egg-info。

基于此页面,我以这种格式编写:

set pyrouge_set_rouge_path=/home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyroug
Run Code Online (Sandbox Code Playgroud)

在这种格式之后,没有错误出现,但之后我输入:

python -m pyrouge.test 
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

例外:无法设置数据目录,因为路径 /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyroug/data 不存在。

-------------------------------------------------- -------------------- 在 0.592 秒内运行 11 个测试

失败(错误=9)

我该怎么办?

python ubuntu summarization rouge

6
推荐指数
2
解决办法
6727
查看次数

使用gensim加载word2vec时出现内存错误

我正在使用gensim库从GoogleNews数据集中加载经过预训练的单词向量。该数据集包含300万个维度的3000000个词向量。当我想加载GoogleNews数据集时,出现内存错误。我曾经尝试过此代码而没有内存错误,而且我不知道为什么现在会收到此错误。我已经检查了很多网站来解决此问题,但我无法理解。这是我加载GoogleNews的代码:

import gensim.models.keyedvectors as word2vec
model=word2vec.KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin",binary=True)
Run Code Online (Sandbox Code Playgroud)

这是我收到的错误:

File "/home/mahsa/PycharmProjects/tensor_env_project/word_embedding_DUC2007/inspect_word2vec-master/word_embeddings_GoogleNews.py", line 8, in <module>
    model=word2vec.KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin",binary=True)
  File "/home/mahsa/anaconda3/envs/tensorflow_env/lib/python3.5/site-packages/gensim/models/keyedvectors.py", line 212, in load_word2vec_format
    result.syn0 = zeros((vocab_size, vector_size), dtype=datatype)
MemoryError
Run Code Online (Sandbox Code Playgroud)

有谁能够帮助我?谢谢。

python gensim google-news word2vec word-embedding

5
推荐指数
1
解决办法
3163
查看次数

将字典写入 json 结果是一个空文件

我想在 json 文件中写入字典。我通过以下代码执行此操作:

with open("my_file.json","w+") as f:
    json.dumps(my_dict,f)
Run Code Online (Sandbox Code Playgroud)

但写入后,我看到一个空的 json 文件。的每个元素my_dict都是一个单词作为键,其 50 长度的单词嵌入向量作为值,例如单词girl及其向量:

'girl': [-0.1311900019645691, -0.1871200054883957, 0.43307000398635864, -0.41328999400138855, -0.29401999711990356, -0.004130200017243624, 0.26743999123573303, -0.07822400331497192, 0.5190600156784058, 0.7133600115776062, -0.3792000114917755, -0.880620002746582, 0.9063299894332886, -0.3437800109386444, -0.06771499663591385, -0.2867799997329712, -0.2138500064611435, 0.5637699961662292, 0.23059000074863434, 0.36699000000953674, 0.3780199885368347, -0.11691000312566757, 0.2890999913215637, -0.20220999419689178, -0.5123500227928162, 0.894569993019104, 0.17660999298095703, -0.1632000058889389, 0.4038200080394745, 0.1188800036907196, -1.2901999950408936, 0.02515999972820282, -0.21669000387191772, 0.9924299716949463, 0.24647000432014465, -0.12221000343561172, -0.05487800016999245, 0.2543500065803528, -0.5199699997901917, 0.28192999958992004, 0.45430999994277954, -0.5873399972915649, 0.26017001271247864, 0.42120999097824097, -0.4826599955558777, -0.1054999977350235, -0.29346001148223877, 0.38749998807907104, -0.9690999984741211, -0.44870999455451965]
Run Code Online (Sandbox Code Playgroud)

我该如何解决这个问题?谢谢。

python json dictionary

3
推荐指数
1
解决办法
2495
查看次数

AttributeError: 模块 'urllib3' 没有属性 'urlretrieve'

我正在尝试使用此链接中的代码通过 keras 执行 word2vec。

我在这一行收到错误:

filename, _ = urllib.urlretrieve(url + filename, filename)
Run Code Online (Sandbox Code Playgroud)

错误是:

AttributeError: 模块 'urllib' 没有属性 'urlretrieve'

为了解决它,我安装并导入了 urllib3 并将该行更改为:

filename, _ = urllib3.urlretrieve(url + filename, filename)
Run Code Online (Sandbox Code Playgroud)

但我再次收到该错误:

AttributeError: 模块 'urllib3' 没有属性 'urlretrieve'

我该如何解决?

python urllib text-mining

1
推荐指数
1
解决办法
7998
查看次数