我想在Ubuntu中安装pyrouge用于文本摘要评估。我使用this中的说明。
首先我写pip install pyrouge然后我必须写这个命令:pyrouge_set_rouge_path /absolute/path/to/ROUGE-1.5.5/directory.
在我的系统中,我写道:
pyrouge_set_rouge_path /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyrouge
Run Code Online (Sandbox Code Playgroud)
得到这个:
例外:无法设置数据目录,因为路径 /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyrouge/data 不存在。
并且
pyrouge_set_rouge_path /home/afsharizadeh/pyrouge-0.1.0/pyrouge
Run Code Online (Sandbox Code Playgroud)
得到这个:
例外:无法设置数据目录,因为路径 /home/afsharizadeh/pyrouge-0.1.0/pyrouge/data 不存在。
并且
pyrouge_set_rouge_path /home/afsharizadeh/pyrouge-0.1.0/pyrouge/test
Run Code Online (Sandbox Code Playgroud)
得到这个:
例外:在 /home/afsharizadeh/pyrouge-0.1.0/pyrouge/test/ROUGE-1.5.5.pl 中找不到 ROUGE 二进制文件。请通过运行pyrouge_set_rouge_path /path/to/rouge/home 设置正确的路径。
我知道关于这个问题的类似问题是在堆栈溢出中被问到的,但我无法解决我的问题,因为我根本不知道“ROUGE path”这个表达是什么意思。“通往 ROUGE-1.5.5 的路径”是什么意思?
我知道我有两个关于pyrouge的目录。其中一个是这个路径:~/anaconda3/lib/python3.6/site-packages/pyrouge另一个是我从站点下载的目录。这条路是:~/pyrouge-0.1.0。该目录还有其他三个目录,名称分别为:bin、pyrouge、pyrouge.egg-info。
基于此页面,我以这种格式编写:
set pyrouge_set_rouge_path=/home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyroug
Run Code Online (Sandbox Code Playgroud)
在这种格式之后,没有错误出现,但之后我输入:
python -m pyrouge.test
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
例外:无法设置数据目录,因为路径 /home/afsharizadeh/anaconda3/lib/python3.6/site-packages/pyroug/data 不存在。
-------------------------------------------------- -------------------- 在 0.592 秒内运行 11 个测试
失败(错误=9)
我该怎么办?
我正在使用gensim库从GoogleNews数据集中加载经过预训练的单词向量。该数据集包含300万个维度的3000000个词向量。当我想加载GoogleNews数据集时,出现内存错误。我曾经尝试过此代码而没有内存错误,而且我不知道为什么现在会收到此错误。我已经检查了很多网站来解决此问题,但我无法理解。这是我加载GoogleNews的代码:
import gensim.models.keyedvectors as word2vec
model=word2vec.KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin",binary=True)
Run Code Online (Sandbox Code Playgroud)
这是我收到的错误:
File "/home/mahsa/PycharmProjects/tensor_env_project/word_embedding_DUC2007/inspect_word2vec-master/word_embeddings_GoogleNews.py", line 8, in <module>
model=word2vec.KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin",binary=True)
File "/home/mahsa/anaconda3/envs/tensorflow_env/lib/python3.5/site-packages/gensim/models/keyedvectors.py", line 212, in load_word2vec_format
result.syn0 = zeros((vocab_size, vector_size), dtype=datatype)
MemoryError
Run Code Online (Sandbox Code Playgroud)
有谁能够帮助我?谢谢。
我想在 json 文件中写入字典。我通过以下代码执行此操作:
with open("my_file.json","w+") as f:
json.dumps(my_dict,f)
Run Code Online (Sandbox Code Playgroud)
但写入后,我看到一个空的 json 文件。的每个元素my_dict都是一个单词作为键,其 50 长度的单词嵌入向量作为值,例如单词girl及其向量:
'girl': [-0.1311900019645691, -0.1871200054883957, 0.43307000398635864, -0.41328999400138855, -0.29401999711990356, -0.004130200017243624, 0.26743999123573303, -0.07822400331497192, 0.5190600156784058, 0.7133600115776062, -0.3792000114917755, -0.880620002746582, 0.9063299894332886, -0.3437800109386444, -0.06771499663591385, -0.2867799997329712, -0.2138500064611435, 0.5637699961662292, 0.23059000074863434, 0.36699000000953674, 0.3780199885368347, -0.11691000312566757, 0.2890999913215637, -0.20220999419689178, -0.5123500227928162, 0.894569993019104, 0.17660999298095703, -0.1632000058889389, 0.4038200080394745, 0.1188800036907196, -1.2901999950408936, 0.02515999972820282, -0.21669000387191772, 0.9924299716949463, 0.24647000432014465, -0.12221000343561172, -0.05487800016999245, 0.2543500065803528, -0.5199699997901917, 0.28192999958992004, 0.45430999994277954, -0.5873399972915649, 0.26017001271247864, 0.42120999097824097, -0.4826599955558777, -0.1054999977350235, -0.29346001148223877, 0.38749998807907104, -0.9690999984741211, -0.44870999455451965]
Run Code Online (Sandbox Code Playgroud)
我该如何解决这个问题?谢谢。
我正在尝试使用此链接中的代码通过 keras 执行 word2vec。
我在这一行收到错误:
filename, _ = urllib.urlretrieve(url + filename, filename)
Run Code Online (Sandbox Code Playgroud)
错误是:
AttributeError: 模块 'urllib' 没有属性 'urlretrieve'
为了解决它,我安装并导入了 urllib3 并将该行更改为:
filename, _ = urllib3.urlretrieve(url + filename, filename)
Run Code Online (Sandbox Code Playgroud)
但我再次收到该错误:
AttributeError: 模块 'urllib3' 没有属性 'urlretrieve'
我该如何解决?
python ×4
dictionary ×1
gensim ×1
google-news ×1
json ×1
rouge ×1
text-mining ×1
ubuntu ×1
urllib ×1
word2vec ×1