如何从 nltk 下载器中删除数据/模型?

dia*_*dia 9 python directory nltk delete-file

我在 python3 NLTK(通过nltk.download())中安装了一些 NLTK 包,尝试了它们并且 - 不需要它们 - 现在想删除它们。

如何large_grammars从我的 NLTK 安装中删除例如包?(我不想删除完整的 NLTK 安装!)

alv*_*vas 7

默认情况下,NLTK 包/数据保存在nltk_data目录中。

首先,您必须找到目录可能在哪里:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']
Run Code Online (Sandbox Code Playgroud)

检查的确切位置nltk_data

>>> import os
>>> next(p for p in nltk.data.path if os.path.exists(p))
'/home/alvas/nltk_data'
Run Code Online (Sandbox Code Playgroud)

在 linux 上,只需转到命令行上的目录:

$ cd /home/alvas/nltk_data/
$ ls
corpora  grammars  tokenizers
$ cd grammars/
$ ls
large_grammars  large_grammars.zip
$ rm -rf large_grammars 
$ rm large_grammars.zip 
Run Code Online (Sandbox Code Playgroud)