使用nltk.download()下载错误

use*_*609 16 python ubuntu nltk python-2.7 spyder

我正在使用Python试验NLTK包.我尝试使用下载NLTK nltk.download().我收到了这种错误信息.如何解决这个问题呢?谢谢.

我使用的系统是在VMware下安装的Ubuntu.IDE是Spyder.

在此输入图像描述

使用后nltk.download('all'),它可以下载一些软件包,但下载时会收到错误信息oanc_masc

在此输入图像描述

alv*_*vas 21

要下载特定数据集/模型,请使用该nltk.download()功能,例如,如果您要下载punkt句子标记器,请使用:

$ python3
>>> import nltk
>>> nltk.download('punkt')
Run Code Online (Sandbox Code Playgroud)

如果您不确定需要哪种数据/模型,可以从基本的数据+模型列表开始:

>>> import nltk
>>> nltk.download('popular')
Run Code Online (Sandbox Code Playgroud)

它将下载"热门"资源列表.

确保您拥有最新版本,NLTK因为它始终在不断改进并不断维护:

$ pip install --upgrade nltk
Run Code Online (Sandbox Code Playgroud)

EDITED

如果有人nltk/sf/answers/2669471451/下载更大数据集时避免错误

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')
Run Code Online (Sandbox Code Playgroud)

如果有人想查找nltk_data目录,请参阅/sf/answers/2546832011/

有关配置nltk_data路径,请参阅/sf/answers/1609116211/


tol*_*maz 8

从命令行,导入nltk后,尝试

nltk.download('popular', halt_on_error=False)
Run Code Online (Sandbox Code Playgroud)

发生错误后,它会要求重试破坏的软件包,只需要拒绝n,它将继续使用正确的软件包.