未找到资源“语料库/停用词”

Question

未找到资源“语料库/停用词”

我正在尝试从 nltk.corpus 导入停用词。我无法使用 nltk.download('stopwords') 因为我有代理问题。我试图手动导入停用词。所以这就是我所做的。我从 github.com 下载了 nltk_data 并使用 nltk.data.path 配置了适当的路径。但是当我尝试运行此代码时：

import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))

Run Code Online (Sandbox Code Playgroud)

我收到这样的错误。

 >Resource 'corpora/stopwords' not found.  Please use the NLTK
 >Downloader to obtain the resource:  >>> nltk.download()
 >Searched in:
 -'C:\\Program Files\\Anaconda3\\Lib\nltk_data'

Run Code Online (Sandbox Code Playgroud)

我所有的 nltk 数据都存在于上述路径中，并且语料库文件夹也有停用词。正如我上面所说，我不能使用 nltk.download()。有什么我在这里错过的吗？

更新 1

我重置了所有 spyder 设置并再次运行此代码。：

    import nltk
    from nltk.corpus import stopwords
    print(stopwords.words('english'))

Run Code Online (Sandbox Code Playgroud)

我收到如下错误：

LookupError: 
**********************************************************************
  Resource 'corpora/stopwords' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - 'C:\\Users\\586594/nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - 'C:\\Program Files\\Anaconda3\\nltk_data'
    - 'C:\\Program Files\\Anaconda3\\lib\\nltk_data'
    - 'C:\\Users\\586594\\AppData\\Roaming\\nltk_data'
**********************************************************************

Run Code Online (Sandbox Code Playgroud)

我所有的 nltk 数据都存在于“C:\Program Files\Anaconda3\nltk_data”中，并且语料库目录中有停用词。

Answer 1

小智 5

我通过导入 nltk 并从中下载“停用词”来修复它。

import nltk nltk.download('stopwords')

归档时间：	8 年，6 月前
查看次数：	7340 次
最近记录：	6 年，9 月前