我正在尝试从 nltk.corpus 导入停用词。我无法使用 nltk.download('stopwords') 因为我有代理问题。我试图手动导入停用词。所以这就是我所做的。我从 github.com 下载了 nltk_data 并使用 nltk.data.path 配置了适当的路径。但是当我尝试运行此代码时:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))
Run Code Online (Sandbox Code Playgroud)
>Resource 'corpora/stopwords' not found. Please use the NLTK
>Downloader to obtain the resource: >>> nltk.download()
>Searched in:
-'C:\\Program Files\\Anaconda3\\Lib\nltk_data'
Run Code Online (Sandbox Code Playgroud)
我所有的 nltk 数据都存在于上述路径中,并且语料库文件夹也有停用词。正如我上面所说,我不能使用 nltk.download()。有什么我在这里错过的吗?
我重置了所有 spyder 设置并再次运行此代码。:
import nltk
from nltk.corpus import stopwords
print(stopwords.words('english'))
Run Code Online (Sandbox Code Playgroud)
我收到如下错误:
LookupError:
**********************************************************************
Resource 'corpora/stopwords' not found. Please use the NLTK
Downloader to obtain the resource: >>> nltk.download()
Searched in:
- 'C:\\Users\\586594/nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
- 'C:\\Program Files\\Anaconda3\\nltk_data'
- 'C:\\Program Files\\Anaconda3\\lib\\nltk_data'
- 'C:\\Users\\586594\\AppData\\Roaming\\nltk_data'
**********************************************************************
Run Code Online (Sandbox Code Playgroud)
我所有的 nltk 数据都存在于“C:\Program Files\Anaconda3\nltk_data”中,并且语料库目录中有停用词。
| 归档时间: |
|
| 查看次数: |
7340 次 |
| 最近记录: |