nltk 数据的替代来源

Mor*_*rtz 5 nltk python-3.x

我正在尝试通过文档中提到的这些命令安装 nltk 语料库 -

import nltk
nltk.download()
Run Code Online (Sandbox Code Playgroud)

然而,我是在我愚蠢的组织中这样做的,该组织已经阻止了 github,而这正是上面的下载功能尝试连接的地方。

是否有 nltk 数据的备用存储库,我可以在其中尝试此操作?尝试将 github 和相关网站列入白名单只会陷入繁文缛节。

谢谢

m00*_*0am 1

您可以尝试下载 nltk 的 Arch Linux 软件包,其中包含您需要的所有文件。

  1. 使用右侧“软件包操作”框中的“从镜像下载”链接从Archlinux 软件包网站下载软件包,或者您也可以仅使用此链接
  2. 解压该文件(它是 xzipped tar 存档)。我在 Linux 上使用 ark,不确定什么是适合您系统的软件(在 Windows 上 7zip 和 winrar 应该能够处理这个问题)。
  3. 您可以在文件夹中找到这些文件usr/share/nltk_data
  4. nltk_data文件夹移动到计算机上的适当路径。