如何使用“pip install -r requests.txt”通过“requirements.txt”下载 NLTK 语料库?

Fra*_*urt 6 python pip corpus nltk requirements.txt

可以下载 NLTK 语料库punktwordnet通过命令行:

python3 -m nltk.downloader punkt wordnet
Run Code Online (Sandbox Code Playgroud)

如何使用 下载 NLTKrequirements.txt语料库pip install -r requirements.txt

例如,可以通过添加模型的 URL 来下载 spacy 模型requirements.txtpip install -r requirements.txt例如https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.0.0/en_core_web_sm-2.0.0.tar.gz #egg=en_core_web_sm==2.0.0requirements.txt

phd*_*phd 5

如何通过以下方式下载 NLTK 语料库:requirements.txt

简短的回答:没办法。

spacy 模型的 URL 指向一个Python 包setup.py以及所有这些),因此可以通过pip. pipNLTK 数据没有这样的可安装包。nltk.downloader以自己的格式下载数据。


Sam*_*hoo 5

没有办法通过requirements.txt 文件来实际做到这一点。但是,如果您需要将 NLTK 用于 wordnet 和 punkt,您可以做的就是拥有 2 个文件。下载一个 nltk 数据并将该文件导入到您的主文件中。例如,

nltkmodules.py:

import nltk

nltk.download('wordnet')
nltk.download('punkt')
Run Code Online (Sandbox Code Playgroud)

主要.py:

import nltkmodules

# Rest of Code goes here
Run Code Online (Sandbox Code Playgroud)

在您的requirements.txt中,您可以只包含:

nltk==3.5
Run Code Online (Sandbox Code Playgroud)