如何从spacy vocab中获取所有单词?

ash*_*ids 3 nlp python-3.x spacy

我需要spacy vocab的所有话。假设我将spacy模型初始化为

nlp = spacy.load('en')
Run Code Online (Sandbox Code Playgroud)

如何从nlp.vocab中获取单词文本?

tyr*_*rex 8

从 spaCy v3.0 开始,我们需要运行

python -m spacy download en_core_web_sm

然后例如

import spacy
nlp = spacy.load("en_core_web_sm")
words = set(nlp.vocab.strings)
word = 'would'
print(f"Is '{word}' an English word: {word in words}")  # True
Run Code Online (Sandbox Code Playgroud)


Dav*_*vid 6

您可以将其作为如下列表获取:

list(nlp.vocab.strings)
Run Code Online (Sandbox Code Playgroud)