spacy.lang.en 和 load('en') 之间有什么区别?

The*_*ari 7 python nlp spacy jupyter-notebook

from spacy.lang.en import English()在我对 NLP 的研究中,更具体地说是 spacy 库,我对此感到困惑,和之间有什么区别spacy.load('en')以及它如何工作?有人可以帮我解释一下这一点,如果可能的话,举一些例子来说明这种差异?提前致谢。

Ine*_*ani 6

中的语言English类包含库 \xe2\x80\x93 中spacy.lang.en包含的特定于语言的代码和规则,例如,用于标记化的特殊情况规则、停止词或用于确定“二十二”之类的单词是否类似于数字的函数。

\n\n

spacy.load("en")使用快捷方式名称\xe2\x80\x93加载已安装的统计模型,在本例中为package.json。所以你也可以运行,这使得事情变得更加明确。加载模型将初始化相应的语言类(在本例中为),设置处理管道并加载经过训练的模型的二进制权重,以允许 spaCy 进行预测(例如,单词是否是名词或命名实体是什么)于文中)。因此,加载模型后返回的对象是的实例,但它还设置了处理管道并加载了权重。enen_core_web_smspacy.load("en_core_web_sm")EnglishnlpEnglish

\n\n

您可以在此处spacy.load找到有关幕后工作原理的更详细概述。spaCy在线课程的第一还更详细地解释了语言类和统计模型。

\n