spaCy 2.0:保存和加载自定义NER模型

Gin*_*ino 5 python nlp spacy

我已经在spaCy中使用自定义令牌生成器训练了自定义NER模型。我想保存不带分词器的NER模型。我在spaCy支持论坛中尝试了以下代码:

import spacy

nlp = spacy.load("en")
nlp.tokenizer = some_custom_tokenizer
# Train the NER model...
nlp.tokenizer = None
nlp.to_disk('/tmp/my_model', disable=['tokenizer'])
Run Code Online (Sandbox Code Playgroud)

当我尝试加载它时,管道是空的,而且令人惊讶的是它具有默认的spaCy标记器。

nlp = spacy.blank('en').from_disk('/tmp/model', disable=['tokenizer'])
Run Code Online (Sandbox Code Playgroud)

知道如何在没有标记器的情况下加载模型,但要获得完整的管道吗?谢谢

小智 9

nlp = spacy.load('/tmp/model')将模型保存到磁盘后,您可以使用它来加载模型。根据 Spacy 文档(https://spacy.io/usage/training#section-saving-loading)做你所做的显然只加载二进制数据