我已经在spaCy中使用自定义令牌生成器训练了自定义NER模型。我想保存不带分词器的NER模型。我在spaCy支持论坛中尝试了以下代码:
import spacy
nlp = spacy.load("en")
nlp.tokenizer = some_custom_tokenizer
# Train the NER model...
nlp.tokenizer = None
nlp.to_disk('/tmp/my_model', disable=['tokenizer'])
Run Code Online (Sandbox Code Playgroud)
当我尝试加载它时,管道是空的,而且令人惊讶的是它具有默认的spaCy标记器。
nlp = spacy.blank('en').from_disk('/tmp/model', disable=['tokenizer'])
Run Code Online (Sandbox Code Playgroud)
知道如何在没有标记器的情况下加载模型,但要获得完整的管道吗?谢谢
小智 9
nlp = spacy.load('/tmp/model')将模型保存到磁盘后,您可以使用它来加载模型。根据 Spacy 文档(https://spacy.io/usage/training#section-saving-loading)做你所做的显然只加载二进制数据
| 归档时间: |
|
| 查看次数: |
3260 次 |
| 最近记录: |