我想用以下(text, label)对训练TextCategorizer模型.
标签颜色:
标签动物:
我正在复制TextCategorizer文档中的示例代码.
textcat = TextCategorizer(nlp.vocab)
losses = {}
optimizer = nlp.begin_training()
textcat.update([doc1, doc2], [gold1, gold2], losses=losses, sgd=optimizer)
Run Code Online (Sandbox Code Playgroud)
doc变量可能只是nlp("The door is brown.")等等.什么应该gold1和gold2?我猜他们应该是GoldParse对象,但我不知道你如何表示那些文本分类信息.
spacy ×1