相关疑难解决方法(0)

如何为TextCategorizer培训创建黄金数据?

我想用以下(text, label)对训练TextCategorizer模型.

标签颜色:

  • 门是棕色的.
  • 谷仓是红色的.
  • 花是黄色的.

标签动物:

  • 那匹马正在奔跑.
  • 鱼正在跳跃.
  • 鸡睡着了.

我正在复制TextCategorizer文档中的示例代码.

textcat = TextCategorizer(nlp.vocab)
losses = {}
optimizer = nlp.begin_training()
textcat.update([doc1, doc2], [gold1, gold2], losses=losses, sgd=optimizer)
Run Code Online (Sandbox Code Playgroud)

doc变量可能只是nlp("The door is brown.")等等.什么应该gold1gold2?我猜他们应该是GoldParse对象,但我不知道你如何表示那些文本分类信息.

spacy

7
推荐指数
1
解决办法
1267
查看次数

标签 统计

spacy ×1