小编Lee*_* He的帖子

在Spacy NER模型中进行评估

我正在尝试评估使用spacy lib创建的训练有素的NER模型.通常对于这些问题,您可以使用f1分数(精确度和召回率之间的比率).我在文档中找不到训练有素的NER模型的精确度函数.

我不确定它是否正确,但我尝试使用以下方式(示例)并使用f1_scorefrom sklearn:

from sklearn.metrics import f1_score
import spacy
from spacy.gold import GoldParse


nlp = spacy.load("en") #load NER model
test_text = "my name is John" # text to test accuracy
doc_to_test = nlp(test_text) # transform the text to spacy doc format

# we create a golden doc where we know the tagged entity for the text to be tested
doc_gold_text= nlp.make_doc(test_text)
entity_offsets_of_gold_text = [(11, 15,"PERSON")]
gold = GoldParse(doc_gold_text, entities=entity_offsets_of_gold_text)

# bring the data in …
Run Code Online (Sandbox Code Playgroud)

python spacy

11
推荐指数
2
解决办法
6688
查看次数

在 RabbitMQ pika 阻塞连接上调用 process_data_events() 时出现“TypeError: heap argument must be a list”

在发布消息之前,代码会在进行实际发布之前检查 RabbitMQ 连接是否未关闭(请参阅下面的调用代码)。然而,当这个检查完成时,似乎出现了一些奇怪的 TypeError。

更多细节:

  • 异步使用者(即使用选择连接pika.SelectConnection)侦听特定队列。
  • 当消费者处理一条消息时,它将通过非异步生产者(即使用阻塞连接pika.BlockingConnection)将其他消息发布到另一个队列。
  • 消费者和生产者是独立的代码段,但位于相同的代码库中并在同一服务器上的同一进程(和线程)中运行。它们被分开是为了更好的代码解耦。
  • 只有消费者是异步的原因是因为调用rmq_consumer_connection.ioloop.start()是一个阻塞操作(因此不能做等效的rmq_producer_connection.ioloop.start())。我可能会考虑在未来进行优化(例如,为消费者和生产者使用单独的线程,这样两者都可以是异步的)。
  • 使用鼠兔 0.12.0、RabbitMQ 3.7.8、Python 3.5

堆栈跟踪如下:

Apr 05 19:25:16 prod python[23326]: job|callback_user_queue|ERROR| Exception in callback_user_queue(..)
Apr 05 19:25:16 prod python[23326]: Traceback (most recent call last):
Apr 05 19:25:16 prod python[23326]:   File "/opt/app/gateway_messenger.py", line 282, in send_to_gateway
Apr 05 19:25:16 prod python[23326]:     gv.rmq_producer_connection.process_data_events()
Apr 05 19:25:16 prod python[23326]:   File "/home/prod/anaconda3/envs/venv/lib/python3.5/site-packages/pika/adapters/blocking_connection.py", line 751, in process_data_events
Apr 05 19:25:16 prod python[23326]:     with _IoloopTimerContext(time_limit, self._impl) as timer:
Apr …
Run Code Online (Sandbox Code Playgroud)

python rabbitmq pika

5
推荐指数
0
解决办法
761
查看次数

标签 统计

python ×2

pika ×1

rabbitmq ×1

spacy ×1