BufferError:本地:Python 中的队列已满

Arp*_*ain 4 python apache-kafka

import logging
from confluent_kafka import Producer
import os

logger = logging.getLogger("main")

BOOTSTRAP_SERVERS = os.environ['BOOTSTRAP_SERVERS']
APPLICATION_ID = os.getenv('APPLICATION_ID', default = "nke-data-source")
RECONNECT_BACKOFF_MS = os.getenv('RECONNECT_BACKOFF_MS', default = 1000)
REQUEST_TIMEOUT_MS = os.getenv('REQUEST_TIMEOUT_MS', default = 40000)
ACKS = os.getenv('ACKS', default = "all")
RETRIES = os.getenv('RETRIES', default = 15)
RETRY_BACK_OFF = os.getenv('RETRY_BACK_OFF', default = 1000)
MAX_IN_FLIGHT_REQUESTS = os.getenv('MAX_IN_FLIGHT_REQUESTS', default = 1)
topic = os.getenv('OUTBOUND_TOPIC', default = "tti-nke-raw")

p = Producer({'bootstrap.servers': BOOTSTRAP_SERVERS, 
    'client.id': APPLICATION_ID, 
    'reconnect.backoff.ms': RECONNECT_BACKOFF_MS,
    'request.timeout.ms': REQUEST_TIMEOUT_MS,
    'acks': ACKS,
    'retries': RETRIES,
    'retry.backoff.ms': RETRY_BACK_OFF,
    'max.in.flight.requests.per.connection': MAX_IN_FLIGHT_REQUESTS,
    'compression.type': "lz4"})

def send(key, event):
    try:
        logger.info("Sending key: [{0}] value: [{1}]".format(key, event))
        p.produce(topic=topic, value=event.encode('utf-8'), key=key)
    except Exception:
        logger.error("error sending events to kafka", exc_info=True)

Run Code Online (Sandbox Code Playgroud)

错误:-

Traceback (most recent call last):
BufferError: Local: Queue full
File "/app/sender.py", line 30, in send
p.produce(topic=topic, value=event.encode('utf-8'), key=key)

Run Code Online (Sandbox Code Playgroud)

任何人都可以帮助我,因为我是 python 新手

Rez*_*nik 6

Queue是在librdkafka库中实现的东西(confluent_kafka绑定到)

有一个Queue生产者的内部,它接受生产者交付报告并等待生产者处理它们(主要是什么都不做),但是您需要触发这种通过队列的机制,可以通过调用简单调用poll

你应该producer.poll(0)在每次产生这样的变化后调用:

p.produce(topic=topic, value=event.encode('utf-8'), key=key)
Run Code Online (Sandbox Code Playgroud)

进入:

p.produce(topic=topic, value=event.encode('utf-8'), key=key)
p.poll(0)
Run Code Online (Sandbox Code Playgroud)

这将触发队列清理,不要担心性能,因为这是一个非常简单的函数,实际上并没有像 librdkafka 的作者所写的那样做:

poll() 调用起来很便宜,它不会对性能产生影响,所以请将它添加到您的生产者循环中。

基本上它做什么:

定期调用 poll() 为生产者的交付报告回调提供服务。

考虑这个阅读关于这个问题