使用 sarama 编写 Kafka 生产者时时间戳无效

sca*_*del 4 go apache-kafka apache-kafka-streams sarama

我有一个 Kafka 实例正在运行(本地,在 Docker 中),并且我使用sarama 包在 Go 中创建了一个生产者。

由于我想在我的主题上使用 Kafka Streams,生产者必须在消息中嵌入时间戳,否则我会收到这个丑陋的错误消息:

org.apache.kafka.streams.errors.StreamsException:输入记录ConsumerRecord(主题=crawler_events,分区= 0,偏移= 0,CreateTime = -1,序列化键大小= -1,序列化值大小= 187,标题= RecordHeaders( headers = []、isReadOnly = false)、key = null、value = {XXX}) 具有无效(负)时间戳。可能是因为使用 0.10 之前版本的生产者客户端将此记录写入 Kafka,而没有嵌入时间戳,或者因为输入主题是在 Kafka 集群升级到 0.10+ 之前创建的。使用不同的 TimestampExtractor 来处理此数据。

以下是在我的 Go 程序中发送消息的代码部分:

// Init a connection to the Kafka host,
// create the producer,
// and count successes and errors in delivery
func (c *kafkaClient) init() {
    config := sarama.NewConfig()
    config.Producer.Return.Successes = true
    c.config = *config
    var err error
    c.producer, err = sarama.NewAsyncProducer(c.hosts, &c.config)
    if err != nil {
        panic(err)
    }
    go func() {
        for range c.producer.Successes() {
            c.successes++
        }
    }()
    go func() {
        for range c.producer.Errors() {
            c.errors++
        }
    }()
}

// Send a message to the Kafka topic, WITH TIMESTAMP
func (c *kafkaClient) send(event string) {
    message := &sarama.ProducerMessage{
        Topic: c.topic,
        Value: sarama.StringEncoder(event),
        Timestamp: time.Now(),
    }
    c.producer.Input() <- message
    c.enqueued++
}
Run Code Online (Sandbox Code Playgroud)

如您所见,我尝试发送的时间戳是time.Now()

当我运行控制台消费者查看收到的时间戳时:

docker-compose exec kafka /opt/kafka/bin/kafka-console-consumer.sh \
  --bootstrap-server localhost:9092 --topic crawler_events \
  --from-beginning --property print.timestamp=true
Run Code Online (Sandbox Code Playgroud)

我看到它们都是“-1”:

CreateTime:-1   {"XXX"}
Run Code Online (Sandbox Code Playgroud)

当使用控制台生产者向主题添加消息时,我有预期的时间戳,例如:

CreateTime:1539010180284        hello
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?感谢您的帮助。

Mic*_*son 5

Sarama 默认使用 Kafka 版本 0.8.2。这意味着它在与代理交谈时将使用旧的 0.8.2 格式请求。

由于时间戳支持仅在 0.10 中添加,如果您没有显式指定 >= 0.10 的版本,您的时间戳将不会转发到代理。

您需要添加config.Version = sarama.V0_10_0_0到您的代码中,时间戳才会起作用。

  • 是的!太感谢了。而且,不需要“Timestamp: time.Now()”行。事实上,“时间戳是代理分配给消息的时间戳”([文档](https://godoc.org/github.com/Shopify/sarama#ProducerMessage))。 (2认同)