sca*_*del 4 go apache-kafka apache-kafka-streams sarama
我有一个 Kafka 实例正在运行(本地,在 Docker 中),并且我使用sarama 包在 Go 中创建了一个生产者。
由于我想在我的主题上使用 Kafka Streams,生产者必须在消息中嵌入时间戳,否则我会收到这个丑陋的错误消息:
org.apache.kafka.streams.errors.StreamsException:输入记录ConsumerRecord(主题=crawler_events,分区= 0,偏移= 0,CreateTime = -1,序列化键大小= -1,序列化值大小= 187,标题= RecordHeaders( headers = []、isReadOnly = false)、key = null、value = {XXX}) 具有无效(负)时间戳。可能是因为使用 0.10 之前版本的生产者客户端将此记录写入 Kafka,而没有嵌入时间戳,或者因为输入主题是在 Kafka 集群升级到 0.10+ 之前创建的。使用不同的 TimestampExtractor 来处理此数据。
以下是在我的 Go 程序中发送消息的代码部分:
// Init a connection to the Kafka host,
// create the producer,
// and count successes and errors in delivery
func (c *kafkaClient) init() {
config := sarama.NewConfig()
config.Producer.Return.Successes = true
c.config = *config
var err error
c.producer, err = sarama.NewAsyncProducer(c.hosts, &c.config)
if err != nil {
panic(err)
}
go func() {
for range c.producer.Successes() {
c.successes++
}
}()
go func() {
for range c.producer.Errors() {
c.errors++
}
}()
}
// Send a message to the Kafka topic, WITH TIMESTAMP
func (c *kafkaClient) send(event string) {
message := &sarama.ProducerMessage{
Topic: c.topic,
Value: sarama.StringEncoder(event),
Timestamp: time.Now(),
}
c.producer.Input() <- message
c.enqueued++
}
Run Code Online (Sandbox Code Playgroud)
如您所见,我尝试发送的时间戳是time.Now()。
当我运行控制台消费者查看收到的时间戳时:
docker-compose exec kafka /opt/kafka/bin/kafka-console-consumer.sh \
--bootstrap-server localhost:9092 --topic crawler_events \
--from-beginning --property print.timestamp=true
Run Code Online (Sandbox Code Playgroud)
我看到它们都是“-1”:
CreateTime:-1 {"XXX"}
Run Code Online (Sandbox Code Playgroud)
当使用控制台生产者向主题添加消息时,我有预期的时间戳,例如:
CreateTime:1539010180284 hello
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?感谢您的帮助。
Sarama 默认使用 Kafka 版本 0.8.2。这意味着它在与代理交谈时将使用旧的 0.8.2 格式请求。
由于时间戳支持仅在 0.10 中添加,如果您没有显式指定 >= 0.10 的版本,您的时间戳将不会转发到代理。
您需要添加config.Version = sarama.V0_10_0_0到您的代码中,时间戳才会起作用。