Kafka 在尝试访问磁盘上的日志文件时抛出异常磁盘错误

Jac*_*ack 8 apache-kafka

我的 Kafka 集群(10 个节点,5 个 zk 节点)突然抛出磁盘错误异常如下:

ERROR [ReplicaFetcher replicaId=196790673, 
leaderId=196790680, fetcherId=0] 
Error for partition test-topic-23 at offset 1012839
(kafka.server.ReplicaFetcherThread)
org.apache.kafka.common.errors.KafkaStorageException: 
Disk error when trying to access log file on the disk
Run Code Online (Sandbox Code Playgroud)

所以我的 Kafka 生产者和消费者失败了,但我仍然可以创建一个具有 36 个分区和 2 个副本的新主题,并且我可以从新主题写入/读取。当我在命令行中尝试读/写旧主题时,有时好有时失败。

我也尝试在磁盘上创建一个文件/文件夹,也可以。所以我很困惑为什么 Kafka 会抛出磁盘错误异常。

Den*_*din 0

这听起来很明显,但如果出现磁盘错误,首先要检查的是磁盘。它是否已损坏,或者可能只是一个完整的分区?

另请注意,也许磁盘仍然可以工作一点,或者您可能有多个磁盘,因此像“我仍然可以使用某些磁盘”这样的测试不会提供太多信息。