Jos*_*h N 1 dataflow apache-kafka google-cloud-platform google-cloud-dataflow
我正在使用数据流 kafka 到 bigquery 模板。启动数据流作业后,它会在队列中停留一段时间,然后失败并显示以下错误:
Error occurred in the launcher container: Template launch failed. See console logs.
Run Code Online (Sandbox Code Playgroud)
查看日志时,我看到以下堆栈跟踪:
at org.apache.beam.runners.dataflow.DataflowRunner.run(DataflowRunner.java:192)
at org.apache.beam.sdk.Pipeline.run(Pipeline.java:317)
at org.apache.beam.sdk.Pipeline.run(Pipeline.java:303)
at com.google.cloud.teleport.v2.templates.KafkaToBigQuery.run(KafkaToBigQuery.java:343)
at com.google.cloud.teleport.v2.templates.KafkaToBigQuery.main(KafkaToBigQuery.java:222)
Caused by: org.apache.kafka.common.errors.TimeoutException: Timeout expired while fetching topic metadata –
Run Code Online (Sandbox Code Playgroud)
在启动工作时,我提供了以下参数:
我的 kafka 主题只包含消息:你好
kafka 安装在 gcp 实例中,该实例与数据流工作者位于同一区域和子网中。
小智 5
在这里添加这个作为后代的答案:
“获取主题元数据时超时”表示 Kafka 客户端无法连接到代理以获取元数据。这可能是由于各种原因造成的,例如工作虚拟机无法与代理通信(您是通过公共 ip 还是私有 ip 通信?如果使用公共 ip,请检查传入的防火墙设置)。也可能是由于端口不正确或代理需要 SSL 连接。一种确认方法是将 Kafka 客户端安装在与 Dataflow 工作线程相同的子网中的 GCE 虚拟机上,然后验证 kafka 客户端是否可以连接到 Kafka 代理。
参考 [1] 配置 Kafka 客户端的 ssl 设置(您可以在 GCE 实例上使用 cli 进行测试)。管理代理的团队可以告诉您他们是否需要 SSL 连接。
[1] https://docs.confluent.io/platform/current/kafka/authentication_ssl.html#clients
| 归档时间: |
|
| 查看次数: |
382 次 |
| 最近记录: |