在 Kafka-Connect 中自动重新连接失败的任务

tot*_*oto 5 apache-kafka apache-kafka-connect mongodb-kafka-connector

我正在使用带有 Kafka-connect 的 mongo-source 插件。我检查了任务状态,它正在运行并监听 mongo 集合。

我手动停止了 mongod 服务并等待了大约 1 分钟,然后我再次启动它。

我检查了源任务,看看是否有任何东西会自行修复,30 分钟后似乎没有任何效果。

只有在重新启动连接器后,它才再次开始工作。

由于 mongo-source 没有设置超时时重试+退避的选项,我搜索了一个适合简单场景的配置:使用 Kafka-connect 配置在 X 时间后重启失败的任务。找不到任何.. :/ 我可以用一个简单的脚本来做到这一点,但是 Kafka-connect 中必须有一些东西来管理失败的任务。甚至在 mongo-source 中……我不希望它在 1 分钟后就失败得这么快……:/

Rob*_*att 12

除了使用 REST API 查找失败的任务并提交重新启动请求,然后定期运行之外,别无他法。例如

curl -s "http://localhost:8083/connectors?expand=status" | \
  jq -c -M 'map({name: .status.name } +  {tasks: .status.tasks}) | .[] | {task: ((.tasks[]) + {name: .name})}  | select(.task.state=="FAILED") | {name: .task.name, task_id: .task.id|tostring} | ("/connectors/"+ .name + "/tasks/" + .task_id + "/restart")' | \
  xargs -I{connector_and_task} curl -v -X POST "http://localhost:8083"\{connector_and_task\}
Run Code Online (Sandbox Code Playgroud)

来源:https : //rmoff.net/2019/06/06/automatically-restarting-failed-kafka-connect-tasks/

  • 好的。应该是一个内置功能。 (2认同)