从 Kafka 读取数据到 AWS Redshift 的最佳实践

Era*_*ran 5 amazon-web-services apache-kafka amazon-redshift aws-lambda

将数据从 Kafka 集群移动到 Redshift 表的最佳实践是什么?我们有连续数据到达 Kafka,我想将其写入 Redshift 中的表(不必实时)。

  • 我应该使用 Lambda 函数吗?
  • 我应该编写一个将在专用 EC2 实例上运行的 Redshift 连接器(消费者)吗?(缺点是我需要处理冗余)
  • 是否有一些 AWS 管道服务?

Rob*_*att 9

Kafka Connect 通常用于将数据从 Kafka 流式传输到(或从)数据存储。它可以做一些有用的事情,比如自动管理横向扩展、故障转移、模式、序列化等等。

此博客展示了如何使用开源 JDBC Kafka Connect 连接器流式传输到 Redshift。还有一个社区 Redshift connector,但我没有尝试过。

这个博客展示了另一种方法,不使用 Kafka Connect。

免责声明:我为创建 JDBC 连接器的 Confluent 工作。