ddd*_*ddd 5 postgresql etl data-migration amazon-web-services amazon-rds
我们不久前在 AWS 上设置了 Web 服务和数据库,应用程序现已投入生产。由于某种原因,我们需要终止旧的 AWS 并将所有内容转移到新创建的 AWS 帐户下。应用程序和所有基础设施都非常简单。但对于数据来说,这比较棘手。当前的数据库每天仍在接收大量数据。因此,最好在关闭旧应用程序并切换到新平台后迁移数据。
源 RDS 和目标 RDS 都是 Postgres。我们有大约 40GB 的数据要传输。我能想到三种方法,它们都有缺点。
serial(自动增量)。导出的 csv 的行 ID 可能与新 RDS 表中的现有数据冲突。我想知道是否有更好的方法来做到这一点。也许AWS有一些ETL工具可以点对点直接传输,而不需要使用本地计算机作为中间点。
我最近使用 Bucardo ( https://bucardo.org/ )将 RDS 的数据从一个帐户移动到另一个帐户。请参考以下博客
https://www.compose.com/articles/using-bucardo-5-3-to-migrate-a-live-postgresql-database/
https://bucardo.org/pipermail/bucardo-general/2017-February/002875.html
虽然这没有确切提到两个 RDS 帐户之间的迁移,但这可能有助于设置。我们仍然需要一些中间点,例如 EC2 实例,我们需要在其中配置此 Bucardo 并在帐户之间迁移数据。如果您正在寻找更多信息,我很乐意为您提供帮助。
简而言之,我们需要拍摄源数据库的手动快照并将其恢复到另一个帐户(https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_ShareSnapshot.html)并在其中设置 Bucardo在 EC2 实例中,我们可以开始使用触发器同步数据,这将更新目标数据库中的数据,然后新数据进入源数据库。
| 归档时间: |
|
| 查看次数: |
9505 次 |
| 最近记录: |