Google Cloud Spanner的外部备份/快照

use*_*707 13 google-cloud-platform google-cloud-spanner

是否可以对Google Cloud Spanner数据库/表格进行快照?出于合规性原因,我们必须拥有当前数据库的每日快照,以便在发生灾难时回滚到当前数据库:这在Spanner中是否可行?如果没有意图支持它吗?

对于那些可能会问为什么我们需要它的人,因为扳手是复制/冗余等 - 它不能防止人为错误(意外丢桌)或破坏/间谍因此问题和要求.

谢谢,M

Dom*_*uss 12

今天,您可以使用您喜欢的工具(mapreduce,spark,dataflow)读取所有数据并在特定时间戳(使用时间戳边界)读取所有数据,从而流出一致的快照.

https://cloud.google.com/spanner/docs/timestamp-bounds

在数据被垃圾收集之前,您有大约一个小时的时间进行导出.

将来,我们将提供Apache Beam/Dataflow连接器,以更加可扩展的方式实现这一目标.这将是我们将数据导入/导出到Cloud Spanner的首选方法.

从长远来看,我们将支持备份和恢复备份的能力,但目前无法使用该功能.


eb8*_*b80 5

自2018年7月起,Cloud Spanner现在提供导入和导出功能,使您可以将数据库导出为Avro格式。如果您通过Google Cloud Console网站转到有问题的特定Cloud Spanner数据库,则会在顶部看到“导入和导出”按钮。只需单击“导出”,填充所需的信息(例如目标Google Cloud Storage存储桶),数据库就会以Avro格式备份到Google Cloud Storage。如果需要还原数据库,请使用Google Cloud Console网站的Cloud Spanner部分中的相应导入功能。

注意:实际的备份和还原(即导出和导入)是使用Google Cloud Dataflow完成的,您需要为数据流操作付费。

请参阅有关导入导出功能的文档。