批处理 Dataflow 作业处理完所有数据后是否可以执行操作?具体来说,我想将管道刚刚处理的文本文件移动到不同的 GCS 存储桶。我不确定将它放在我的管道中的哪个位置以确保它在数据处理完成后执行一次。
BigTable是否支持类似于INCR
Redis的原子增量操作?
有此功能的Golang库BT - https://godoc.org/cloud.google.com/go/bigtable#ReadModifyWrite.Increment。但是,我可以看到一个应用程序的两个实例尝试同时增加的情况,但是由于竞争条件,它只能增加一次。
我正在尝试通过 Go 应用程序从现有模板启动数据流作业。
到目前为止,我已经引入google.golang.org/api/dataflow/v1b3
并创建了一个CreateJobFromTemplateRequest
包含工作信息的文件。
现在,我如何使用 Compute Engine 中的内置服务帐号凭据执行该请求?
我想衡量Cloud Bigtable在获取具有某些前缀的许多行计数时的性能.
假设一个模式的行键末尾有unix时间戳,例如,event_id#unix_timestamp
.
如果我需要获取20个不同event_id中的每一个的总行数,那么Cloud Bigtable是否可以高效地执行此操作?我要么使用前缀或行范围查询来执行此操作.
我想询问有关在 Bigtable 中使用带或不带前缀的正则表达式查询的建议和性能注意事项。
我们需要使用正则表达式过滤行键末尾的信息。
Bigtable 是否需要进行全表扫描来执行不包含前缀的正则表达式查询?性能方面有哪些考虑?这是推荐的吗?
在查询中引入前缀会对推荐产生什么影响?
当我们优化我们的架构时,将不胜感激对此的建议/想法。