小编lou*_*jan的帖子

读取 Avro 文件并将其写入 BigQuery 表

我的目标是从云存储中读取 avro 文件数据并使用 Java 将其写入 BigQuery 表。如果有人提供代码片段/想法来读取 avro 格式数据并使用 Cloud Dataflow 将其写入 BigQuery 表，那就太好了。

google-cloud-storage google-bigquery google-cloud-dataflow apache-beam

lou*_*jan

2019 02-08

4
推荐指数

1
解决办法

1903
查看次数

Google Cloud Storage 列出具有特定文件名的 Blob 对象

在 google.cloud.storage 和 list_blobs 的帮助下，我可以从特定存储桶中获取文件列表。但我想从存储桶中过滤（名称*.ext）确切的文件。我无法找到确切的解决方案。

例如：buket=data，prefix_folder_name=sales，在前缀文件夹中，我有带有元数据的发票列表。我想获取特定的发票及其元数据（name*.csv & name.*.meta）。另外，如果我循环特定文件夹的整个 all_blob 来获取所选文件，那么这将是大量数据，并且可能会影响性能。

如果有人帮助我解决这个问题，那就太好了。

bucket = gcs_client.get_bucket(buket)
all_blobs = bucket.list_blobs(prefix=prefix_folder_name)
for blob in all_blobs: 
  print(blob.name)

Run Code Online (Sandbox Code Playgroud)

python client-library google-cloud-storage

lou*_*jan

lucky-day

4
推荐指数

1
解决办法

1万
查看次数

标签统计

google-cloud-storage ×2

apache-beam ×1

client-library ×1

google-bigquery ×1

google-cloud-dataflow ×1

python ×1

读取 Avro 文件并将其写入 BigQuery 表

Google Cloud Storage 列出具有特定文件名的 Blob 对象

标签 统计

小编lou_jan的帖子

标签统计