Python BigQuery API - 获取表架构/表头

Question

Python BigQuery API - 获取表架构/表头

use*_*546 2 python google-bigquery google-cloud-python

给定一个查询示例，例如

import uuid

from google.cloud import bigquery


def query_shakespeare():
    client = bigquery.Client()
    query_job = client.run_async_query(str(uuid.uuid4()), """
        #standardSQL
        SELECT corpus AS title, COUNT(*) AS unique_words
        FROM `publicdata.samples.shakespeare`
        GROUP BY title
        ORDER BY unique_words DESC
        LIMIT 10""")

    query_job.begin()
    query_job.result()  # Wait for job to complete.

    destination_table = query_job.destination
    destination_table.reload()
    for row in destination_table.fetch_data():
        print(row)


if __name__ == '__main__':
    query_shakespeare()

Run Code Online (Sandbox Code Playgroud)

如何获取表的架构？行，在前面的示例中具有以下形式

Row(('august', -1, 'aaa', 333), {'col1': 0, 'col2': 1, 'col3': 2})

Run Code Online (Sandbox Code Playgroud)

但我找不到包 google-cloud-bigquery==0.28.0 提取标头 JSON 的方法。当然，表模式的提取对我来说也很好，但当前的谷歌文档看起来不适用于最后一个版本......

Answer 1

Wil*_*uks 5

result如果您需要刚刚查询的表的架构，可以从以下方法中获取QueryJob：

client = bq.Client()
query = """
         #standardSQL
         SELECT corpus AS title, COUNT(*) AS unique_words
         FROM `publicdata.samples.shakespeare`
         GROUP BY title
         ORDER BY unique_words DESC
         LIMIT 10"""
query_job = client.query(query)
result = query_job.result()

schema = result.schema

Run Code Online (Sandbox Code Playgroud)

结果：

[SchemaField(u'title', u'string', u'NULLABLE', None, ()),
 SchemaField(u'unique_words', u'integer', u'NULLABLE', None, ())]

Run Code Online (Sandbox Code Playgroud)

（您在问题中提供的代码与 version 相关0.27）。

至于获取标头 JSON 的问题，不确定我是否理解正确，但似乎您需要架构来查找 json 所在的位置（我猜在这里）。

归档时间：	7 年，11 月前
查看次数：	5485 次
最近记录：	6 年，3 月前