Rat*_*lle 3 checksum google-bigquery
我正在寻找是否存在一种方法可以获取可以从 google bigquery 导出的文件(或表)的校验和。
假设我导出(或下载)了一个daily-record-2018-07-10
从 bigquery调用的文件的示例
,是否有一种方式 bigquery 可以为我们提供一些checksum
(例如sha1
,md5
等),以便我们可以在开始处理这些文件之前预先计算这些校验和
这样做的原因是为了确保我们在下载(或导出)表时不会丢失任何信息。我们确实在网络上丢失了一些信息,然后我们可以预先计算校验和并再次尝试导出表。
听起来问题可能是关于如何校验一个文件,我相信有很多关于这个的资源,但是如果你想校验存储在 BigQuery 中的表,你可以使用这种形式的查询:
SELECT BIT_XOR(FARM_FINGERPRINT(TO_JSON_STRING(t)))
FROM MyTable AS t
Run Code Online (Sandbox Code Playgroud)
这会将每一行转换为字符串表示、散列,然后对结果进行异或以生成整个表的校验和。您也可以在外部表(例如 Cloud Storage 或 Drive 上的文件)上使用它。
归档时间: |
|
查看次数: |
1075 次 |
最近记录: |