在此博客中,一位 Google Cloud 员工解释了如何在 BigQuery 中为机器学习进行可重复的数据集采样。这对于创建(和复制)数据的训练/验证/测试分区非常重要。
然而,该博客使用了 Legacy SQL,Google 现在已弃用它而支持标准 SQL。
您将如何使用标准 SQL 重新编写如下所示的博客示例代码?
#legacySQL
SELECT
date,
airline,
departure_airport,
departure_schedule,
arrival_airport,
arrival_delay
FROM
[bigquery-samples:airline_ontime_data.flights]
WHERE
ABS(HASH(date)) % 10 < 8
Run Code Online (Sandbox Code Playgroud)