小编hel*_*rld的帖子

在标准 SQL/BigQuery 中将 YYYYMMDD 字符串转换为日期

我有一个名为“日期”的列,其中包含以这种方式格式化的日期:“20150101”。

我尝试使用 sql 子字符串,但是当我在 sql 中使用“日期”函数运行查询时,它不适用于我拥有的日期格式。

这是我提出的查询:

SELECT (DATE ((SUBSTR(JOUR, 1, 4), 
               SUBSTR(JOUR, 5, 2), 
               SUBSTR(JOUR, 7, 2)))) As date 
FROM TABLE
Run Code Online (Sandbox Code Playgroud)

任何的想法?我找不到与此日期格式类似的内容!我发现一个使用 convert 函数,但它不在 StandardSQL 或 BigQuery 中

google-bigquery

5
推荐指数
1
解决办法
1万
查看次数

BigQuery 标准 SQL 中的“yearweek”函数相当于什么?

我需要准确提取表中不同日期的“yearweek”,但我在 BigQuery (标准 SQL / Legacy SQL )中找不到“yearweek”的任何匹配项。

谢谢

sql google-bigquery

4
推荐指数
1
解决办法
4593
查看次数

尝试在 Python / pandas 中使用正则表达式获取子字符串

我知道这可能看起来很愚蠢,但我一直在到处寻找并尝试使用正则表达式并徒劳地分割。我的脚本永远不适用于我的数据集上的所有类型的字符串。

\n\n

我的这一列包含原始数据,如下所示(三种情况):

\n\n
20181223-FB-BOOST-AAAA-CC Auchy-Les-Mines - P\xc3\xa8re Noel\n20161224-FB-BOOST-SSSS-CC LeMarine - XXX XXX\n20161223-FB-BOOST-XXXX-CC Bonjour le monde - Blah blah\n
Run Code Online (Sandbox Code Playgroud)\n\n

所以我想做的是将字符串放在 CC 之后和“-”之前的中间。我编写了一个脚本,适用于第二种情况,但不适用于其他两种情况:

\n\n
1st case: Auchy-Les-Mines\n2nd case: LeMarine\n3rd case: Bonjour le monde\n
Run Code Online (Sandbox Code Playgroud)\n\n

这是我使用的正则表达式,但不适用于所有情况: regex =r"\\s\\b.*-."

\n\n

提前致谢 !

\n

python regex substring pandas data-cleaning

2
推荐指数
1
解决办法
6432
查看次数

标签 统计

google-bigquery ×2

data-cleaning ×1

pandas ×1

python ×1

regex ×1

sql ×1

substring ×1