如何处理在 AWS Athena 的同一列中只有日期 (%m-%d-%Y) 和日期时间 ('%m-%d-%Y %H:%i') 记录的列?

bou*_*sna 3 sql date amazon-web-services presto amazon-athena

我正在尝试将字符串类型的日期列转换为日期类型。

我在 AWS Athena 中使用以下查询:

SELECT col0, col1, col2, date_parse(replace(col3, '/', '-'), '%m-%d-%Y') AS start_date
FROM "bucket"."table"
WHERE col3 <> ''
Run Code Online (Sandbox Code Playgroud)

这适用于某些记录,因为某些日期的格式如下:12/08/2019 但对于其他格式如下的日期则失败:7/1/2019 0:06 其他一些日期的格式如下:2020/04/10 08:39

这些不同格式的日期存在于同一列中。在这里处理脏数据...我明白为什么我的查询失败了,因为我只有'%m-%d-%Y'格式。只是想知道我将如何处理这样的事情,以便它可以在一个查询中处理所有 3 种格式。

Chr*_*ams 5

您可以通过不同的组合,像这样使用的组合运行Coalescetry

可从此presto 文档页面获得各种日期时间格式。

SELECT
    col0,
    col1,
    col2,
    Coalesce(
        try(date_parse(col3, '%m/%d/%Y')),
        try(date_parse(col3, '%Y/%m/%d %H:%i')),
        try(date_parse(col3, '%e/%c/%Y %k:%i'))
    ) AS start_date
FROM "bucket"."table"
WHERE col3 <> ''
Run Code Online (Sandbox Code Playgroud)