Amazon Athena 将位置设置为单个 csv 文件

Dig*_*eld 3 sql csv amazon-s3 amazon-web-services amazon-athena

我想将 Athena SQL 创建表语句中的位置值设置为单个 CSV 文件,因为我不想查询路径中的每个文件。我可以设置并成功查询 s3 目录(对象)路径以及该路径中的所有文件,但不能查询单个文件。是否支持将单个文件设置为位置?

成功查询路径中的 CSV 文件:

LOCATION 's3://my_bucket/path/'
Run Code Online (Sandbox Code Playgroud)

返回零结果:

LOCATION 's3://my_bucket/path/filename.csv.gz'
Run Code Online (Sandbox Code Playgroud)

建表语句:

CREATE EXTERNAL TABLE IF NOT EXISTS `default`.`my_db` (
    `name` string,
    `occupation` string,    
    )
    ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
    WITH SERDEPROPERTIES (
    'field.delim' = ','
   ) LOCATION 's3://bucket-name/path/filename.csv.gz'
   TBLPROPERTIES ('has_encrypted_data'='false');
Run Code Online (Sandbox Code Playgroud)

我已阅读此问答,但它似乎没有解决同一问题。

谢谢。

小智 5

您可以尝试在查询时在 WHERE 条件中添加该特定对象的路径:

SELECT * FROM default.my_db
WHERE "$path" = 's3://bucket-name/path/filename.csv.gz'
Run Code Online (Sandbox Code Playgroud)