Dig*_*eld 3 sql csv amazon-s3 amazon-web-services amazon-athena
我想将 Athena SQL 创建表语句中的位置值设置为单个 CSV 文件,因为我不想查询路径中的每个文件。我可以设置并成功查询 s3 目录(对象)路径以及该路径中的所有文件,但不能查询单个文件。是否支持将单个文件设置为位置?
成功查询路径中的 CSV 文件:
LOCATION 's3://my_bucket/path/'
Run Code Online (Sandbox Code Playgroud)
返回零结果:
LOCATION 's3://my_bucket/path/filename.csv.gz'
Run Code Online (Sandbox Code Playgroud)
建表语句:
CREATE EXTERNAL TABLE IF NOT EXISTS `default`.`my_db` (
`name` string,
`occupation` string,
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
'field.delim' = ','
) LOCATION 's3://bucket-name/path/filename.csv.gz'
TBLPROPERTIES ('has_encrypted_data'='false');
Run Code Online (Sandbox Code Playgroud)
谢谢。
小智 5
您可以尝试在查询时在 WHERE 条件中添加该特定对象的路径:
SELECT * FROM default.my_db
WHERE "$path" = 's3://bucket-name/path/filename.csv.gz'
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1085 次 |
| 最近记录: |