Ale*_*sky 5 amazon-s3 amazon-athena aws-glue aws-glue-data-catalog
我正在使用Spark将文件以ORC格式写入S3。还使用Athena查询此数据。
我正在使用以下分区键:
s3://bucket/company=1123/date=20190207
Run Code Online (Sandbox Code Playgroud)
一旦我执行了Glue搜寻器以在存储桶上运行,除分区键的类型外,其他所有东西都按预期工作。
爬网程序在目录中将它们配置为String类型而不是int
是否有配置来定义分区键的默认类型?
我知道以后可以手动对其进行更改,并将“抓取工具”配置设置为 Add new columns only.
| 归档时间: |
|
| 查看次数: |
392 次 |
| 最近记录: |