AWS Athena 从 S3 的 GLUE Crawler 输入 csv 创建的表中返回零记录

wen*_*ear 2 amazon-s3 amazon-web-services amazon-athena aws-glue

我已经阅读了问题AWS Athena Returning Zero Records from Tables Created from GLUE Crawler input csv from S3下的答案

和问题https://aws.amazon.com/de/premiumsupport/knowledge-center/athena-empty-results/

按照建议

  1. 我已经将 S3 中的文件夹路径而不是文件名提供给了 Glue 爬虫。
  2. 我已经删除并重新创建了爬虫

但它没有帮助

我的情况:

来自 s3 存储中 csv 的示例数据: 在此处输入图片说明

云看日志显示胶表创建成功:在此处输入图片说明

架构结构如下所示:在此处输入图片说明

Sizekey 333 匹配 csv 数据大小:数据大小:333 字节

但是当我运行 Athena 查询时,我得到了结果:扫描的数据 0 KB

只返回列,不返回记录。扫描的数据:0 KB

有谁知道为什么胶水爬虫不能转换数据?

谢谢!

Pra*_*ddy 5

查看生成的表名后,您似乎在传递给 Glue 爬虫的文件夹路径中有多个具有不同架构的文件。如果您希望在 Athena 中查询这些表,则必须将这些具有不同架构的 CSV 文件放在不同的文件夹中。

尽管您将文件夹路径传递给了 Glue 爬虫,但它会为 Athena 表创建具有完整文件路径的表。您可以通过运行show create table <table-name>.