嗨,正在寻找 API 来使用我拥有的 Pojos 编写 parquest。我能够使用反射生成 avro 模式,然后使用 AvroSchemaConverter 创建镶木地板模式。此外,我无法找到将 Pojo 转换为 GenericRecords (avro) 的方法,否则我可以使用 AvroParquetWriter 将 Pojo 写出到镶木地板文件中。有什么建议 ?
我有需要轮询AWS S3存储桶以获取新文件的情况.此外,它不仅仅是一个桶.有大约1000个桶,这些桶可能有很多文件.这种用例的常用策略/设计是什么?我需要在每次投票时使用新文件.我无法从存储桶中删除文件.