我需要在AWS上构建一个数据湖,但我不知道S3与HDFS到底有什么不同。我在互联网上找到了一些答案,但我仍然不明白真正的区别。
我还需要知道是否有人有AWS中HDFS和S3的数据湖架构。
amazon-s3 amazon-ec2 hdfs data-lake
amazon-ec2 ×1
amazon-s3 ×1
data-lake ×1
hdfs ×1