在 Azure 上的 HDInsights 群集上使用数据湖或 Blob

vib*_*blo 5 hadoop azure azure-blob-storage azure-data-lake azure-hdinsight

在 Azure 中创建 HDInsights Hadoop 群集时,有两个存储选项。Azure 数据湖存储 (ADLS) 或 Azure Blob 存储。

这两个选项之间的真正区别是什么?它们如何影响性能?

我找到了这个页面https://docs.microsoft.com/en-us/azure/data-lake-store/data-lake-store-comparison-with-blob-storage 但它不是很具体,只使用很一般“ADLS 针对分析进行了优化”等术语。

这是否意味着它更适合存储 HDInsights 文件系统?如果 ADLS 确实更快,那么为什么不将它也用于非分析数据呢?