我正处于使用Azure数据仓库中的外部表从Azure Data Lake读取的位置.
这使我们能够使用众所周知的SQL从数据湖中读取数据.
但是,另一种选择是使用Data Lake Analytics或HDInsight的某些变体.
表现明智,我没有看到太多差异.我假设数据仓库在后台运行某种形式的分布式查询,转换为U-SQL(?),那么我们为什么要使用稍微不同的U-SQL语法的Data Lake Analytics?
由于SQL中也提供了python脚本,我觉得我缺少Data Lake Analytics的主要目的,除了成本(按批次工作付费,而不是数据库的恒定运行时间).