我目前正在使用数据工厂构建一个 Azure 数据湖,并且正在寻求关于拥有多个数据工厂与只有一个数据工厂的一些建议。
目前我有一个数据工厂,即从一个 EBS 实例为企业下的一家特定公司采购数据。尽管将来可能会有其他 EBS 实例和其他公司(以其他应用程序作为来源)合并到工厂中 - 我认为图表可能会变得有点混乱。
我四处搜索,找到了这个站点,它建议将所有内容都保存在一个数据工厂中以重用链接服务。我想这是一件好事,但是由于我已经为一个数据工厂编写了构建脚本,因此再次构建链接服务以指向同一个数据湖将非常容易。
https://www.purplefrogsystems.com/paul/2017/08/chaining-azure-data-factory-activities-and-datasets/
只有一个数据工厂实例的优点:
缺点
有没有人在那里部署了一些 Azure 数据工厂的大型部署,它们可能会引入数千个数据源,将它们混合在一起并进行转换?很想听听你的想法。