何时使用多个 azure synapse 工作区?

wil*_*yth 2 azure-synapse

我有一个天蓝色的突触工作区,其中包含无服务器 SQL 池中的许多管道和外部表。所有这些都与一个特定项目相关。

还有另外 2-3 个完全独立的项目正在进行中,需要突触工具集。

我应该创建一个新的工作区,还是允许他们所有人共享这个工作区?做出决定的最佳标准是什么?

wBo*_*Bob 5

这可能是一个意见问题,在 StackOverflow 上往往表现不佳,但也就是说,我倾向于认为 Synapse Workspaces 类似于 SQL Server 实例,所以从历史上看,为什么你会使用相同的 SQL 实例?

一般来说,这是项目有共同点的地方,例如相同的数据、相似的权限 (AAD) 组、相似的 HADR 要求等,所以问问自己这些问题。

请记住,您可以在一个工作区中拥有多个数据库(专用数据库和无服务器数据库),但只能通过 Spark 池1对专用 sql 池中的表进行跨数据库查询。如果您需要分居,这可能对您有利。另请记住,您可以将多个存储帐户连接到工作区。拥有多个工作区没有成本开销,但会产生管理开销,并且跨多个湖、存储帐户和数据库复制任何数据都会产生成本。

举一个例子,我们在没有单独的开发、测试、uat Azure 订阅的环境中使用工作区。

所以有几件事需要考虑。


1将两个表导入为数据框,然后按照本示例将它们连接到 Synapse 笔记本中