Azure Databricks 定价:B2B 订阅与官方页面定价

VB_*_*VB_ 6 databricks azure-databricks

我从一家公司知道,用于 B2B 非生产订阅的 50,000 个 DBU 可能需要大约 44,000 美元。反过来,在 Databricks 官方定价页面,最优质层的成本为 0.55 美元/DBU(每 50k DBU 27,500 美元)。

您能否解释一下 B2B 订阅 DBU 和官方页面 Data Analytics Pemium SKU DBU 之间的区别?

为什么价格相差如此之大?除了支持/fastrack 之外还有什么(作为 B2B 的一部分)吗?

希望你不需要发布私人信息来回答我的问题。但我需要了解主要原因,以便能够为未来的项目计划成本。

UPD

Databricks B2B 订阅为您提供不同使用层(轻/工程/分析)的选择。相反,每个捆绑包(DBU 量)都有一个选项(价格)。该选项比最昂贵的 Analytics 层要贵得多。

Ste*_*ams 2

可以将其视为获得价值 50,000 美元代币的折扣。您运行流程的方式将从该存储桶中提取,就好像您有 50,000 美元可花,即使您支付了 46,000 美元。你有一年或三年的时间来花掉它们,如果你不在这段时间内花掉它们,你就会失去剩余的时间。如果您完成所有这些,您将支付即用即付的价格,或者您可以预先购买另一年或 3 年的单位。此外,你如何运行你的工作以及你运行的级别(标准或高级)将决定你消耗单位的速度有多快,并且正如前面的答案所述仍然很重要。

https://azure.microsoft.com/en-us/pricing/details/databricks/
Run Code Online (Sandbox Code Playgroud)

Databricks 单元预购计划

如果预购买 Azure Databricks 单位 (DBU) 作为 Databricks 提交单位 (DBCU) 1 或 3 年,与即用即付 DBU 价格相比,最多可节省 37%。Databricks 提交单元 (DBCU) 将 Azure Databricks 工作负载和分层的使用标准化为一次购买。您在这些工作负载和层中的 DBU 使用量将从 Databricks 提交单元 (DBCU) 中减少,直到耗尽或购买期限到期。提款率将等于 DBU 的价格,如上表所示。

购买 DBCU 的购买等级和折扣如下所示:

1年预购计划

DATABRICKS 提交单位 (DBCU) 价格(有折扣)折扣

25,000 23,500 美元 6%

50,000 $46,000 8%

100,000 $89,000 11%

200,000 172,000 美元 14%

350,000 287,000 美元 18%

500,000 400,000 美元 20%

750,000 578,000 美元 22%

1,000,000 730,000 美元 27%

1,500,000 1,050,000 美元 30%

2,000,000 1,340,000 美元 33%

此外,分析/工程/轻型也不是您可以选择的选项。它们是根据您的工作方式来定义的。通过笔记本界面执行作业被定义为分析作业,就好像您安排笔记本运行一样,这被视为工程作业,并且如果您使用编码库提交作业,则您将在轻型层下运行。

更新 - 评论部分没有足够的空间来回答 OP 回复

非常感谢您的回答!我想我错了,但请再次批准。DBCU 大约是美元,所以 50k DCBU 可能等于大约 100k DBU,对吧?

DBU 和 DBCU 完全相同,并且使用费用相同。唯一的区别是,以预购 50,000 件为例,您可以获得 8% 的预付折扣。如果您要在两个不同的工作区中以完全相同的方式运行所有内容,并且您在一个工作区中花费了 50,000 个 DBU 小时,在另一个工作区中花费了 50,000 个 DBCU 小时,那么您在这一年中将欠下 50,000 美元,或者您将预先支付 46,000 美元。这些都不包括您欠 Azure 的实际 VM 基本成本。DBU 结构是 Databricks 削减的成本,因此您必须将其计入总体成本。

我花了一段时间才弄清楚我是什么时候开始使用 databricks 的。当他们说您需要为每 DBU 小时处理的分析作业支付 0.55 美元,而不是每个作业 0.55 美元。因此,如果我运行分析作业 1 小时,我将消耗 0.55 *(虚拟机数量 * 每小时虚拟机 DBU 成本)。如果我仅每小时运行 1/2 小时,我将被收取 (.55*.5) * (VM 数量 * (VM DBU 成本 *.5)) 的费用。更容易将 DBU 和 DBCU 单位视为 1 单位 = 1 美元,并且您消耗的是每秒计算的美元价值,而不是单位数量。在我看来,显示 0.55 美元/DBU 的定价网格应该标记为 0.55 美元/DBU 小时。我花了很长时间,打了几个电话,打了一个电话,才弄清楚。

至于你的第二个问题

通过 REST API 调度作业比通过 ADF => Notebook 调度更有利,对吗?

这个问题又比看上去更复杂。我最初说是的,这样更好,但我没有听清问题的 ADF 部分。您可以使用作业集群选项来运行笔记本,从而通过 ADF 运行工程作业。如果您通过 ADF 将笔记本连接到预制分析集群,您将支付分析成本。使用 API,您可以在 databricks 提供的内置作业调度程序中安排您的笔记本。我的理解是,笔记本的工程师级别是收费的,作业库的轻型级别是收费的。

如果您选择这种方式,那么预购买时要要求的另一件事是能够将单元桶附加到您的开发/测试环境和生产环境。我们让它们完全独立的网络,所以我们有两个工作区。都可以从同一个单元池中提取。取决于您的天蓝色设置。我们在建立 Databricks 时进行了销售,但微软应该也能做到这一点。