Ars*_*eny 6 jupyter-notebook databricks azure-databricks
我想使用我最喜欢的编辑器在本地编辑 Databricks 笔记本,然后使用Databricks Connect在我通常通过 Web 界面访问的 Databricks 集群上远程运行笔记本。
不幸的是,在网上搜索了几天后,我找不到有关 Databricks Connect 的详细文档。
我databricks-connect configure按照上面 PyPI 页面上的建议运行 ,但我不确定某些设置是什么。有人可以引导我完成这个过程(比如在网络界面中哪里可以找到这些值)或提供正确文档的链接吗?
databricks-connect configure我知道一些设置应该是什么,但为了完整性和其他人的利益,我将包括运行时出现的所有内容。
Databricks Host
Databricks Token
Cluster ID(例如,0921-001415-jelly628)
Org ID(仅限 Azure,请参阅?o=orgIdURL)
Port(是吗spark.databricks.service.port?)
另外,我认为这是我最感兴趣的,我是否需要对笔记本本身进行任何更改,例如定义 SparkContext 或其他内容?如果有的话,用什么配置?
我应该如何运行它?运行后databricks-connect configure,似乎没有发生任何“魔法”。当我运行时jupyter notebook,它仍然在本地运行,并且似乎不知道将其转发到远程集群。
更新:
如果您想考虑更具体的东西,在 Databricks 的 Web 界面中,dbutils是一个预定义的对象。远程运行笔记本时如何引用它?
我已将另一个人的回复标记为答案,但由于某种原因该回复现在消失了。
出于我的目的,官方用户指南有效: https ://docs.azuredatabricks.net/user-guide/dev-tools/db-connect.html
| 归档时间: |
|
| 查看次数: |
6541 次 |
| 最近记录: |