如何从 AWS EMR 下载 Zeppelin Notebook

May*_*ank 2 amazon-web-services emr apache-zeppelin

我正在使用 Spark 在 AWS EMR 4.3 上运行预安装的Zeppelin 沙箱

我已经在 Zeppelin 上(在 EMR 集群上)创建了一个 Notebook,现在我想导出该 Notebook,以便我下次启动 EMR 集群时可以快速运行它。

事实证明,Zeppelin 还不支持导出笔记本(?)。

这很好,因为显然,如果您可以访问“安装”了 Zeppelin 的文件夹,那么您可以保存包含笔记本的文件夹,然后大概将该文件夹放在另一台计算机上的 Zeppelin 安装中以访问笔记本。

(所有这些都来自http://fedulov.website/2015/10/16/export-apache-zeppelin-notebooks/

问题是我在 EMR 上找不到 Zeppelin 的“安装文件夹”在哪里。

ps - “安装文件夹”可能有点不正确,根据上面我应该查看的帖子/opt/zeppelin,它在我的 EMR 集群的主服务器中不存在。

May*_*ank 5

编辑:现在 Zeppelin 支持从 Web 界面本身以 json 格式导出笔记本!页面中央顶部有一个小图标,可让您导出笔记本。

Zeppelin Notebooks 可以/var/lib/zeppelin/notebook在带有 Zeppelin Sandbox 的 AWS EMR 集群下找到。笔记本包含在此目录的文件夹中。

这些文件夹的名称是随机的,与 Notebook 的名称不对应。

ls /var/lib/zeppelin/notebook/  
2A94M5J1Y  2A94M5J1Z  2AZU1YEZE  2B3D826UD 
Run Code Online (Sandbox Code Playgroud)

有一个note.json包含笔记本电脑和所有其他细节的名称为每个文件夹(这代表了笔记本电脑)中的文件。

要导出笔记本,请选择与您要查找的笔记本对应的笔记本文件夹,将该文件夹复制到您希望笔记本可用的新 Zeppelin 安装中。

以上说明来自:http : //fedulov.website/2015/10/16/export-apache-zeppelin-notebooks/

只是在 AWS 设置中,Zeppelin 笔记本将位于 /var/lib/zeppelin/notebook