为Jupyter(Anaconda)安装Scala内核(或Spark/Toree)

rob*_*omo 5 python scala jupyter jupyter-notebook apache-toree

我正在运行RHEL 6.7,并安装了Anaconda.(anaconda 4.10).Jupyter正在使用OOTB,默认情况下它有Python内核.一切都花花公子所以我可以在Jupyter中选择"python notebook".

我现在也想让Scala与Jupyter建立起来.(看起来像Spark内核 - 现在Toree会起作用吗?)

我见过的每一个问题/答案都没有引用我遇到的问题.

我试图安装Toree,并且做到了

sudo pip install toree 
Run Code Online (Sandbox Code Playgroud)

它起作用了.但接下来的步骤也是如此

jupyter toree install
Run Code Online (Sandbox Code Playgroud)

而我得到的错误是:

jupyter toree install
Traceback (most recent call last):
  File "/usr/app/anaconda/bin/jupyter-toree", line 7, in <module>
    from toree.toreeapp import main
ImportError: No module named toree.toreeapp
Run Code Online (Sandbox Code Playgroud)

我错过了一步吗?我做错了什么?如果我需要提供更多信息,我也会很高兴.谢谢!

编辑:在Jupyter中获取Scala笔记本的标准/最简单/最可靠的方法是什么?(TL; DR)

7ke*_*ani 0

首先,确保在 shell 环境中设置 SPARK_HOME 变量以指向 Spark 所在的位置,例如:

export SPARK_HOME=$HOME/Downloads/spark-2.0.0-bin-hadoop2.7
Run Code Online (Sandbox Code Playgroud)

接下来安装 toree

sudo jupyter toree install --spark_home=$SPARK_HOME
Run Code Online (Sandbox Code Playgroud)