用于数据科学应用的Scala IDE(如RStudio/Spyder/Rodeo)

maj*_*jom 5 ide scala data-science

随着Spark的兴起,Scala作为数据科学应用程序首选的编程语言获得了巨大的发展势头.

为了提高数据科学应用程序的工作效率,已经发布了专门的IDE

R(例如RStudio)和
Python(例如Spyder或Rodeo,看看有没有类似于RStudio的Python？).

Scala有类似的东西吗？

不幸的是,目前似乎没有针对Scala的任何专用Data Science IDE.我认为这些是您最好的选择:

IntelliJ工作表:

这基本上是一个带有输出窗口的文本编辑器,可以根据需要随时更新.Eclipse有类似的东西,我更喜欢IntelliJ.

优点:

由IntelliJ的出色代码完成,错误检查和sbt/maven集成支持.
您可以在与实际开发系统相同的项目设置中进行原型设计(如果有的话).

缺点:

我不知道任何缓存/选择性评估,因此每次您想要答案时都要评估整个工作表,如果您有一些需要很长时间才能完成的操作,则可能不需要这些工作表.
没有工作区变量窗口或绘图集成.

Jupyter笔记本

Jupyter笔记本是iPython笔记本的概括,它现在支持许多解释语言(新内核一直在添加).

优点:

Scala和Spark Scala内核相当容易安装,都能够添加maven/sbt依赖项和JAR.
笔记本电脑中的单元可以单独运行(例如,您可以训练一次模型并多次使用它).
单元格支持markdown(使用LaTeX!),可以单独渲染(github示例),允许您将笔记本用作报表/演示.
笔记本电脑支持笔记本电脑服务器,因此您可以轻松地使用功能更强大的笔记本电脑,然后从其他位置与笔记本电脑进行交互.
一些内核具有自动完成功能.
看起来有一些情节整合(例子),但它并没有完全抛光.

缺点:

并非所有内核都是完美的,有些内核有缺陷或功能有限.
没有工作区变量窗口.
你真的需要小心细胞的排序,否则会导致很多混乱.

对于大多数数据技术的东西,我使用Jupyter,但它远非完美.为了让Scala真正接管数据科学语言,它真的需要更多的数据科学库(scikit-learn在这里遥遥领先)并且它需要一个可靠的绘图库(有一些选项,但我没有看到它们都使用惯用的Scala,能够在没有服务器的情况下运行).我认为只要它具有这两个元素,它就会变得更受欢迎,并且希望有人能够创建一个不错的RStudio风格的IDE.

归档时间：	9 年，2 月前
查看次数：	1544 次
最近记录：	8 年，1 月前

是否有类似RStudio for Python的东西？ 160

更多相关链接

什么是Scala标识符"隐式"？ 161

Play Framework 2.1 - AngularJS路由 - 最佳解决方案？ 32

Scala意外地无法确定扩展功能的类型 28

使用Shapeless将嵌套的case类转换为嵌套的Maps 16

如何让classOf成为ClassTag？ 14

Akka Actors:在不丢失数据的情况下处理数据库故障 11

如何让 sbt 将非 Java 源包含到已发布的工件中？ 8

设置sbt scalafx项目 7

猫用mapN验证 6

如何在Dreamweaver cs5中调试php代码？ 3

Reference — What does this symbol mean in PHP? 4314

在Python中查找包含它的列表的项目的索引 2887

如何将列表拆分为大小均匀的块？ 2068

如何在Java中打破嵌套循环？ 1751

在JavaScript中生成随机字符串/字符 1593

如何检查字符串是否为数字(浮点数)？ 1519

使用JavaScript/jQuery滚动到页面顶部？ 1511

enctype ='multipart/form-data'是什么意思？ 1290

这是什么意思？"'NSUnknownKeyException',原因:...此类不是键值X的键值编码兼容" 1143

使用Twitter Bootstrap 3将列居中 1109