gpt4 book ai didi

用于数据科学应用程序的 Scala IDE(如 RStudio/Spyder/Rodeo)

转载 作者:行者123 更新时间:2023-12-04 17:32:09 25 4
gpt4 key购买 nike

随着 Spark 的兴起,Scala 作为数据科学应用程序的首选编程语言获得了巨大的发展势头。

为了提高处理数据科学应用程序的效率,专门的 IDE 已被释放

  • R(例如 RStudio)和
  • Python(例如 Spyder 或 Rodeo,参见 Is there something like RStudio for Python?)。

  • Scala有类似的东西吗?

    最佳答案

    不幸的是,目前似乎没有任何专用于 Scala 的数据科学 IDE。我认为这些将是您最好的选择:

    IntelliJ Worksheets:

    IntelliJ Worksheet
    这基本上是一个带有输出窗口的文本编辑器,可以根据需要随时更新。 Eclipse 也有类似的东西,我只是更喜欢 IntelliJ。

    优点:

  • 由 IntelliJ 出色的代码完成、错误检查和 sbt/maven 集成提供支持。
  • 您可以在与实际开发系统相同的项目设置中进行原型(prototype)制作(如果有的话)。

  • 缺点:
  • 我不知道有任何缓存/选择性评估,因此每次您想要答案时都会评估整个工作表,如果您有一些需要很长时间才能完成的操作,您可能不想要。
  • 没有工作区变量窗口或绘图集成。

  • Jupyter Notebooks

    Jupyter Notebook
    Jupyter Notebook 是 iPython notebook 的推广,现在支持 dozens of interpreted languages (一直在添加新内核)。

    优点:
  • ScalaSpark Scala内核相当容易安装,两者都能够添加 maven/sbt 依赖项和 JAR。
  • 笔记本中的单元可以单独运行(例如,允许您训练一个模型并多次使用它)。
  • 单元格支持 Markdown (使用 LaTeX!),可以自行呈现(a github example),允许您将笔记本用作报告/演示。
  • 笔记本由笔记本服务器支持,因此您可以轻松地将功能更强大的计算机用作笔记本服务器,然后从另一个位置与笔记本进行交互。
  • 一些内核具有自动完成功能。
  • 看起来有一些情节整合(example),但还没有完全完善。

  • 缺点:
  • 并非所有内核都是完美的,有些内核存在错误或功能有限。
  • 没有工作区变量窗口。
  • 你真的需要小心你的单元格的顺序,不这样做会导致很多困惑。


  • 对于我所做的大多数数据科学工作,我使用 Jupyter,但它远非完美。为了让 Scala 真正成为一种数据科学语言,它确实需要更多的数据科学库(scikit-learn 在这里遥遥领先)并且它需要一个可靠的绘图库(有一些选项,但我没有看到两者都使用惯用的 Scala 并且能够在没有服务器的情况下运行)。我认为一旦有了这两个元素,它就会变得更加流行,希望有人能制作出一个不错的 RStudio 式 IDE。

    关于用于数据科学应用程序的 Scala IDE(如 RStudio/Spyder/Rodeo),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40994642/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com