eclipse - 如何在本地构建和运行 Scala Spark-6ren

eclipse - 如何在本地构建和运行 Scala Spark

转载作者：行者123 更新时间：2023-12-04 06:39:35

25

4

我正在尝试在本地构建 Apache Spark。这样做的原因是调试像reduce这样的Spark方法。特别是我对 Spark 如何在幕后实现和分发 Map Reduce 感兴趣，因为我遇到了性能问题，我认为从源代码运行这些任务是找出问题所在的最佳方法。

所以我从 Spark repo 克隆了最新的:

git clone https://github.com/apache/spark.git

Spark 似乎是一个 Maven 项目，所以当我在 Eclipse 中创建它时，结构如下:

enter image description here

一些顶级文件夹也有 pom 文件:

enter image description here

那么我应该只构建这些子项目之一吗？这些针对本地代码库运行 Spark 的正确步骤是否正确？

最佳答案

在本地构建 Spark，简短的回答:

git clone git@github.com:apache/spark.git
cd spark
sbt/sbt compile

详细讨论您的问题，您实际上要问的是“如何在 Eclipse 中调试 Spark 应用程序”。
要在 Eclipse 中进行调试，您实际上并不需要在 Eclipse 中构建 Spark。您所需要的只是创建一个具有 Spark lib 依赖项的作业并询问 Maven 的“下载源”。这样您就可以使用 Eclipse 调试器单步调试代码。

然后，在创建 Spark Context 时，使用 sparkConfig。 local[1]像大师一样:

val conf = new SparkConf()
      .setMaster("local[1]")
      .setAppName("SparkDebugExample")

这样所有 Spark 交互都在一个线程中以本地模式执行，因此对您的调试器可见。

如果您正在调查性能问题，请记住 Spark 是一个分布式系统，网络在其中扮演重要角色。在本地调试系统只会给你一部分答案。需要监控实际集群中的作业，以便全面了解您的作业的性能特征。

关于eclipse - 如何在本地构建和运行 Scala Spark，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23857841/

25

4

0

文章推荐： multithreading - 多线程中的 Guice 和 RequestScoped 行为

文章推荐： perl - 如何调整长期物体的渲染？

文章推荐： dataframe - 如何将向量添加到 Julia 中某个数组的列中？

文章推荐：通过uWSGI运行时Django忽略环境变量

eclipse - 如何在不使用 Eclipse 的情况下手动将项目添加到 Eclipse
我想在文件系统上手动创建文件夹/文件，以便在 eclipse 的工作区中创建新项目，并在启动 eclipse 并选择工作区时显示在项目资源管理器中。执行此操作需要创建哪些文件，它们需要位于何处？请
eclipse - 如何运行命令 mvn eclipse :eclipse
我正在关注these instructions ，但在运行 mvn eclipse:eclipse 等命令时遇到问题。我应该如何以及在哪里运行该命令？我的设置: Windows 7 32 位面向
eclipse - 如何使用命令行创建 Eclipse 工作区而不实际启动 Eclipse？
是否有任何命令可以在不实际启动 eclipse 的情况下创建 eclipse 工作区？我希望该命令成为脚本的一部分。创建工作区后，将对其进行配置(例如文本编码)，然后用于将项目导入到 RTC。我知道下
eclipse - 从 Eclipse 中以编程方式安装 Eclipse 插件？
我想为 Eclipse 插件创建一个自动安装程序(即不通过“更新管理器”)。我的场景很简单:用户关闭 Eclipse，将下载的 JAR 放入 dropins 文件夹，启动 Eclipse，其余的过程是
eclipse - 如何在不删除 Eclipse 源代码的情况下删除 Eclipse 项目相关文件
每当我们想要使用现有源位置创建 Eclipse 项目时，我们将选择现有源位置(根)作为项目位置。 Eclipse 将在该源的根目录中创建所有项目特定文件。现在，出于某种原因，如果我们想用不同的设置重
eclipse - 有没有办法在启动 eclipse 之前从控制台刷新 eclipse 工作区？
可能被问过多次；有没有办法从控制台(Linux 或 Windows)刷新 Eclipse 工作区文件夹。我知道有 Ant 任务可以做到这一点。但很想知道是否有命令行技巧。最佳答案不，您能做的最
eclipse - 有没有办法更改 eclipse 中内置的默认 eclipse 工具栏图标？
我说的是工具栏上的小图标。网络上似乎没有任何这样的问题，它们都指的是 android 或自定义应用程序，而不是与 eclipse 捆绑在一起的图标。我想知道是否有人尝试过这个，或者可以告诉我它不值
eclipse - 如何使用 Eclipse 比较两个文件？ Eclipse 是否提供了任何选项？
如何使用 Eclipse 比较两个文件？ (目前我正在使用 WinMerge 。) 最佳答案要在 Eclipse 中比较两个文件，请首先在 Project Explorer/Package Expl
eclipse - 将项目从一个 Eclipse 转移到另一个 Eclipse 的最佳方式
我正在尝试将我在一个带有数据库的 Eclipse JEE6 项目中所做的所有工作转移到另一个 Eclipse 程序。我知道我将不得不重新配置很多并重建很多库文件，但是尽可能多地传输的最简单方法是什么？
eclipse - TFS Eclipse 插件使 Eclipse 卡在负载工作台上
在 Eclipse 中加载我的工作台并启用 TFS 插件时，它挂起。与此类似: http://social.msdn.microsoft.com/Forums/vstudio/en-US/85c1d3
eclipse - 针对不同功能集的多个 Eclipse 或单个 Eclipse 包含所有插件？
Eclipse 可以通过插件包含许多不同的功能集。您是否在一个 Eclipse 中安装所有插件？或者您是否从 spring 安装 STS，从 adobe 安装 Flex eclipse，甚至从 ecl
eclipse - 如何在 Eclipse 首选项中撤消将 Eclipse 构建中的目标运行标记为忽略？
我错误地单击了“在 Eclipse 首选项中将目标运行标记为忽略在 Eclipse 构建中(实验)”: 在哪里/如何撤消此操作？最佳答案 m2e 使用文件 YOUR_WORKSPACE/.metad
eclipse - Maven eclipse :eclipse fail to execute
我是 Maven 新手。我尝试执行 >mvn eclipse:eclipse -Dwtpversion=2.0。但我收到以下错误: D:\test\CounterWebApp>mvn eclips
eclipse - '"Eclipse"希望在运行多个 Eclipse 实例时连续访问文档文件夹警报中的文件
当我运行多个 Eclipse 实例时，操作系统不断请求上述权限。我已经授予了该权限，并且我尝试了多次禁用和启用该权限。我正在使用， macOS Catalina(版本:10.15.3 (19D76
eclipse:clean eclipse:eclipse - maven 命令用法
我有一个 Maven 项目，其中我在项目构建期间使用 wsimport 作为目标来使用 Web 服务。 org.codehaus.mojo
eclipse - 尝试安装 eclipse 时 eclipse 更新失败
当尝试使用 eclipse 新软件功能安装 eclipse 时，出现此错误: Cannot complete the install because one or more required item
eclipse - 如何在 Eclipse 本身中使用 Eclipse 源代码
我已经下载了整个 Eclipse Helios/Indigo 版本的源代码。现在我想对它进行一些修改等等。所以我导入了整个源代码，但现在我在编译时遇到了 n 个错误。此外，我正在尝试 RunAs> 插
eclipse - 无法连接到 Eclipse 市场 Eclipse Oxygen
我已经安装了 eclipse Oxygen 并且正在尝试连接到 Eclipse 市场，以安装插件，它给出了以下异常 - org.eclipse.equinox.p2.core.ProvisionExc
java - mvn eclipse :eclipse within Eclipse
我的 IDE 中安装了来自 Sonatype 的 m2Eclipse 插件。它允许我通过右键单击 pom.xml 文件并导航到“运行方式”菜单来运行各种 Maven 命令(打包、安装等)。但是，我还
eclipse - Maven3 eclipse :eclipse does not work - Not running eclipse plugin goal for pom project
我在 Windows7 64 位上运行 Maven 3 时遇到问题。当我执行maven eclipse:eclipse(我使用maven-eclipse-plugin 2.8)时，maven不会创建任

首页

博学

6Ren·AI

商城

eclipse - 如何在本地构建和运行 Scala Spark