- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前只有一台电脑,不会有另一台。
我在其 CPU 内核上运行 Spark:master=local[5]
,直接使用它:我设置了 spark-core
和 spark-sql
作为依赖项,完全不做其他配置,我的程序立即启动。这当然很舒服。
但我是否应该尝试通过 Docker 容器或 minikube(Kubernetes) 在我的电脑上?
将解决方案 #2 - 具有它所需的所有设置 - 以更好的性能奖励我,因为 Spark 真正设计为以这种方式工作,即使在单台计算机上也是如此,
或者我会浪费一些时间,因为我目前运行的模式,不使用网络,不需要数据局部性,总是会给我更好的性能,解决方案#1总是单台计算机上最好的?
我的假设是 #1 没问题。但我对此没有真正的衡量标准。没有比较来源。谁体验过这两种在一台电脑上做事的方式?
最佳答案
这真的取决于您的目标——如果您总是在具有本地主节点的单个节点上运行您的 Spark 代码,那么就使用它。但是,如果您打算在多台机器上以分布式模式运行生成的代码,那么使用 Docker 模拟集群可能会很有用,因为您将使代码以真正的分布式方式运行,并且您将能够发现并非总是如此的问题当您使用本地主机运行代码时会发现。
与其直接使用 Docker(这可能很难设置,尽管仍然可行),也许您可以考虑在 Kubernetes 上使用 Spark,例如,通过 minikube - Google 找到了大量关于此主题的文章.
关于docker - 在单台计算机上以独立模式运行 Spark : is it worth splitting it in masters and workers through docker containers (or another way)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63743050/
我正在考虑向我的应用 (Android) 添加位置权限,以便将该位置传递给广告平台(目前是 Admob 和 Mobfox)。但如果不值得,我不想去做,因为从用户的角度来看,在我的应用程序中请求位置是没
我记得听说 mysql 中的连接过程被设计为与其他 RDBMS 相比非常快,因此使用 a library that provides connection pooling如果您启用连接池,(SQLAl
在 CUDA 中使用事件时,我通常会创建一个事件并立即将其记录在某个流中。同步后,我懒得保留那个 cudaEvent_t,在别处使用它 - 我只是销毁它。 除了避免事件创建和销毁的开销之外,“回收”事
之前没用过线程,但想我可能遇到了一个机会: 我编写了一个脚本,它可以读取大约 500 个 Excel 文件的数组,并使用 Parse::Excel 从工作簿中的特定工作表中提取值(平均每个工作簿有两张
我们都编写可重用的类和代码。 我们考虑了可配置性,以允许我们一次又一次地重用这个奇妙的新类。 我们告诉我们的老板,现在花这些额外的时间会在以后为我们节省时间和金钱。 但实际上,对于我们这些不编写第三方
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 3 个月前。 Impro
我继承了一些广泛且不必要地使用 ref 关键字的代码。最初的开发人员显然担心如果不使用 ref 对象会像原始类型一样被克隆,并且在编写 50k+ 行代码之前没有费心去研究这个问题。 这与其他不良编码实
我是 Java 的新手(尤其是 Swing),最近一直在制作一些相当简单的应用程序,边学边学。最新的有很多表单组件,例如 JLabels、JTextFields、JButtons 等。所有这些都使用可
一个简单的 Google 搜索 ' appbuilder ' 揭示了一大堆新服务,声称可以帮助您使用他们的东西构建您的应用程序,并提供可以在应用程序/安卓商店上架的东西。这里有一些: Tiggzi B
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
刚刚看了一个电动云的demo,很有意思,但是很贵。 亲:优秀的功能 - 从我的作品中提取秘诀,并通过可重复使用的步骤使它们更加标准化 - 并行构建以加快速度并更有效地使用我的构建农场 - 从任何步骤重
我们内部开发了大约七个不同的网站。它们是跟踪不同人力资源申请并帮助我们的一些员工通过日程安排完成工作的网站。今天,首席软件设计师告诉我开始使用 phpUnit 为我们现有的代码编写测试用例。我们的主网
我的服务器上有几个文件,我的用户下载到他们的应用程序中。文件总数约为 14.1 MB。如果我压缩文件,结果大约是 13.2 MB。 经过几次试运行,我注意到 ipad 需要很长时间才能解压缩文件,这让
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
就目前情况而言,这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放,visit
我目前正在考虑使用 Akka(Java API/库)来完成创建多个 Future 的任务。 s 并将它们放入 BlockingQueue .现在可能是由 Callables 处理的一些任务在调用线程中
我设置了一个系统,可以从 java servlet 愉快地运行 R,生成已处理的数据并挂接到进程的 stdin、stdout 和 stderr 流中,如第二个和 this question 所示。 。
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 6 年前。 Improve
我正在考虑创建一个跨平台应用程序,但我希望它在 OS X 上看起来尽可能原生,PyObjC 是一个不错的选择吗?这有多容易?相比之下,QT 在外观原生方面有多好? 最佳答案 我不太确定我的回答是否符合
我是一名优秀的程序员,十分优秀!