pyspark - databricks 如何为集群做 auto scaling-6ren

pyspark - databricks 如何为集群做 auto scaling

转载作者：行者123 更新时间：2023-12-05 03:59:28

25

4

我有一个 databricks 集群设置，可以自动扩展到 12 个节点。我经常观察到 databricks 将集群从 6 个扩展到 8 个，然后从 8 个扩展到 11 个，然后从 11 个扩展到 14 个节点。

所以我的查询 -1、为什么会一次捡到2-3个节点添加2. 为什么自动缩放被触发，因为我看到没有多少作业在集群上处于事件状态或处理繁重。 CPU 使用率非常低。3. auto scaling为什么让notebook处于等待状态
4. 为什么自动缩放最多需要 8-10 分钟

谢谢

我正在尝试调查为什么数据 block 在不需要时自动缩放集群

最佳答案

创建集群时，您可以为集群提供固定数量的工作人员，也可以为集群提供最小和最大数量的工作人员。

当您提供固定大小的集群时，Databricks 会确保您的集群具有指定数量的工作器。当您提供工作人员数量的范围时，Databricks 会选择运行您的作业所需的适当工作人员数量。这称为自动缩放。

通过自动缩放，Databricks 动态重新分配工作人员以考虑您的工作特征。管道的某些部分可能比其他部分的计算要求更高，Databricks 会在您工作的这些阶段自动添加额外的工作人员(并在不再需要时删除他们)。

自动缩放可以更轻松地实现高集群利用率，因为您无需配置集群来匹配工作负载。这尤其适用于要求随时间变化的工作负载(例如在一天中探索数据集)，但它也适用于配置要求未知的一次性较短工作负载。因此，自动缩放提供了两个优势

:

与固定大小的工作负载相比，工作负载可以运行得更快集群配置不足。
与静态大小的集群。

Databricks 提供两种集群节点自动缩放:标准和优化。

自动缩放的行为方式

自动缩放的行为会有所不同，具体取决于它是优化的还是标准的，以及是应用于交互式集群还是作业集群。

优化

分两步从最小值扩展到最大值。
即使集群不空闲，也可以通过查看 shuffle 进行缩减文件状态。
根据当前节点的百分比进行缩减。
在作业集群上，如果集群未充分利用，则缩减规模最后 40 秒。
在交互式集群上，如果集群未得到充分利用，则缩减规模在过去的 150 秒内。

标准

从添加 4 个节点开始。此后，呈指数增长，但可以采取许多步骤来达到最大值。
仅当集群完全空闲且已被过去 10 分钟未得到充分利用。
以指数方式缩小，从 1 个节点开始。

关于pyspark - databricks 如何为集群做 auto scaling，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57145964/

25

4

0

文章推荐： Git squash 更改被远程存储库拒绝

文章推荐： c# - 守护进程应用程序和范围

文章推荐： spring-boot - 使用 prometheus 查询缓存命中率图

android - canvas.scale(scale,scale,px,py) 抽动到一个新位置
我正在尝试在 View 中同时使用 scalegesture 监听器和 gesturelistener。如果比例为 1，则一切正常，但如果将比例设置为其他值，图像会跳到一个新位置，然后平滑缩放。我的
android - 使用 Canvas 和 canvas.scale(Scale, Scale) 的图像质量问题；
我在使用 Canvas 和 canvas.scale(Scale, Scale) 时遇到图像质量问题；它们看起来完全像下面这样: android:运行时调整大小的图像质量我相信我已经阅读了所有关于调
scale - SVG 过滤器 : Scale
我有一个使用 svg 过滤器附加阴影的 svg 图形。我需要缩放阴影，但找不到可以执行此操作的过滤器。有谁知道这是否可能？
python - 使用总体样本的分类器 : scaling the population and then sampling/scaling the sample/scaling the X_TRAIN split of the sample?
我正在构建一个逻辑回归分类器。我从一组 500.000 条记录开始，我只想使用其中的一个样本。你有什么建议: 1) 缩放总体然后采样2)缩放样本3) 仅缩放样本的 X_TRAIN 分割？为什么？
javascript - jquery scale scale 函数以指数方式增加大小
我有一个功能，我用它在鼠标进入时放大图片并在鼠标离开时返回到正常大小。问题是，如果我在允许图片返回正常大小之前快速将鼠标移出然后将鼠标移入，那么图片将从鼠标输入时当前的任何大小放大(x2.7) (并且
scale - zingchart scale-y-n zoomtovalue
可以在 scale-y-2 中使用 zoomtovalues 吗？我在多个 y 轴上有几个系列，我想将每个 scale-y-n 缩放到特定值，但我不知道如何... 谢谢和问候，最佳答案我们在最近的
android - TextView : scale down and scale up with sequential animations
我正在尝试在 Android 中创建(我认为是)一个相对简单的动画。也就是说，我想让某个 TextView 在单击按钮时缩小到 0 并返回到 1。当我单击该按钮时实际发生的是 TextView 立即缩
scale - 使用 CSS Transform Scale 匹配父元素
我有一个元素需要缩放到父元素的 100%。因为该元素包含基于像素的动画和可以缩放的图像，所以我不能使用百分比。有没有办法使用 css transform scale 来做到这一点？最佳答案相对 c
charts - ChartJS : Invalid scale configuration for scale: xAxes
我在 ChartJS 中遇到一个奇怪的错误并且不知道如何修复它，由于这个错误我无法更改比例的任何内容。我的代码(Sensor.tsx): import { useParams } from "sol
java - 为什么除 BigInteger 时减去 scale，乘法时加 scale？
我有一些数据，我正试图通过不断增加的分母来准确和精确地处理这些数据。请假设分子总是有小数。我在 docs 中看到divide(BigDecimal divisor) 实际上会减小比例，这看起来很奇
html - 转换 : scale while having scaling child element 卡顿
喂， https://jsfiddle.net/jbwq6y87/7/ #box { width: 500px; height: 500px; transition: 0.5s; ov
python - 如何让 ttk.Scale 表现得更像 tk.Scale？
几个 Tk 小部件也存在于 Ttk 版本中。通常它们具有相同的一般行为，但使用“样式”和“主题”而不是每个实例的外观属性(例如 bg 等)。这很好，因为 Ttk 小部件默认采用操作系统窗口管理器的“标
ffmpeg - FFMPEG 选项 scale=-1 和 scale=-2
我尝试转换视频并使用 scale=-1:720 调整其大小，但出现错误“宽度不能被 2 整除”。我解决了这个问题:scale=-2:720。之间有什么区别 scale=-1:720 和 scale=
html - CSS - 变换 :scale images overlapping and not scaling correctly
我正在尝试重新创建此 codepen变换:我网站上特定页面的缩放转换，但它没有按预期工作 - 正如您在此代码片段中看到的那样(在整页上查看) - 图像覆盖/覆盖不足和不稳定而不是平滑。 /* Part
python - 如何根据Python中另一个 tkinter `Scale` 小部件的值来控制 tkinter `Scale` 小部件的值？
我有 3 个 Scale 小部件 scale1、scale2 和 scale3。我想使用 scale1 按以下方式控制 scale2 和 scale3 的值: 我不希望 scale2 和 scale3
python - R.scale() 和 sklearn.preprocessing.scale() 的区别
我目前正在将我的数据分析从 R 转移到 Python。在 R 中缩放数据集时，我会使用 R.scale()，据我所知，它会执行以下操作:(x-mean(x))/sd(x) 为了替换该函数，我尝试使用
d3.js - d3.scale.quantize()和d3.scale.quantile()有什么区别？
从文档中，定义为: 量化 ..a variant of linear scales with a discrete rather than continuous range. The input do
javascript - ChartJS v2 : Scale value at click coordinates (time scale)
我有一个时基折线图，我正在尝试获取点击坐标处每个刻度的值。我在 ChartJS 选项中指定的 onClick 函数: onClick: function(event, elementsAtEvent
html - initial-scale=1 和 initial-scale=1.0 有区别吗？
我见过这样写的代码: ，但我也看到过这样写的代码: initial-scale=1 和 initial-scale=1.0 有区别吗？最佳答案没有。 specification描述视口(viewp
r - 玩完美俄罗斯方 block : how to align and scale two curves using scaling and translation?
给定 y 轴 (s) 上的缩放和 x 轴 (t) 上的平移参数，当目的是最大化曲线叠加(而不是最小化距离)时，如何缩放和对齐两条不重合的曲线？正如 @DWin 所指出的，这可能会被重新命名为“如何使

首页

博学

6Ren·AI

商城

pyspark - databricks 如何为集群做 auto scaling

自动缩放的行为方式

优化

标准