gpt4 book ai didi

monitoring - OpenTSDB如何对数据进行降采样

转载 作者:行者123 更新时间:2023-12-02 16:20:44 25 4
gpt4 key购买 nike

我有一个关于 OpenTSDB 下采样的两部分问题。

第一个是我想知道是否有人知道OpenTSDB在计算下采样时是否将最后一个端点包含或排除,或者将结束数据点计算两次?

例如,如果我的时间间隔是 12:30pm-1:30pm,并且我从中午 12:29:44 开始每 5 分钟获取 DP,并且我的下采样间隔每 10 分钟 block 求和一次,那么系统是否从以下位置获取 DP: 12:30-12:39 并对它们求和,12:40-12:49 并对它们求和,等等,还是从 12:30-12:40 获取 DP,然后从 12:40-12:50 等等。是的,我知道我的数据有 15 秒的偏差,但我无法控制这一点。

我尝试手动计算它,但我拥有的数据对我没有帮助。我计算的数字与上面的相加不符,也不与图表显示的相匹配。我无权访问将数字插入 OpenTSDB 的系统,因此无法设置虚拟数据进行检查。

第二个问题是下采样如何根据我的时间范围和下采样间隔在图表上绘制其点?我将下采样设置为对 10 分钟 block 求和。我将范围设置为中午 12:30 至下午 1:30。该图显示了从中午 12:35 开始的下采样图的第一个点。这是合乎逻辑的。
我将范围更改为 12:24pm-1:29pm,并预计第一个点在 12:30 开始,但显示的第一个点是中午 12:25。

希望有人能帮我解答这些问题。与此同时,我将继续尝试在我的系统中找到一些数据,以帮助展示/证明下采样应该如何工作。

预先感谢您的帮助。

最佳答案

下采样目前并未按您预期的方式工作,尽管这是合理且普遍的预期,但我们正在考虑在 OpenTSDB 的后续版本中更改此设置。

您假设如果您要求“10 分钟总和”,则数据点将在每个“轮”(或“对齐”)10 分钟 block (例如 12:30-12:39)内求和在你的例子中是12:40-12:49),但事实并非如此。发生的情况是,代码将从它找到的第一个数据点开始一个 10 分钟的 block 。因此,如果第一个数据点的时间为 12:29:44,则代码​​将对所有后续数据点求和,直到 600 秒后,即直到 12:39:44。

在每个 600 秒的 block 内,可能有不同数量的数据点。某些 block 可能比其他 block 具有更多的数据点。某些 block 可能具有不均匀间隔的数据点,例如也许所有数据点在 600s block 开始时都在一秒之内。因此,为了决定下采样操作将产生什么时间戳,代码使用 block 的所有数据点的平均时间戳。

因此,如果所有数据点在 600 秒的 block 中均匀分布,则平均时间戳将落在 block 中间的某个位置。但是,如果所有数据点在 600 秒 block 开始时彼此相差不到一秒,那么返回的时间戳将通过平均值反射(reflect)这一点。需要明确的是,无论您选择什么下采样函数(总和、最小值、最大值、平均值等),代码都会取时间戳的平均值。

如果您想快速试验 OpenTSDB,而不写入生产系统,请考虑设置单节点 OpenTSDB 实例。这很容易做到,如 getting started guide 所示。 .

关于monitoring - OpenTSDB如何对数据进行降采样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18796020/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com