- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
更新:迄今为止性能最好的算法is this one。
这个问题探索了用于检测实时时间序列数据中突然峰值的鲁棒算法。
考虑以下数据集:
Matlab格式的数据示例(但此问题与语言无关,而与算法有关):
p = [1 1 1.1 1 0.9 1 1 1.1 1 0.9 1 1.1 1 1 0.9 1 1 1.1 1 1 1 1 1.1 0.9 1 1.1 1 1 0.9, ...
1 1.1 1 1 1.1 1 0.8 0.9 1 1.2 0.9 1 1 1.1 1.2 1 1.5 1 3 2 5 3 2 1 1 1 0.9 1 1, ...
3 2.6 4 3 3.2 2 1 1 0.8 4 4 2 2.5 1 1 1];
您可以清楚地看到有三个大峰和一些小峰。该数据集是问题所涉及的时间序列数据集类别的特定示例。此类数据集具有两个常规功能:
最佳答案
稳健的峰值检测算法(使用z分数)
我想出了一种对这些类型的数据集非常有效的算法。它基于dispersion原理:如果新数据点是给定的x偏离某个移动平均值的标准偏差数,则算法会发出信号(也称为z-score)。该算法非常健壮,因为它构造了单独的移动平均值和偏差,从而信号不会破坏阈值。因此,无论先前信号的数量如何,都以大致相同的精度识别 future 信号。该算法需要3个输入:lag = the lag of the moving window
,threshold = the z-score at which the algorithm signals
和influence = the influence (between 0 and 1) of new signals on the mean and standard deviation
。例如,lag
为5将使用最后5个观测值来平滑数据。如果数据点与移动平均值相差3.5个标准偏差,则threshold
为3.5会发出信号。 0.5的influence
给信号带来的影响是普通数据点的一半。同样,influence
为0时会完全忽略用于重新计算新阈值的信号。因此,影响力0是最可靠的选项(但假定为stationarity);将影响力选项设置为1的方法最不可靠。因此,对于非平稳数据,影响选项应置于0到1之间。
其工作方式如下:
伪码
# Let y be a vector of timeseries data of at least length lag+2
# Let mean() be a function that calculates the mean
# Let std() be a function that calculates the standard deviaton
# Let absolute() be the absolute value function
# Settings (the ones below are examples: choose what is best for your data)
set lag to 5; # lag 5 for the smoothing functions
set threshold to 3.5; # 3.5 standard deviations for signal
set influence to 0.5; # between 0 and 1, where 1 is normal influence, 0.5 is half
# Initialize variables
set signals to vector 0,...,0 of length of y; # Initialize signal results
set filteredY to y(1),...,y(lag) # Initialize filtered series
set avgFilter to null; # Initialize average filter
set stdFilter to null; # Initialize std. filter
set avgFilter(lag) to mean(y(1),...,y(lag)); # Initialize first value
set stdFilter(lag) to std(y(1),...,y(lag)); # Initialize first value
for i=lag+1,...,t do
if absolute(y(i) - avgFilter(i-1)) > threshold*stdFilter(i-1) then
if y(i) > avgFilter(i-1) then
set signals(i) to +1; # Positive signal
else
set signals(i) to -1; # Negative signal
end
# Reduce influence of signal
set filteredY(i) to influence*y(i) + (1-influence)*filteredY(i-1);
else
set signals(i) to 0; # No signal
set filteredY(i) to y(i);
end
# Adjust the filters
set avgFilter(i) to mean(filteredY(i-lag),...,filteredY(i));
set stdFilter(i) to std(filteredY(i-lag),...,filteredY(i));
end
在下面可以找到为数据选择良好参数的经验法则。
lag
后开始工作。
lag = 30, threshold = 5, influence = 0
:
lag
:lag参数确定将对您的数据进行平滑处理的数量,以及该算法对数据的长期平均值变化的适应性。数据
stationary越多,应包含的滞后就越多(这将提高算法的鲁棒性)。如果数据包含随时间变化的趋势,则应考虑希望算法多快适应这些趋势。也就是说,如果将
lag
设置为10,则需要10个“期间”,才能将算法的阈值调整为长期平均值的任何系统变化。因此,请根据数据的趋势行为以及该算法的适应性来选择
lag
参数。
influence
:此参数确定信号对算法检测阈值的影响。如果将其设置为0,则信号对阈值没有影响,因此,将根据阈值来检测将来的信号,该阈值的平均值和标准偏差不受过去信号的影响。如果设为0.5,则信号的影响是正常数据点的一半。考虑这一点的另一种方法是,如果将影响设为0,则隐含假设平稳(即,无论有多少信号,您始终希望时间序列从长远来看会返回相同的平均值)。如果不是这种情况,则应将影响参数设置在0到1之间,这取决于信号可以系统地影响数据的时变趋势的程度。例如,如果信号导致时间序列的长期平均值
structural break,则应将影响参数设置为较高(接近1),以便阈值可以快速响应结构性断裂。
threshold
:阈值参数是与移动平均值的标准偏差数,在该平均值以上,算法会将新数据点分类为信号。例如,如果新数据点比移动平均值高4.0个标准差,并且阈值参数设置为3.5,则算法会将数据点识别为信号。该参数应根据您期望的信号数量来设置。例如,如果您的数据是正态分布的,则阈值(或z分数)为3.5时,对应的信号概率为0.00047(来自
this table),这意味着您希望每2128个数据点(1/0.00047)发送一次信号。因此,阈值直接影响算法的敏感度,从而也确定算法发出信号的频率。检查您自己的数据,然后选择一个合理的阈值,该阈值可以在您希望算法发出信号时发出信号(此处可能需要反复试验才能达到您的目的所需的良好阈值)。
filteredY
,
avgFilter
和
stdFilter
一次。请勿在每次有新数据点时都重新计算所有数据的信号(如上例中所示),这在实时应用中会非常低效且缓慢。
influence
参数
Brakel, J.P.G. van (2014). "Robust peak detection algorithm using z-scores". Stack Overflow. Available at: https://stackoverflow.com/questions/22583391/peak-signal-detection-in-realtime-timeseries-data/22640362#22640362 (version: 2020-11-08).
关于algorithm - 实时时间序列数据中的峰值信号检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22583391/
这是一个与 Get OS-Version in WinRT Metro App C# 相关的问题但不是它的重复项。 是否有任何选项可以从 Metro 应用程序检测系统上是否有可用的桌面功能?据我所知,
我想在闹钟响起时做点什么。例如, toast 或设置新闹钟。我正在寻找可以检测闹钟何时响起的东西。首先,我在寻找广播 Action ,但找不到。也许是我的错? 当闹钟响起时,还有其他方法可以做些什么吗
如果某个 JS 添加了一个突变观察者,其他 JS 是否有可能检测、删除、替换或更改该观察者?我担心的是,如果某些 JS 旨在破坏某些 DOM 元素而不被发现,那么 JS 可能想要摆脱任何观察该 DOM
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想要改善这个问题吗?更新问题,以便将其作为on-topi
有没有办法在您的 Activity/应用程序中(以编程方式)知道用户已通过 USB 将您的手机连接到 PC? 最佳答案 有人建议使用 UMS_CONNECTED自最新版本的 Android 起已弃用
我正在想办法测量速度滚动事件,这将产生某种代表速度的数字(相对于所花费的时间,从滚动点 A 到点 B 的距离)。 我欢迎任何以伪代码形式提出的建议...... 我试图在网上找到有关此问题的信息,但找不
某些 JavaScript 是否可以检测 Skype 是否安装? 我问的原因是我想基于此更改链接的 href:如果未安装 Skype,则显示一个弹出窗口,解释 Skype 是什么以及如何安装它,如果已
我们正在为 OS X 制作一个使用 Quartz Events 移动光标的用户空间设备驱动程序,当游戏(尤其是在窗口模式下运行的游戏)无法正确捕获鼠标指针时,我们遇到了问题(= 将其包含/保留在其窗口
我可以在 Controller 中看到事件 $routeChangeStart,但我不知道如何告诉 Angular 留下来。我需要弹出类似“您要保存、删除还是取消吗?”的信息。如果用户选择取消,则停留
我正在解决一个问题,并且已经花了一些时间。问题陈述:给你一个正整数和负整数的数组。如果索引处的数字 n 为正,则向前移动 n 步。相反,如果为负数(-n),则向后移动 n 步。假设数组的第一个元素向前
我试图建立一个条件,其中 [i] 是 data.length 的值,问题是当有超过 1 个值时一切正常,但当只有 1 个值时,脚本不起作用。 out.href = data[i].hr
这是我的问题,我需要检测图像中的 bolt 和四分之一,我一直在搜索并找到 OpenCV,但据我所知它还没有在 Java 中。你们打算如何解决这个问题? 最佳答案 实际上有一个 OpenCV 的 Ja
是否可以检测 ping? IE。设备 1 ping 设备 2,我想要可以在设备 2 上运行的代码,该代码可以在设备 1 ping 设备时进行检测。 最佳答案 ping 实用程序使用的字面消息(“ICM
我每天多次运行构建脚本。我的感觉是我和我的同事花费了大量时间等待这个脚本执行。现在想知道:我们每天花多少时间等待脚本执行? .我可以对总体平均值感到满意,即使我真的很想拥有每天的数据(例如“上周一我们
我已经完成了对项目的编码,但是当我在客户端中提交了源代码时,就对它进行了测试,然后检测到内存泄漏。我已经在Instruments using Leaks中进行了测试。 我遇到的问题是AVPlayer和
我想我可以用 std.traits.functionAttributes 来做到这一点,但它不支持 static。对于任何类型的可调用对象(包含 opCall 的结构),我如何判断该可调用对象是否使用
我正在使用多核 R 包中的并行和收集函数来并行化简单的矩阵乘法代码。答案是正确的,但并行版本似乎与串行版本花费的时间相同。 我怀疑它仅在一个内核上运行(而不是在我的机器上可用的 8 个内核!)。有没有
我正在尝试在读取 csv 文件时编写一个这样的 if 语句: if row = [] or EOF: do stuff 我在网上搜索过,但找不到任何方法可以做到这一点。帮忙? 最佳答案 wit
我想捕捉一个 onFontSizeChange 事件然后做一些事情(比如重新渲染,因为浏览器已经改变了我的字体大小)。不幸的是,不存在这样的事件,所以我必须找到一种方法来做到这一点。 我见过有人在不可
我有一个使用 Windows 服务的 C# 应用程序,该服务并非始终打开,我希望能够在该服务启动和关闭时发送电子邮件通知。我已经编写了电子邮件脚本,但我似乎无法弄清楚如何检测服务状态更改。 我一直在阅
我是一名优秀的程序员,十分优秀!