python - 使用 pandas 时间序列的过去 n 小时的变化率-6ren

python - 使用 pandas 时间序列的过去 n 小时的变化率

转载作者：行者123 更新时间：2023-11-28 19:20:12

25

4

我想将列添加到时间索引的 pandas DataFrame 中，其中包含每个现有列在过去 n 小时内的变化率。我已经用下面的代码完成了这个，但是，它对我的需要来说太慢了(可能是因为遍历了每列的每个索引？)。

有没有(计算上)更快的方法来做到这一点？

roc_hours = 12
tol = 1e-10 
for c in ts.columns:
    c_roc = c + ' +++ RoC ' + str(roc_hours) + 'h' 
    ts[c_roc] = np.nan
    for i in ts.index[np.isfinite(ts[c])]:
        df = ts[c][i - np.timedelta64(roc_hours, 'h'):i]
        X = (df.index.values - df.index.values.min()).astype('Int64')*2.77778e-13 #hours back
        Y = df.values
        if Y.std() > tol and X.shape[0] > 1:
            fit = np.polyfit(X,Y,1)
            ts[c_roc][i] = fit[0]
        else:
            ts[c_roc][i] = 0

编辑输入数据帧 ts 是不规则采样的，可以包含 NaN。输入ts的前几行:

+---------------------+-------------------+------+------+--------------------+-------------------+------------------+
|         WCT         |         a         |  b   |  c   |         d          |         e         |        f         |
+---------------------+-------------------+------+------+--------------------+-------------------+------------------+
| 2011-09-04 20:00:00 |                   |      |      |                    |                   |                  |
| 2011-09-04 21:00:00 |                   |      |      |                    |                   |                  |
| 2011-09-04 22:00:00 |                   |      |      |                    |                   |                  |
| 2011-09-04 23:00:00 |                   |      |      |                    |                   |                  |
| 2011-09-05 02:00:00 |        93.0       | 97.0 | 20.0 |       209.0        |        85.0       |       98.0       |
| 2011-09-05 03:00:00 | 74.14285714285714 | 97.0 | 20.0 | 194.14285714285717 | 74.42857142857143 |       98.0       |
| 2011-09-05 04:00:00 |        67.5       | 98.5 | 20.0 |       176.0        |        75.0       |       98.0       |
| 2011-09-05 05:00:00 |        72.0       | 98.5 | 20.0 |       176.0        |        75.0       |       98.0       |
| 2011-09-05 07:00:00 |        80.0       | 93.0 | 19.0 |       186.0        |        71.0       |       97.0       |
| 2011-09-05 08:00:00 |        80.0       | 93.0 | 19.0 |       186.0        |        71.0       |       97.0       |
| 2011-09-05 09:00:00 |        78.5       | 98.0 | 19.0 |       186.0        |        71.0       |       97.0       |
| 2011-09-05 10:00:00 |        73.0       | 98.0 | 19.0 |       186.0        |        71.0       |       97.0       |
| 2011-09-05 11:00:00 |        77.0       | 98.0 | 18.0 |       175.0        |        87.0       | 97.0999984741211 |
| 2011-09-05 12:00:00 |        78.0       | 98.0 | 19.0 |       163.0        |        57.0       | 98.4000015258789 |
| 2011-09-05 15:00:00 |        78.0       | 98.0 | 19.0 |       163.0        |        57.0       | 98.4000015258789 |
+---------------------+-------------------+------+------+--------------------+-------------------+------------------+

编辑2

分析后，瓶颈在切片步骤:df = ts[c][i - np.timedelta64(roc_hours, 'h'):i]。此行提取在 now-roc_hours 和 now 之间加盖时间戳的观察结果。这是非常方便的语法，但占用了大量的计算时间。

最佳答案

在我的数据集上工作，还没有检查你的数据集:

import pandas as pd
from numpy import polyfit
from matplotlib import style
style.use('ggplot')

# ... acquire a dataframe named *water* with a column *value*

WINDOW = 10
ax=water.value.plot()
roll = pd.rolling_mean(water.value, WINDOW)
roll.plot(ax=ax)

def lintrend(df):
    df = df.tolist()
    m, b = polyfit(range(len(df)), df,1)
    return m

linny = pd.rolling_apply(water.value, WINDOW, lintrend)

linny.plot(ax=ax)

在 rolling_apply 将其转换为 numpy.ndarray 之后将 numpy.ndarray 转换为列表似乎并不优雅。有什么建议吗？

关于python - 使用 pandas 时间序列的过去 n 小时的变化率，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27151425/

25

4

0

文章推荐： python - Emacs Pymacs Ropemacs 在 goto 定义后返回到上一个文件

文章推荐： javascript - 在 Javascript/Jquery 中传递查询字符串

文章推荐： html - 输入/按钮元素不会在 flex 容器中收缩

文章推荐： javascript - 链接 promise 和传递值的简洁方式

delphi - 如何在我的应用程序中为新估算的项目设置值(value)率
我使用 QBFC v13 和 Delphi XE6。目标是从我的应用程序创建 Estimate 并将其参数设置到 QuickBooks 中。我从 QBFC13 导入类型库并将其添加到我的项目中。
android - 如何避免谷歌地图中的 QUERY_LIMIT 率
我有一个数据库，其中有很多格式不正确的地址。在这个地址中，我只有一个街道地址或带有城市名称的街道。在我的应用程序中，用户选择一些类别，然后我想在 map 上显示例如 50,100,300 等地址。(不
unit-testing - 降低大型软件开发项目中的缺陷注入(inject)率
在大多数软件项目中，缺陷源自需求、设计、编码和缺陷更正。根据我的经验，大多数缺陷都源于编码阶段。我有兴趣了解软件开发人员使用哪些实用方法来降低缺陷注入(inject)率。我已经看到以下方法的使用取
Instagram 实时 API POST 率
我正在使用实时 API 中的标签订阅构建一个应用程序，并且有一个与容量规划相关的问题。我们可能有大量用户同时发布到订阅的主题标签，因此问题是 API 实际发布到我们的订阅处理端点的频率是多少？例如，如
SQL 率(百分比)计算 - 除以零错误
尝试使用 NULLIF 或 IFNULL 函数，但仍收到被零除的消息。 SELECT client_id ,COUNT(distinct CASE WHEN status = 'failed' THE
Django Rest Framework 对缓存请求的 throttle 率
我目前正在开发一个使用 Django-rest-framework 制作的 API。我必须根据每个用户组设置限制率。我们目前使用默认配置的 memcached 作为缓存后端，即按站点缓存。在使用
tensorflow - 在 tensorflow 训练期间改变 Dropout 率 - 可能吗？
我认为有时在神经网络(特别是一般对抗网络)训练期间改变丢失率可能是一个好主意，从高丢失率开始，然后线性地将丢失率降低到零。您认为这有意义吗？如果是的话，是否有可能在 tensorflow 中实现这一点
windows - 什么是 named.exe 进程以及如何避免消耗高 CPU 率
我有一个 Windows Server 2008，Plesk 运行着两个网站。有时服务器运行缓慢，并且有一个 named.exe 进程使 CPU 峰值达到 100%。它持续很短的时间，过一会儿它又来了
machine-learning - 降低 FP 率 scikit-learn 随机森林
我正在使用 scikit-learn 随机森林分类器，我想通过将成功投票所需的树数量从大于 50% 增加到 75% 来降低 FP 率，在阅读文档后我不这样做确定如何做到这一点。有没有人有什么建议。 (
javascript - 为什么 JavaScript 的 setTimeout 不减慢 keydown 率？
当我连续按下按键事件(字母 k)时，为什么以下按键事件不会减慢 3000 密耳？如果我按住手指，计数会迅速增加，因为 mcount 上没有 setTimeout。这是为什么？每次计数之间应该有延迟，但

首页

博学

6Ren·AI

商城

python - 使用 pandas 时间序列的过去 n 小时的变化率