Python:使用梯形规则快速计算平均值-6ren

Python:使用梯形规则快速计算平均值

转载作者：行者123 更新时间：2023-12-01 09:33:25

24

4

使用Python，我必须处理一些数据。

我得到了大约 50 个函数在大约 1000 万个时间点的值。这些值以二维列表矩阵的形式给出，即matrix[i]是一个值列表

[t_i，t_i 处 f1 的值，t_i 处 f2 的值 ...，t_i 处 fN 的值]

其中N = 50。

由于

数据中可能存在的噪声(函数是一些测量值)
非等距时间点(有时时间步长是几秒，但有时可以以天为单位)

我决定使用给定值在固定长度的某些预定义时间间隔上的平均值。

我尝试了不同长度的间隔:范围在一分钟到一小时之间。

我计算平均值的算法如下:

matrix = ...  # read matrix
t0 = matrix[0][0]
ts_new = [t0 + i * time_step for i in range(some_bound)]
buckets = [[] for t in ts_new]
for i, instance in enumerate(matrix):
    t_i = instance[0]
    put i to the bucket with index j, such that ts_new[j] <= t_i < ts_new[j + 1] 
for bucket in buckets:
    compute the average values of f1, ... , fN over the instances from bucket

The bottle-neck of the algorithm is the last for-loop.

如果我将 matrix 转换为 numpy.array 并将 bucket 的平均值计算为 matrix[bucket, :] .mean(axis=0)，这工作得相当快，但计算值没有多大意义:

如果f1在ts = [0, 99, 100]时刻的值分别为ys = [0, 0, 2]，mean 函数返回 2/3(如预期)。但是，f1 的平均值应该更接近于0。使用梯形规则，可以得到平均值0.01，这样更有意义。

所以，目前，我正在使用

计算桶平均值的scipy.integrate.trapz方法:梯形面积除以间隔长度
scipy.interpolate.interp1d 方法用于获取函数 f 在间隔边界处的值，例如，我使用前一个桶中的最后一个点和第一个点给定存储桶中的点，计算相应时间间隔开始时的值(时间间隔结束时的值类似)

需要第二个项目符号，因为一分钟的时间间隔长度非常短，有时桶中只有一两个点。程序是这样的:

# for one bucket
means = [0 for col in range(N)]
for col in range(1, N + 1):  # for each function f
    xs = []
    ys = []
    if can_interpolate_at_start:
        f_lin = scipy.interpolate.interp1d([tPrevLast, tNowFirst], [yPrevLast, yNowFirst])
        xs.append(t_bucketStart)
        ys.append(f_lin(t_bucketStart))
    xs += matrix[bucket, 0]
    ys += matrix[bucket, col]
    if can_interpolate_at_end:
        # ...
    means[col - 1] = scipy.integrate.trapz(ys, xs) / (xs[-1] - xs[0])

can_interpolate_at_start 和 can_interpolate_at_end 的值仅取决于时间间隙(但必须特别注意第一个和最后一个存储桶...):我不如果前一个存储桶中的最后一个点与当前存储桶中的时间差太大，则使用插值点。

My problem: the current approach is really slow (two hours or so for one-minute time intervals). How can I make it faster?

最佳答案

您可以做的一个简单的事情是，从间隔的角度考虑，取每个间隔的每个函数的平均值，然后将 if 乘以间隔长度，然后除以总时间:

import numpy as np

matrix = ...
data = np.asarray(matrix)
t_diff = np.diff(data[:, 0])
means_sum = np.sum(t_diff[:, np.newaxis] * (data[:-1, 1:] + data[1:, 1:]) / 2, axis=0)
means = means_sum / (data[-1, 0] - data[0, 0])

关于Python:使用梯形规则快速计算平均值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49758371/

24

4

0

文章推荐： java - Java中捕获异常的并发排序任务执行器

文章推荐： java - 根据条件从 JSON API 中的方法返回不同的对象

kubernetes - CORS 规则 nginx-ingress 规则
我需要在 nginx-ingress 版本上允许来自多个来源的请求:http://localhost:4200、http://localhost:4242 等1.7.1.但我无法对多个来源执行此操作，
apache - htaccess 规则 (mod_rewrite) 转换为 web.config 规则
我正在部署我使用 APIGILITY 开发的 API到 IIS。由于 IIS 不支持 .htaccess，我试图从 .htaccess 文件的内容创建 web.config 文件。我使用 IISv7.
"google' s 检查元素上的 html 规则 VS css 规则”
我正在尝试更改上面 css 样式中的“宽度”规则。在“inspect element”中你可以看到宽度是1008px。我不希望它是 1008px 但它不会让我在 css 样式中更改它你可以看到它被“删
css - 每个 html 元素的 css 规则 VS 每个元素的几个简单的 css 规则？
外部css赋值有2种方法，我用的是第一种；大多数网站使用第二种方法。我想知道我是否做错了! 第一种方法: 为几乎每个 css 规则创建一个类并在任何地方使用它们。 blah blah .f_
03、RDF 规则
RDF使用 WEB 标识符 (URIs) 来标识资源，使用属性和属性值来描述资源 RDF 资源、属性和属性值 RDF使用 WEB 标识符来标识事物，并通过属性和属性值来描述资源。关于资源、属性
R 规则，仅我的规则来自特定列
我想挖掘特定的 rhs 规则。文档中有一个示例证明这是可能的，但仅适用于特定情况(如下所示)。先来一个数据集来说明我的问题: input {b=100002} 0.2500000 0.250000
服务根的 nginx 规则
我想让 nginx 从网站根目录(:http://localhost:8080/)提供一个静态文件，但它为我的代理通行证提供服务；它提供“/”规则而不是“=/”。这是我的 nginx 配置的样子:
具有用于单次调用的多个目标的 Makefile 规则
根据gnu make documentation , 如果一个规则通过一次调用生成多个目标(例如，一个配方执行一个带有多个输出文件的工具)，你可以使用 '&:' 规则语法来告诉 make。但是，当在多
Firebase 规则 : What is . 包含()？
我已阅读Firebase Documentation并且不明白什么是 .contains()。以下是文档中 Firebase 数据库的示例规则: { "rules": { "rooms"
haskell - 函数内的格式化语句 - 规则？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 6 年前。 Improv
java多态后期绑定(bind)规则
我正在尝试做一些多态性练习，但我无法弄清楚这种多态性是如何工作的。我没有找到任何关于这种练习的深入信息。希望大家能给我一些解释。练习1: class Top { public void m(
保留中间文件的 Makefile 规则
为了调试复杂的 XSLT 转换，我将其分为几个部分:首先构建 %.1.xml，然后使用它构建 %.2.xml ，最后构建 %.3.xml。一切正常，但如果我要求 Make 构建最后一个，Make 总是
python - 如何添加验证特征/规则？
我尝试了 hacerrank 的 slove 练习 Click我不知道如何添加这些规则: ► 它可以包含 4 个一组的数字，并用一个连字符“-”分隔。 ► 不得有 4 个或更多连续重复数字。这是我的
c# - 我如何使声明遵循与以前相同的 "if"规则
我正在尝试编写一个小测验，我希望“再试一次”按钮遵循与“else”之前的“if”语句相同的规则 using System; public class Program { public stat
java - Spring服务方法和复杂的验证逻辑/规则
在我的 Spring/Boot Java 项目中，我有一组服务方法，例如以下一个: @Override public Decision create(String name, String descr
协变虚函数的 C++ 规则
我正在阅读 Covariant virtual function .上面写着假设 B::f 覆盖了虚函数 A::f。如果满足以下所有条件，A::f 和 B::f 的返回类型可能不同: 1) The
iOS 企业开发者计划 - 规则
我工作的公司想要分发(在公共(public)链接中)具有内部签名的应用程序。我很确定 Apple 否认这种事情，但我在官方文档/契约(Contract)中没有找到任何相关信息。有谁知道它到底是如何工
页面加载时不应用 css 规则
我是 CSS 新手。我观察到一个奇怪的 CSS 行为，其中一个元素具有以下 CSS 属性 .container .header{ color: #FFFFFF; font-size: 2em;
基于内容的 CSS 规则
这个问题在这里已经有了答案: Is there a CSS selector for elements containing certain text? (21 个答案) 关闭 7 年前。
不应用 CSS 规则
我有以下 CSS: workoutcal.css: .errorlist{ color:red; } 以下基本模板: base.html: {% load static %} {

首页

博学

6Ren·AI

商城

Python:使用梯形规则快速计算平均值