pandas - 如何对具有偏移量的向量应用操作-6ren

pandas - 如何对具有偏移量的向量应用操作

转载作者：行者123 更新时间：2023-12-03 14:06:43

25

4

考虑以下 pd.DataFrame

import numpy as np
import pandas as pd

start_end = pd.DataFrame([[(0, 3), (4, 5), (6, 12)], [(7, 10), (11, 90), (91, 99)]])
values = np.random.rand(1, 99)

start_end是 pd.DataFrame形状 (X, Y)其中里面的每个值都是 (start_location, end_location) 的元组在 values向量。另一种说法是特定单元格中的值是不同长度的向量。
问题
如果我想找到 pd.DataFrame 中每个单元格的向量值的平均值(例如) ，我怎样才能以具有成本效益的方式做到这一点？
我设法通过 .apply 实现了这一目标功能，但速度很慢。
我想我需要找到某种方式将它呈现在 numpy 中数组，然后将其映射回 2d 数据框，但我不知道如何。
备注

起点和终点之间的距离可能会有所不同，并且可能存在异常值。

单元格开始/结束始终与其他单元格不重叠(看看这个先决条件是否影响求解速度会很有趣)。

广义问题
更一般地说，我这是一个反复出现的问题，即如何制作 3d 数组，其中一个维度的长度与通过某些转换函数(均值、最小值等)与 2d 矩阵的长度不相等。

最佳答案

前瞻性方法
查看您的示例数据:

In [64]: start_end
Out[64]: 
         0         1         2
0   (1, 6)    (4, 5)   (6, 12)
1  (7, 10)  (11, 12)  (13, 19)

每行确实不重叠，但不是整个数据集。
现在，我们有 np.ufunc.reduceat ，它为我们提供了每个切片的 ufunc 缩减:

ufunc(ar[indices[i]: indices[i + 1]])

只要 indices[i] < indices[i+1] 。
因此，使用 ufunc(ar, indices) ，我们将得到:

[ufunc(ar[indices[0]: indices[1]]), ufunc(ar[indices[1]: indices[2]]), ..]

在我们的例子中，对于每个元组 (x,y) ，我们知道 x<y 。对于堆叠版本，我们有:

[(x1,y1), (x2,y2), (x3,y3), ...]

如果我们扁平化，它将是:

[x1,y1,x2,y2,x3,y3, ...]

所以，我们可能没有 y1<x2 ，但这没关系，因为我们不需要对那个和类似的 ufunc 减少 y2,x3 。但这没关系，因为可以通过最终输出的步长切片来跳过它们。
因此，我们将有:

# Inputs : a (1D array), start_end (2D array of shape (N,2))
lens = start_end[:,1]-start_end[:,0]
out = np.add.reduceat(a, start_end.ravel())[::2]/lens

np.add.reduceat() 部分为我们提供了切片求和。我们需要通过 lens 除以进行平均计算。
sample 运行 -

In [47]: a
Out[47]: 
array([0.49264042, 0.00506412, 0.61419663, 0.77596769, 0.50721381,
       0.76943416, 0.83570173, 0.2085408 , 0.38992344, 0.64348176,
       0.3168665 , 0.78276451, 0.03779647, 0.33456905, 0.93971763,
       0.49663649, 0.4060438 , 0.8711461 , 0.27630025, 0.17129342])

In [48]: start_end
Out[48]: 
array([[ 1,  3],
       [ 4,  5],
       [ 6, 12],
       [ 7, 10],
       [11, 12],
       [13, 19]])

In [49]: [np.mean(a[i:j]) for (i,j) in start_end]
Out[49]: 
[0.30963037472653104,
 0.5072138121177008,
 0.5295464559328862,
 0.41398199978967815,
 0.7827645134019902,
 0.5540688880441684]

In [50]: lens = start_end[:,1]-start_end[:,0]
    ...: out = np.add.reduceat(a, start_end.ravel())[::2]/lens

In [51]: out
Out[51]: 
array([0.30963037, 0.50721381, 0.52954646, 0.413982  , 0.78276451,
       0.55406889])

为了完整起见，引用给定的示例，转换步骤是:

# Given start_end as df and values as a 2D array
start_end = np.vstack(np.concatenate(start_end.values)) 
a = values.ravel()

对于其他具有 reduceat 方法的 ufunc，我们将替换 np.add.reduceat

关于pandas - 如何对具有偏移量的向量应用操作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62776121/

25

4

0

文章推荐： scala - 如何避免在 Scala 中调用 asInstanceOf

文章推荐： julia - 为什么 julia 需要很长时间才能导入一个包？

vba - 偏移/调整先前定义的范围
我正在尝试从第 4 到 9 页以及第 12 和 13 页上的单元格中清除所有内容(包括图像)。我有以下代码，但它正在清除第 3-9 和 12-15 页中的内容，我不知道为什么。有什么想法吗？ Sub
matplotlib:向极坐标图刻度标签添加填充/偏移
有没有办法增加极坐标图刻度标签(θ)的填充/偏移？ import matplotlib import numpy as np from matplotlib.pyplot import figure,
JavaScript 偏移/分页问题
我正在调用本地 API 并尝试以分页样式进行操作。我有 n 张图片，我想将它们分成 n/4 行(每行 4 张图片)。因此，我正在调用我的 API，images/count,offset。但不知何故，
javascript - 选择和关注网页元素不起作用(偏移)
我的问题解释起来有点棘手，但无论如何我都会尝试。我有两个水平选项卡，当您单击它们时，会打开一个文本框内容。当他们被点击时，我试图“关注”他们。我在网上找到了很多资料，但除了我在下面显示的这段代码外，没
CSS 调整大小 % - 偏移
所以我有一个 float 的 div，我需要它始终向右 200 像素，并填充窗口的其余部分。有没有某种跨浏览器兼容的方法，我可以在不借助 javascript 的情况下使宽度填满页面的其余部分？最佳
jquery - 偏移 scrollTop
我有以下片段 $('html,body').animate({scrollTop: $('#menu').offset().top}, 'slow'); 单击链接时，我希望浏览器从#menu div
ios - 偏移 UIRefreshControl
我目前正在为我的应用程序使用 JASidePanel，并且我有一个 UITableViewcontroller 和一个 UIRefreshControl 作为它的 ViewController 之一。
matplotlib - 我如何在Matplotlib中调整(偏移)颜色条标题
给出以下代码: imshow(np.arange(16*16).reshape(16,16)) cb = colorbar() cb.set_label("Foo") cb.set_ticks([0,
循环内的 VBA 偏移 - 需要永远运行
我是编程新手，我认为 VBA 是一个很好的起点，因为我在 Excel 中做了很多工作。我创建了一个宏，它从输入框中获取一个整数(我一直使用 2、3 和 4 来测试)，并创建该数字的一组 4 层层次结
PHP 偏移 unix 时间戳
我在 PHP 中有一个 unix 时间戳: $timestamp = 1346300336; 然后我有一个我想要应用的时区的偏移量。基本上，我想应用偏移量并返回一个新的 unix 时间戳。偏移量遵循这
jQuery/CSS 偏移+鼠标移动问题
演示:http://jsfiddle.net/H45uY/6/ 我在这里想做的是将的左上角设为跟随鼠标。代码在没有段落的情况下工作正常(请参阅上面的演示)，但是当您添加段落时，被向上推，鼠标位于盒
c# - 如何合并具有特定移位(偏移)的两个位图？
假设我们有两个由无符号长(64 位)数组表示的位图。我想使用特定的移位(偏移)合并这两个位图。例如，将位图 1(较大)合并到位图 2(较小)中，起始偏移量为 3。偏移量 3 表示位图 1 的第 3 位
swift - 表格 View 偏移
通过在 pageViewController 中实现 tableView，tableView 与其显示的内容不一致。对此最好的解决办法是什么？最佳答案如果您的 TableView 是 View C
iphone - 导航栏的 View 偏移
我设置了一个在 nib 中显示地点信息的地点配置文件。当我在标准屏幕流程中推送此 View 时，它工作正常。但是，当我从另一个选项卡推送此 View 时，UINavigationBar 似乎抵消了它，
mysql - 如何选择一系列行但将其从特定 ID 偏移
如果我想选择 5 条记录，我会这样做: SELECT * FROM mytable LIMIT 5 如果我想添加偏移量，我会这样做: SELECT * FROM mytable OFFSET 5 LI
android - 在全屏和非全屏之间切换导致 View 偏移
我有一个应用程序，其中某些 View 需要全屏，而其他 View 不需要全屏。在某些情况下，我希望背景显示在状态栏下方，所以我在 View 加载时使用它来使 Activity 全屏显示: window
ios - 如何使 UITouches 偏移？
在下图中，我进行绘制，结果位于 A 点，就在我手指接触的地方。如何使图像显示在实际触摸上方约 40pt。 (二) 我正在使用经典的 coreGraphic UITouch 代码，如下所示: - (v
ios - 偏移 UITextField - 表情符号布局
只要键盘处于事件状态，我就会尝试偏移 UITextField，效果很好，直到我尝试了表情符号布局。有没有办法检测键盘输入的类型，以便找出高度差？谢谢最佳答案不是使用 UIKeyboardDidSh
ios - UIToolbar 偏移 - 出现黑条
这是我的 Swift 代码 (AppDelegate.swift): var window: UIWindow? var rootViewController :UIViewController? f
html - 浏览器缩放期间的绝对 div 偏移
我有一个 div 作为绝对定位的 body 的直接子节点，其 css 属性定义如下: div[id^="Container"] { display: block; position: a

首页

博学

6Ren·AI

商城

pandas - 如何对具有偏移量的向量应用操作