python - 具有不同结果大小的 numpy apply_along

python - 具有不同结果大小的 numpy apply_along_axis

转载作者：行者123 更新时间：2023-11-28 22:28:20

24

4

我有一个返回列子集的函数，我想高效地将它应用到每一列。所以结果不再是矩阵，而是不同长度的列列表。由于大小不匹配，我未能使用 numpy apply_along_axis 来执行此操作。除了自己遍历列之外，有没有一种方法可以有效地做到这一点？

col_pred = lambda x: [v for v in x if v > 0.5]
filteredData = np.apply_along_axis(col_pred, 0, data)
# ValueError: could not broadcast input array from shape (3) into shape (4)

例如输入

data = [[0, 1, 1, 0], [1, 1, 1, 1]]
// my real data is more like a matrix with a lot of rows in [0-1]
// that can be simulated with 
// data = [[random.uniform(0, 1) for i in range(10)] for j in range(100000)]

我想得到

[[1, 1], [1, 1, 1, 1]]

最佳答案

查看您的代码，您似乎正在尝试输出每列大于阈值 0.5 的所有元素。这是一种实现这些的方法，并且还可以概括为处理沿行和列的那些 -

def threshold_along_an_axis(a, thresh = 0.5, axis=0):
    if axis==0:
        A = a.T
    else:
        A = a
    mask = A>thresh
    s = mask.sum(1)
    s0 = np.r_[0,s.cumsum()]
    arr = A[mask].tolist() # Skip .tolist() if list of arrays is needed as o/p
    return [arr[s0[i]:s0[i+1]] for i in range(len(s0)-1)]

这里的目的是在循环理解中做最少的工作。

sample 运行-

In [1]: a = np.random.rand(4,5)

In [2]: a
Out[2]: 
array([[ 0.45973245,  0.3671334 ,  0.12000436,  0.04205402,  0.74729737],
       [ 0.55217308,  0.4018889 ,  0.55695863,  0.55824384,  0.33435153],
       [ 0.32450124,  0.07713855,  0.09126221,  0.13150986,  0.27961361],
       [ 0.0876053 ,  0.42685005,  0.53034652,  0.15084453,  0.51518185]])

In [3]: threshold_along_an_axis(a, thresh=0.5, axis=0) # per column
Out[3]: 
[[0.5521730819881912],
 [],
 [0.5569586261866918, 0.5303465159370833],
 [0.5582438446718111],
 [0.7472973699509776, 0.5151818458812673]]

In [4]: threshold_along_an_axis(a, thresh=0.5, axis=1) # per row
Out[4]: 
[[0.7472973699509776],
 [0.5521730819881912, 0.5569586261866918, 0.5582438446718111],
 [],
 [0.5303465159370833, 0.5151818458812673]]

关于python - 具有不同结果大小的 numpy apply_along_axis，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43618825/

24

4

0

文章推荐： ios - 使用 UICollectionView 页脚中的对象

文章推荐： ios - 分发中缺少图像

文章推荐： spring - 如何在应用程序中配置 2 个数据库/模式

多个数组的Python apply_along_axis
如果我有一个函数 f(x)，它接受一个一维数组作为参数并生成一个一维数组作为输出，我可以使用 numpy.apply_along_axis将函数应用于二维数组 X 的每一行，其行是 f 的有效参数。
python - 具有不同结果大小的 numpy apply_along_axis
我有一个返回列子集的函数，我想高效地将它应用到每一列。所以结果不再是矩阵，而是不同长度的列列表。由于大小不匹配，我未能使用 numpy apply_along_axis 来执行此操作。除了自己遍历列之
python - 一维数组上的 numpy apply_along_axis
当 numpy.apply_along_axis 将一维数组作为输入时会发生什么？当我在一维数组上使用它时，我看到了一些奇怪的东西: y=array([1,2,3,4]) 第一次尝试: apply_a
python - Numpy apply_along_axis 推断出错误的数据类型
我在使用 NumPy 时遇到以下问题: 代码: import numpy as np get_label = lambda x: 'SMALL' if x.sum() <= 10 else 'BIG'
python - 使用 apply_along_axis 绘制
我有一个 3D ndarry 对象，它包含光谱数据(即空间 xy 维度和能量维度)。我想提取并绘制线图中每个像素的光谱。目前，我正在沿我感兴趣的轴使用 np.ndenumerate 来执行此操作，但速
python - numpy.apply_along_axis() 的简单并行化？
如何通过 numpy.apply_along_axis() 将函数应用到 NumPy 数组的元素并进行并行化，以便利用多核？这似乎是一件自然而然的事情，在对所应用函数的所有调用都是独立的常见情况下。
python - Numpy apply_along_axis 函数
我正在尝试将 numpys apply_along_axis 与需要多个参数的函数一起使用。 test_array = np.arange(10) test_array2 = np.arange(10
python - numpy.apply_along_axis 究竟执行什么？
我遇到了 numpy.apply_along_axis在一些代码中起作用。而且我不明白有关它的文档。这是文档的示例: >>> def new_func(a): ... """Divide e
python - 多维数据上的 numpy apply_along_axis 计算
我正在将J语言代码翻译成Python，但是python的apply函数的方式对我来说似乎有点不清楚...... 我目前有一个 (3, 3, 2) 矩阵 A 和一个 (3, 3) 矩阵 B。我想将 A
python - Curve_fit 到 apply_along_axis。如何加快速度？
我有一些大型数据集，我想将其拟合到单指数时间衰减。数据由在不同时间获取的多个 4D 数据集组成，因此拟合应沿着第五维运行(通过数据集)。我当前使用的代码如下: import numpy as np
python - numpy - 向量化函数 : apply_over_axes/apply_along_axis
我想计算一个 mm*n 维数组的 mm 个子数组的行列式，并希望以快速/更优雅的方式执行此操作。蛮力方法有效: import numpy as n array=n.array([[[0.,1.,2.,
python - numpy np.apply_along_axis 函数加速？
np.apply_along_axis() 函数似乎非常慢(15 分钟后没有输出)。有没有一种快速的方法可以在长数组上执行此功能而无需并行化操作？我专门讨论的是具有数百万个元素的数组。这是我正在尝试
python-3.x - numpy apply_along_axis 矢量化
我正在尝试实现一个函数，该函数获取 numpy 二维数组中的每一行并返回特定计算的标量结果。我当前的代码如下所示: img = np.array([ [0, 5, 70, 0, 0,
python - 跳过 numpy.apply_along_axis 内的 RuntimeError
我有一个通过以下算法拟合多个 x,y 数组的函数: def f(func, data, init): import scipy.optimize as opt from numpy imp
python - Numpy apply_along_axis 不返回 ndarray 子类
我有一个 ndarray 子类，正确实现了 __array_wrap__，np.apply_along_axis 没有返回我的子类的实例，而是 ndarrays。下面的代码复制了我的问题: impor
python - np.vectorize 和 np.apply_along_axis 两次将相同的参数传递给映射函数
我想将一个函数 f 映射到一个字符串数组上。我构建了 f 的矢量化版本并将其应用于我的数组。但是数组的第一个元素被传递了两次: import numpy as np def f(string):
python - numpy.apply_along_axis 截断字符串，因为它推断出错误的数据类型 '
我不知道如何返回 dtype U3 的字符串我想要: 将_along_axis应用于my_array 对于每一行，返回一个字符串 def my_function(x): return x[2

python - 为什么 numpy.apply_along_axis 似乎比 Python 循环慢？
我对 numpy 的 numpy.apply_along_axis() 函数何时会优于简单的 Python 循环感到困惑。例如，考虑一个有很多行的矩阵，您希望计算每一行的总和: x = np.ones

首页

博学

6Ren·AI

商城

python - 具有不同结果大小的 numpy apply_along_axis