- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个返回列子集的函数,我想高效地将它应用到每一列。所以结果不再是矩阵,而是不同长度的列列表。由于大小不匹配,我未能使用 numpy apply_along_axis
来执行此操作。除了自己遍历列之外,有没有一种方法可以有效地做到这一点?
col_pred = lambda x: [v for v in x if v > 0.5]
filteredData = np.apply_along_axis(col_pred, 0, data)
# ValueError: could not broadcast input array from shape (3) into shape (4)
例如输入
data = [[0, 1, 1, 0], [1, 1, 1, 1]]
// my real data is more like a matrix with a lot of rows in [0-1]
// that can be simulated with
// data = [[random.uniform(0, 1) for i in range(10)] for j in range(100000)]
我想得到
[[1, 1], [1, 1, 1, 1]]
最佳答案
查看您的代码,您似乎正在尝试输出每列大于阈值 0.5
的所有元素。这是一种实现这些的方法,并且还可以概括为处理沿行和列的那些 -
def threshold_along_an_axis(a, thresh = 0.5, axis=0):
if axis==0:
A = a.T
else:
A = a
mask = A>thresh
s = mask.sum(1)
s0 = np.r_[0,s.cumsum()]
arr = A[mask].tolist() # Skip .tolist() if list of arrays is needed as o/p
return [arr[s0[i]:s0[i+1]] for i in range(len(s0)-1)]
这里的目的是在循环理解中做最少的工作。
sample 运行-
In [1]: a = np.random.rand(4,5)
In [2]: a
Out[2]:
array([[ 0.45973245, 0.3671334 , 0.12000436, 0.04205402, 0.74729737],
[ 0.55217308, 0.4018889 , 0.55695863, 0.55824384, 0.33435153],
[ 0.32450124, 0.07713855, 0.09126221, 0.13150986, 0.27961361],
[ 0.0876053 , 0.42685005, 0.53034652, 0.15084453, 0.51518185]])
In [3]: threshold_along_an_axis(a, thresh=0.5, axis=0) # per column
Out[3]:
[[0.5521730819881912],
[],
[0.5569586261866918, 0.5303465159370833],
[0.5582438446718111],
[0.7472973699509776, 0.5151818458812673]]
In [4]: threshold_along_an_axis(a, thresh=0.5, axis=1) # per row
Out[4]:
[[0.7472973699509776],
[0.5521730819881912, 0.5569586261866918, 0.5582438446718111],
[],
[0.5303465159370833, 0.5151818458812673]]
关于python - 具有不同结果大小的 numpy apply_along_axis,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43618825/
如果我有一个函数 f(x),它接受一个一维数组作为参数并生成一个一维数组作为输出,我可以使用 numpy.apply_along_axis将函数应用于二维数组 X 的每一行,其行是 f 的有效参数。
我有一个返回列子集的函数,我想高效地将它应用到每一列。所以结果不再是矩阵,而是不同长度的列列表。由于大小不匹配,我未能使用 numpy apply_along_axis 来执行此操作。除了自己遍历列之
当 numpy.apply_along_axis 将一维数组作为输入时会发生什么?当我在一维数组上使用它时,我看到了一些奇怪的东西: y=array([1,2,3,4]) 第一次尝试: apply_a
我在使用 NumPy 时遇到以下问题: 代码: import numpy as np get_label = lambda x: 'SMALL' if x.sum() <= 10 else 'BIG'
我有一个 3D ndarry 对象,它包含光谱数据(即空间 xy 维度和能量维度)。我想提取并绘制线图中每个像素的光谱。目前,我正在沿我感兴趣的轴使用 np.ndenumerate 来执行此操作,但速
如何通过 numpy.apply_along_axis() 将函数应用到 NumPy 数组的元素并进行并行化,以便利用多核?这似乎是一件自然而然的事情,在对所应用函数的所有调用都是独立的常见情况下。
我正在尝试将 numpys apply_along_axis 与需要多个参数的函数一起使用。 test_array = np.arange(10) test_array2 = np.arange(10
我遇到了 numpy.apply_along_axis在一些代码中起作用。而且我不明白有关它的文档。 这是文档的示例: >>> def new_func(a): ... """Divide e
我正在将J语言代码翻译成Python,但是python的apply函数的方式对我来说似乎有点不清楚...... 我目前有一个 (3, 3, 2) 矩阵 A 和一个 (3, 3) 矩阵 B。 我想将 A
我有一些大型数据集,我想将其拟合到单指数时间衰减。 数据由在不同时间获取的多个 4D 数据集组成,因此拟合应沿着第五维运行(通过数据集)。 我当前使用的代码如下: import numpy as np
我想计算一个 mm*n 维数组的 mm 个子数组的行列式,并希望以快速/更优雅的方式执行此操作。蛮力方法有效: import numpy as n array=n.array([[[0.,1.,2.,
np.apply_along_axis() 函数似乎非常慢(15 分钟后没有输出)。有没有一种快速的方法可以在长数组上执行此功能而无需并行化操作?我专门讨论的是具有数百万个元素的数组。 这是我正在尝试
我正在尝试实现一个函数,该函数获取 numpy 二维数组中的每一行并返回特定计算的标量结果。我当前的代码如下所示: img = np.array([ [0, 5, 70, 0, 0,
我有一个通过以下算法拟合多个 x,y 数组的函数: def f(func, data, init): import scipy.optimize as opt from numpy imp
我有一个 ndarray 子类,正确实现了 __array_wrap__,np.apply_along_axis 没有返回我的子类的实例,而是 ndarrays。下面的代码复制了我的问题: impor
我想将一个函数 f 映射到一个字符串数组上。我构建了 f 的矢量化版本并将其应用于我的数组。但是数组的第一个元素被传递了两次: import numpy as np def f(string):
我不知道如何返回 dtype U3 的字符串 我想要: 将_along_axis应用于my_array 对于每一行,返回一个字符串 def my_function(x): return x[2
我对 numpy 的 numpy.apply_along_axis() 函数何时会优于简单的 Python 循环感到困惑。例如,考虑一个有很多行的矩阵,您希望计算每一行的总和: x = np.ones
我是一名优秀的程序员,十分优秀!