- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想使用 bincount
对数组求和,但它只支持 double 。例如,这有效:
np.bincount([1, 1, 0],weights=np.array([1, 2, 4]))
Out: array([ 4., 3.])
但是我想使用 2 维数组作为:
np.bincount([1, 1, 0],weights=np.array([[1,1], [2,2], [4,4]]))
ValueError: object too deep for desired array
期望的输出是:
Out: array([[ 4., 4.],[3., 3.]])
评论后更好的解释:
我想将数组的每一行求和到对应的索引中。
有了循环,它会是:
Bin=np.zeros(2,2)
for i in [1,1,0]:
Bin[i]+=a[i]
a 是之前的 3x2 矩阵有没有一种有效的方法来获得这个结果?
最佳答案
根据 numpy 文档:
numpy.bincount(x, weights=None, minlength=None)
weights : array_like, optional; Weights, array of the same shape as x.
所以你不能以这种方式直接使用 bincount
除非你以某种方式改变 x
。
编辑: 所以我想出了一个稍微棘手的方法来执行此操作,但是当您使用大型数组时无法保证性能。基本上我将利用 scipy 稀疏矩阵如何处理相同索引处的重复条目(它们对它们求和):
from scipy.sparse import *
a = np.array([[1,1], [2,2], [4,4]])
ii = np.array([1, 1, 0])
ares = a.reshape((-1,),order='F')
# ares == array([1, 2, 4, 1, 2, 4])
col = np.tile(ii,(a.shape[1],))
# col == np.array([1, 1, 0, 1, 1, 0])
row = np.tile([0,1],(a.shape[0],1)).reshape((-1,),order='F')
# row == np.array([0,0,0,1,1,1])
g = coo_matrix((ares,(col,row)),shape=(2,2))
print g.todense()
现在您必须将其概括为您的精确数据。基本思想是您希望将每个数据点映射到结果数组的正确元素,然后让稀疏数组处理对重复条目的求和。
否则,如果您被迫使用循环来解决这个问题,我会考虑使用 Cython。
编辑 2:对于踢球,我用两种不同的方法计时:
import numpy as np
from scipy.sparse import *
def method1():
return np.array([np.bincount(ii, r) for r in a.T]).T
def method2():
ares = a.reshape((-1,),order='F')
col = np.tile(ii,(a.shape[1],))
row = np.tile(np.arange(a.shape[1]),(a.shape[0],1)).reshape((-1,),order='F')
return coo_matrix((ares,(col,row)),shape=(np.unique(ii).size,a.shape[1])).todense()
if __name__ == '__main__':
from timeit import Timer
a = np.random.randint(0,1000,(1000000,3))
ii = np.random.randint(0,10,(a.shape[0],))
N = 100
t1 = Timer("method1()", "from __main__ import method1")
t2 = Timer("method2()", "from __main__ import method2")
print 't2/t1: %f' % (t2.timeit(N)/t1.timeit(N))
在我的机器上,method2
比 method1
慢 3-5 倍,具体取决于输入的形状,因此循环不一定是一个坏选择。
关于python - 将 numpy.bincount 与数组权重一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5205345/
我有一个包含字符串值的 NumPy 数组。 例如:["bus", "bar", "bar", "café".....] 计算数组中每个元素出现次数的最佳方法是什么。我目前的解决方案是: # my_li
我正在尝试创建一个 Numpy 优化版本的逆 numpy.bincounts .我意识到 bincounts 不是一对一的,所以我们来谈谈最简单的版本。 import numpy as np def
是否可以使用 np.bincount 但得到最大值而不是权重总和?这里,索引 3 处的 bbb 有两个值,11.1 和 55.5。我想要 55.5,而不是 66.6。我怀疑我选择使用其他功能,但不太确
在 TensorFlow 中,我可以使用 tf.bincount 获取数组中每个元素的计数: x = tf.placeholder(tf.int32, [None]) freq = tf.bincou
我有一个 2d numpy 数组。A 我想将 np.bincount() 应用于矩阵 A 的每一列以生成另一个二维数组 B,它由原始矩阵 A 的每一列的 bincounts 组成。 我的问题是 np.
我看到了我无法理解的 numpy bincount 行为。我想按行方式将二维数组中的值装箱,并查看下面的行为。为什么它可以与 dbArray 一起工作但与 simarray 一起失败? >>> dbA
它的目的是什么?我尝试阅读官方网站,但无法理解。 最佳答案 bincount 返回 计数 每个 bin 中的值从 0 到数组中的最大值,即 np.bincount(my_list) == [count
给定一个整数计数数组c,我如何将其转换为一个整数数组inds,这样np.all(np.bincount(inds) ) == c) 是真的吗? 例如: >>> c = np.array([1,3,2,
给定一个整数数组 c,我如何将它转换成一个整数数组 inds 使得 np.all(np.bincount(inds ) == c) 是真的吗? 例如: >>> c = np.array([1,3,2,
考虑 numpy 数组 a a = np.array([1, 0, 2, 1, 1]) 如果我进行 bin 计数,我会得到整数 np.bincount(a) array([1, 3, 1]) 但是如果
我想使用 bincount 对数组求和,但它只支持 double 。例如,这有效: np.bincount([1, 1, 0],weights=np.array([1, 2, 4])) Out: ar
在我看来,numpy 函数 bincount 非常有用且易于使用,所以我很自然地使用 TensorFlow 中的模拟函数。最近我了解到很遗憾 tf.bincount 没有 GPU 支持(你可以阅读 h
我有关于自行车租赁需求和天气的每小时数据。我想根据好天气和坏天气分别绘制每小时的平均需求量。 当我绘制给定小时的平均需求(不考虑天气)时,我所做的是计算给定小时的租赁总需求,然后除以总小时数: hou
我一直在寻找解决方案here和 here但不知道如何将其应用到我的结构中。 我有 3 个数组:一个由零组成的 (M, N) 和一个由索引组成的 (P,)(有些重复)和一个 (P, N) 值。 我可以用
有没有办法将 bincount 与“axis = 1”一起应用?期望的结果将与列表理解相同: import numpy as np A = np.array([[1,0],[0,0]]) np.arr
我正在尝试获取浮点类型的 numpy 数组的 bincount: w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) print np.bincount(w) 如何将 bi
我想使用 xarray 的 apply_ufunc API 并行化 numpy.bincount 函数,以下代码是我尝试过的: import numpy as np import xarray as
我有一个带有整数值的 NumPy 数组。矩阵的值范围从 0 到矩阵中的最大元素(换句话说,矩阵中呈现从 0 到最大数据元素的所有数字)。我需要构建有效的(有效意味着快速完全矢量化解决方案)来搜索每行中
我有一个一维数组,我想使用 numpy bincount 创建直方图。它工作正常,但我希望它忽略 NaN 值。 histogram = np.bincount(distancesArray, weig
我有一个包含整数值的 NumPy 数组。矩阵的值范围从 0 到矩阵中的最大元素(换句话说,从 0 到最大数据元素的所有数字都出现在其中)。我需要构建有效(有效意味着快速全矢量化解决方案)来搜索每行中的
我是一名优秀的程序员,十分优秀!