python - 将 numpy.bincount 与数组权重一起使用-6ren

python - 将 numpy.bincount 与数组权重一起使用

转载作者：太空狗更新时间：2023-10-30 01:17:21

24

4

我想使用 bincount 对数组求和，但它只支持 double 。例如，这有效:

np.bincount([1, 1, 0],weights=np.array([1, 2, 4]))
Out: array([ 4.,  3.])

但是我想使用 2 维数组作为:

np.bincount([1, 1, 0],weights=np.array([[1,1], [2,2], [4,4]]))
ValueError: object too deep for desired array

期望的输出是:

Out: array([[ 4.,  4.],[3., 3.]])

评论后更好的解释:

我想将数组的每一行求和到对应的索引中。

有了循环，它会是:

Bin=np.zeros(2,2)
for i in [1,1,0]:
    Bin[i]+=a[i]

a 是之前的 3x2 矩阵有没有一种有效的方法来获得这个结果？

最佳答案

根据 numpy 文档:

numpy.bincount(x, weights=None, minlength=None)

weights : array_like, optional; Weights, array of the same shape as x.

所以你不能以这种方式直接使用 bincount 除非你以某种方式改变 x 。

编辑: 所以我想出了一个稍微棘手的方法来执行此操作，但是当您使用大型数组时无法保证性能。基本上我将利用 scipy 稀疏矩阵如何处理相同索引处的重复条目(它们对它们求和):

 from scipy.sparse import *
 a = np.array([[1,1], [2,2], [4,4]])
 ii = np.array([1, 1, 0])

 ares = a.reshape((-1,),order='F')
 # ares == array([1, 2, 4, 1, 2, 4])

 col = np.tile(ii,(a.shape[1],))
 # col == np.array([1, 1, 0, 1, 1, 0])

 row = np.tile([0,1],(a.shape[0],1)).reshape((-1,),order='F') 
 # row == np.array([0,0,0,1,1,1]) 

 g = coo_matrix((ares,(col,row)),shape=(2,2))
 print g.todense()

现在您必须将其概括为您的精确数据。基本思想是您希望将每个数据点映射到结果数组的正确元素，然后让稀疏数组处理对重复条目的求和。

否则，如果您被迫使用循环来解决这个问题，我会考虑使用 Cython。

编辑 2:对于踢球，我用两种不同的方法计时:

import numpy as np
from scipy.sparse import *

def method1():
    return np.array([np.bincount(ii, r) for r in a.T]).T

def method2():
    ares = a.reshape((-1,),order='F')
    col = np.tile(ii,(a.shape[1],))
    row = np.tile(np.arange(a.shape[1]),(a.shape[0],1)).reshape((-1,),order='F') 

    return coo_matrix((ares,(col,row)),shape=(np.unique(ii).size,a.shape[1])).todense()

if __name__ == '__main__':
    from timeit import Timer

    a = np.random.randint(0,1000,(1000000,3))
    ii = np.random.randint(0,10,(a.shape[0],))

    N = 100
    t1 = Timer("method1()", "from __main__ import method1")
    t2 = Timer("method2()", "from __main__ import method2")
    print 't2/t1: %f' % (t2.timeit(N)/t1.timeit(N))

在我的机器上，method2 比 method1 慢 3-5 倍，具体取决于输入的形状，因此循环不一定是一个坏选择。

关于python - 将 numpy.bincount 与数组权重一起使用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5205345/

24

4

0

文章推荐： python - fork 绿叶

文章推荐： c# - String.Format() 时间跨度与日期时间

文章推荐： c# - 使用属性来约束类型 - .NET

文章推荐： python - 如何从 Django 发推文？

python - 如何对字符串数组执行 bincount？
我有一个包含字符串值的 NumPy 数组。例如:["bus", "bar", "bar", "café".....] 计算数组中每个元素出现次数的最佳方法是什么。我目前的解决方案是: # my_li
python - numpy.bincounts 的反转？
我正在尝试创建一个 Numpy 优化版本的逆 numpy.bincounts .我意识到 bincounts 不是一对一的，所以我们来谈谈最简单的版本。 import numpy as np def
python - numpy bincount - 选择最大权重而不是对所有权重求和
是否可以使用 np.bincount 但得到最大值而不是权重总和？这里，索引 3 处的 bbb 有两个值，11.1 和 55.5。我想要 55.5，而不是 66.6。我怀疑我选择使用其他功能，但不太确
python - TensorFlow:带轴选项的 bincount
在 TensorFlow 中，我可以使用 tf.bincount 获取数组中每个元素的计数: x = tf.placeholder(tf.int32, [None]) freq = tf.bincou
python - 矢量化 numpy bincount
我有一个 2d numpy 数组。A 我想将 np.bincount() 应用于矩阵 A 的每一列以生成另一个二维数组 B，它由原始矩阵 A 的每一列的 bincounts 组成。我的问题是 np.
python - numpy bincount 可以处理二维数组吗？
我看到了我无法理解的 numpy bincount 行为。我想按行方式将二维数组中的值装箱，并查看下面的行为。为什么它可以与 dbArray 一起工作但与 simarray 一起失败？ >>> dbA
python - numpy 的 bincount() 方法有什么用？
它的目的是什么？我尝试阅读官方网站，但无法理解。最佳答案 bincount 返回计数每个 bin 中的值从 0 到数组中的最大值，即 np.bincount(my_list) == [count
python - numpy 的 bincount 函数的反函数
给定一个整数计数数组c，我如何将其转换为一个整数数组inds，这样np.all(np.bincount(inds) ) == c) 是真的吗？例如: >>> c = np.array([1,3,2,
python - numpy 的 bincount 函数的反函数
给定一个整数数组 c，我如何将它转换成一个整数数组 inds 使得 np.all(np.bincount(inds ) == c) 是真的吗？例如: >>> c = np.array([1,3,2,
python - 当权重参数为整数时如何从 numpy.bincount 获取整数数组
考虑 numpy 数组 a a = np.array([1, 0, 2, 1, 1]) 如果我进行 bin 计数，我会得到整数 np.bincount(a) array([1, 3, 1]) 但是如果
python - 将 numpy.bincount 与数组权重一起使用
我想使用 bincount 对数组求和，但它只支持 double 。例如，这有效: np.bincount([1, 1, 0],weights=np.array([1, 2, 4])) Out: ar
python - Tensorflow:有没有办法在没有 tf.bincount 的情况下构建加权直方图？
在我看来，numpy 函数 bincount 非常有用且易于使用，所以我很自然地使用 TensorFlow 中的模拟函数。最近我了解到很遗憾 tf.bincount 没有 GPU 支持(你可以阅读 h
python - 有没有办法在 python 中将 bincount 与子句一起使用？
我有关于自行车租赁需求和天气的每小时数据。我想根据好天气和坏天气分别绘制每小时的平均需求量。当我绘制给定小时的平均需求(不考虑天气)时，我所做的是计算给定小时的租赁总需求，然后除以总小时数: hou
python - NumPy - 使用权重对 2D 数组列进行向量化 bincount
我一直在寻找解决方案here和 here但不知道如何将其应用到我的结构中。我有 3 个数组:一个由零组成的 (M, N) 和一个由索引组成的 (P,)(有些重复)和一个 (P, N) 值。我可以用
python - 将 bincount 应用于二维 numpy 数组的每一行
有没有办法将 bincount 与“axis = 1”一起应用？期望的结果将与列表理解相同: import numpy as np A = np.array([[1,0],[0,0]]) np.arr
python - 带有 float 的 Numpy bincount()
我正在尝试获取浮点类型的 numpy 数组的 bincount: w = np.array([0.1, 0.2, 0.1, 0.3, 0.5]) print np.bincount(w) 如何将 bi
python - 我可以使用 `numpy.bincount` 并行化 `xarray.apply_ufunc` 吗？
我想使用 xarray 的 apply_ufunc API 并行化 numpy.bincount 函数，以下代码是我尝试过的: import numpy as np import xarray as
python - 每行 Bin 元素 - NumPy 的矢量化 2D Bincount
我有一个带有整数值的 NumPy 数组。矩阵的值范围从 0 到矩阵中的最大元素(换句话说，矩阵中呈现从 0 到最大数据元素的所有数字)。我需要构建有效的(有效意味着快速完全矢量化解决方案)来搜索每行中
python - 在 python 中忽略 numpy bincount 中的 NaN
我有一个一维数组，我想使用 numpy bincount 创建直方图。它工作正常，但我希望它忽略 NaN 值。 histogram = np.bincount(distancesArray, weig
python - 每行的 Bin 元素 - NumPy 的矢量化 2D Bincount
我有一个包含整数值的 NumPy 数组。矩阵的值范围从 0 到矩阵中的最大元素(换句话说，从 0 到最大数据元素的所有数字都出现在其中)。我需要构建有效(有效意味着快速全矢量化解决方案)来搜索每行中的

首页

博学

6Ren·AI

商城

python - 将 numpy.bincount 与数组权重一起使用