- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
请原谅我的标题含糊不清。老实说,我不知道哪个标题适合这个问题。如果您有更好的标题,让我们更改它,使其适合当前的问题。
假设 result
是一个二维数组,values
是一个一维数组。 values
保存与 result
中每个元素关联的一些值。 values
中的元素到 result
的映射存储在 x_mapping
和 y_mapping
中。 结果
中的位置可以与不同的值相关联。现在,我必须找到按关联分组的值的总和。
一个更好说明的示例。
结果
数组:
[[0, 0],
[0, 0],
[0, 0],
[0, 0]]
值
数组:
[ 1., 2., 3., 4., 5., 6., 7., 8.]
注意:这里结果
和值
具有相同数量的元素。但事实可能并非如此。大小之间根本没有关系。
x_mapping
和 y_mapping
具有从 1D 值
到 2D 结果
的映射。 x_mapping
、y_mapping
和 values
的大小将相同。
x_mapping
- [0, 1, 0, 0, 0, 0, 0, 0]
y_mapping
- [0, 3, 2, 2, 0, 3, 2, 1]
这里,第一个值(values[0]
)的 x 为 0,y 为 0(x_mapping[0]
和 y_mappping[0]
),因此与 result[0, 0]
相关联。如果我们计算关联数量,则 result[0,0]
处的元素值将为 2,因为第一个值和第五个值与 result[0, 0]
关联>。如果我们求和,结果[0, 0] = value[0] + value[4]
即 6。
# Initialisation. No connection with the solution.
result = np.zeros([4,2], dtype=np.int16)
values = np.linspace(start=1, stop=8, num=8)
y_mapping = np.random.randint(low=0, high=values.shape[0], size=values.shape[0])
x_mapping = np.random.randint(low=0, high=values.shape[1], size=values.shape[0])
# Summing the values associated with x,y (current solution.)
for i in range(values.size):
x = x_mapping[i]
y = y_mapping[i]
result[-y, x] = result[-y, x] + values[i]
结果
,
[[6, 0],
[ 6, 2],
[14, 0],
[ 8, 0]]
test_result = np.zeros_like(result)
test_result[-y_mapping, x_mapping] = test_result[-y_mapping, x_mapping] + values # solution
令我惊讶的是,test_result
中的元素被覆盖。 test_result
处的值,
[[5, 0],
[6, 2],
[7, 0],
[8, 0]]
正如 @Divakar 在他的回答中的评论中指出的那样 -当 test_result[-y_mapping, x_mapping] =
中重复索引时,NumPy 不会分配累积/求和值。它从一个实例中随机分配。
@Divakar 的答案中的方法 #2 给了我很好的结果。对于 23315 个关联,for
循环花费了 50 毫秒,而方法 #1 花费了 1.85 毫秒。克服所有这些,方法 #2 花费了 668 µs。
我在 i7 处理器上使用 Numpy 版本 1.14.3 和 Python 3.5.2。
最佳答案
方法#1
对于那些重复的索引,最直观的方法是使用 np.add.at
-
np.add.at(result, [-y_mapping, x_mapping], values)
方法#2
由于 x,y 索引可能存在重复性质,我们需要执行分箱求和。因此,另一种方法可能是使用 NumPy 的分箱求和函数:np.bincount
并具有如下所示的实现 -
# Get linear index equivalents off the x and y indices into result array
m,n = result.shape
out_dtype = result.dtype
lidx = ((-y_mapping)%m)*n + x_mapping
# Get binned summations off values based on linear index as bins
binned_sums = np.bincount(lidx, values, minlength=m*n)
# Finally add into result array
result += binned_sums.astype(result.dtype).reshape(m,n)
如果您总是从零数组开始结果
,那么最后一步可以通过 - 来提高性能
result = binned_sums.astype(out_dtype).reshape(m,n)
关于python - numpy : Grouping/binning values based on associations,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51691980/
bin、bin/、bin/*和bin/**有什么区别我的 .gitignore 文件?我一直在使用 bin/,但正在查看 other .gitignore files (在 eclipse file
给定 n 个无限容量的箱子,我想将 m 件元素装入其中(每个元素都有特定的重量),同时最小化最重箱子的重量。 这不是传统的垃圾箱包装/背包问题,其中垃圾箱的容量有限,而您试图尽量减少使用的垃圾箱数量;
Closed. This question is off-topic。它当前不接受答案。 想改善这个问题吗? Update the question,所以它是用于堆栈溢出的on-topic。 7年前关
我一直在寻找一个问题的解决方案,这个问题显然比我最初想象的更不寻常。 Optaplanner 看起来很有前途,但由于我对 Java 相对缺乏经验,所以我想在深入研究之前调查一下这是否完全不可能。 我正
我有一个琐碎的问题。我有一个非常大的 df 有很多列。我正在尝试找到最有效的方法来对具有不同 bin 大小的所有列进行 bin 并创建一个新的 df。这是一个仅对单个列进行分箱的示例: import
我想以这样的方式对数字列 (var) 进行分类,使每个分类中的行数大致相同。我的附加要求是该列中的一个(唯一)值不能分配给多个 bin。例如,如果 var 列中的值 1 分配给 bin 1,则不允许将
我在 centos (rhel 7)_ 上使用 make 命令和 gcc 7.1 通过代码进行编译,但遇到了以下错误: /bin/sh:/bin: 是一个目录 which sh 返回/usr/bin/
/usr/bin/ld: cannot find -ldlib /usr/bin/ld: cannot find -lcblas /usr/bin/ld: cannot find -llapack 在
我进行了一项眼动追踪实验,试图检测两个区域(感兴趣区域,名为“代理”和“患者”的 AOI)的注视分布。我将整个时间划分为时间段,例如得到以下列表: Stimulus Participant A
我正在尝试替换 whoami带有 ~/.local/bin/ 中的脚本的命令.有没有办法让我的 whoami 获得优先权,这样当我运行 whoami 时,我的脚本就会运行? 最佳答案 这就是我的 ~/
我的项目结构是这样的: . ├── Cargo.lock ├── Cargo.toml └── src ├── bin │ └── other.rs ├── main.rs
我正在开发一个小型图书馆应用程序,它以这种格式存储技术手册: 目前,我正在尝试将库的内容保存并根据用户的需要加载到 bin 文件中。 但是,当我尝试加载库文件时,唯一的变化是“-1”被打印到控制台。此
我试图忽略 Web 项目的 bin 文件夹,但包含该 bin 文件夹中的 .refresh 文件。 这是我的 .gitignore 中的内容: [Bb]in/ #Allow .refresh file
ipv6_hdr__f_next_header_cp: coverpoint this.ipv6_hdr.ipv6_f_next_header iff (this.has_ipv6_header){
今天有人给我发了一个以 #: 开头的脚本,谷歌搜索后我没有找到任何答案。 即使脚本有效,我想知道那是什么意思。 最佳答案 哇!这让我想起了很多记忆! 回到 1980 年代和 90 年代初期,有两种基本
我使用这个 ksh 函数将“1-Jan-2011”格式转换为“1.1.2011”。 #!/bin/ksh ##---- function to convert 3 char month into nu
我在 c# winform 项目中使用 sql-server compact 数据库。 如果我查看构成解决方案的文件,我可以在以下两个文件夹中看到 exe 和 sdf 文件的副本: /bin/Debu
这个问题与我上一个问题不同。我正在通过以下代码使用 facetgrid 打印直方图。 import numpy as np import pandas as pd import seaborn as
我有一个整数需要根据概率分布分成 bin。例如,如果我有 N=100 对象进入 [0.02, 0.08, 0.16, 0.29, 0.45] 那么你可能会得到 [1, 10, 20 , 25, 44]
我在寻找使用 Jenkins 运行 Appium 的脚本时阅读了以下脚本 #!/bin/bash --login killall -9 "iPhone Simulator" &> /dev/null
我是一名优秀的程序员,十分优秀!