gpt4 book ai didi

python - 对二维 numpy 数组进行子集化

转载 作者:IT老高 更新时间:2023-10-28 20:26:41 24 4
gpt4 key购买 nike

我在这里查看了文档和其他问题,但似乎我还没有掌握 numpy 数组中子集的窍门。

我有一个 numpy 数组,为了论证起见,将其定义如下:

import numpy as np
a = np.arange(100)
a.shape = (10,10)
# array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
# [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
# [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
# [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
# [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
# [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
# [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
# [70, 71, 72, 73, 74, 75, 76, 77, 78, 79],
# [80, 81, 82, 83, 84, 85, 86, 87, 88, 89],
# [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])

现在我想选择由向量 n1n2 指定的 a 的行和列。举个例子:

n1 = range(5)
n2 = range(5)

但是当我使用时:

b = a[n1,n2]
# array([ 0, 11, 22, 33, 44])

然后只选择前五个对角线元素,而不是整个 5x5 block 。我找到的解决方案是这样做:

b = a[n1,:]
b = b[:,n2]
# array([[ 0, 1, 2, 3, 4],
# [10, 11, 12, 13, 14],
# [20, 21, 22, 23, 24],
# [30, 31, 32, 33, 34],
# [40, 41, 42, 43, 44]])

但我确信应该有一种方法可以通过一个命令来完成这个简单的任务。

最佳答案

你已经得到了一些很好的例子来说明如何做你想做的事。但是,了解正在发生的事情以及为什么事情会以它们的方式运行也很有用。有一些简单的规则会在未来对您有所帮助。

“花式”索引(即使用列表/序列)和“普通”索引(使用切片)之间存在很大差异。根本原因与数组是否可以“定期跨步”有关,因此是否需要制作副本。因此,如果我们希望能够在不复制的情况下创建“ View ”,则必须区别对待任意序列。

在你的情况下:

import numpy as np

a = np.arange(100).reshape(10,10)
n1, n2 = np.arange(5), np.arange(5)

# Not what you want
b = a[n1, n2] # array([ 0, 11, 22, 33, 44])

# What you want, but only for simple sequences
# Note that no copy of *a* is made!! This is a view.
b = a[:5, :5]

# What you want, but probably confusing at first. (Also, makes a copy.)
# np.meshgrid and np.ix_ are basically equivalent to this.
b = a[n1[:,None], n2[None,:]]

花式索引一维序列基本上等同于将它们压缩在一起并使用结果进行索引。

print "Fancy Indexing:"
print a[n1, n2]

print "Manual indexing:"
for i, j in zip(n1, n2):
print a[i, j]

但是,如果您要索引的序列与您要索引的数组的维度(在本例中为二维)相匹配,则索引的处理方式会有所不同。 numpy 不是“将两者压缩在一起”,而是像掩码一样使用索引。

换言之,a[[[1, 2, 3]], [[1],[2],[3]]] 的处理方式与 a[ [1, 2, 3], [1, 2, 3]],因为您传入的序列/数组是二维的。

In [4]: a[[[1, 2, 3]], [[1],[2],[3]]]
Out[4]:
array([[11, 21, 31],
[12, 22, 32],
[13, 23, 33]])

In [5]: a[[1, 2, 3], [1, 2, 3]]
Out[5]: array([11, 22, 33])

更准确地说,

a[[[1, 2, 3]], [[1],[2],[3]]]

被视为完全一样:

i = [[1, 1, 1],
[2, 2, 2],
[3, 3, 3]])
j = [[1, 2, 3],
[1, 2, 3],
[1, 2, 3]]
a[i, j]

换句话说,输入是否为行/列向量是索引应如何在索引中重复的简写。


np.meshgridnp.ix_ 只是将 1D 序列转换为 2D 版本以进行索引的便捷方法:

In [6]: np.ix_([1, 2, 3], [1, 2, 3])
Out[6]:
(array([[1],
[2],
[3]]), array([[1, 2, 3]]))

类似地(sparse 参数会使其与上面的 ix_ 相同):

In [7]: np.meshgrid([1, 2, 3], [1, 2, 3], indexing='ij')
Out[7]:
[array([[1, 1, 1],
[2, 2, 2],
[3, 3, 3]]),
array([[1, 2, 3],
[1, 2, 3],
[1, 2, 3]])]

关于python - 对二维 numpy 数组进行子集化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30917753/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com