- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试通过指定某些条件来创建 numpy.array 的“掩码”。 Python 甚至对这样的事情有很好的语法:
>> A = numpy.array([1,2,3,4,5])
>> A > 3
array([False, False, False, True, True])
但是如果我有一个标准列表而不是一个范围:
>> A = numpy.array([1,2,3,4,5])
>> crit = [1,3,5]
我不能这样做:
>> A in crit
我必须做一些基于列表推导的事情,像这样:
>> [a in crit for a in A]
array([True, False, True, False, True])
哪个是正确的。
现在,问题是我正在处理大型数组,上面的代码非常慢。是否有更自然的方式来执行此操作并可能加快速度?
编辑:我可以通过将暴击变成一个集合来获得小幅加速。
EDIT2:对于那些感兴趣的人:
Jouni 的方法:1000 个循环,3 个循环中的最佳:每个循环 102 µs
numpy.in1d:1000 次循环,最好的 3 次:每次循环 1.33 毫秒
EDIT3:刚刚用 B = randint(10,size=100) 再次测试
Jouni 的方法:1000 次循环,最好的 3 次:每次循环 2.96 毫秒
numpy.in1d:1000 次循环,最好的 3 次:每次循环 1.34 毫秒
结论:除非 B 非常小,否则使用 numpy.in1d()。
最佳答案
我认为 numpy 函数 in1d
就是您要找的:
>>> A = numpy.array([1,2,3,4,5])
>>> B = [1,3,5]
>>> numpy.in1d(A,crit)
array([ True, False, True, False, True], dtype=bool)
如其文档字符串中所述,“in1d(a, b)
大致等同于 np.array([item in b for item in a])
”
诚然,我没有做过任何速度测试,但这听起来像您要找的东西。
另一种更快的方式
这是另一种更快的方法。首先对 B 数组进行排序(包含您要在 A 中查找的元素),将其转换为 numpy 数组,然后执行:
B[B.searchsorted(A)] == A
但是如果 A 中的元素大于 B 中最大的元素,则需要执行以下操作:
inds = B.searchsorted(A)
inds[inds == len(B)] = 0
mask = B[inds] == A
对于小数组(尤其是 B 小)可能不会更快,但用不了多久它肯定会更快。为什么?因为这是一个 O(N log M) 算法,其中 N 是 A 中的元素数,M 是 M 中的元素数,所以将一堆单独的掩码放在一起是 O(N * M)。我用 N = 10000 和 M = 14 测试了它,它已经更快了。无论如何,只是觉得您可能想知道,尤其是如果您真的打算在非常大的阵列上使用它。
关于python - Numpy.array 索引问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3989990/
在 C 中: int a[10]; printf("%p\n", a); printf("%p\n", &a[0]); 产量: 0x7fff5606c600 0x7fff5606c600 这是我所期望
我一直在尝试运行此循环来更改基于数组的元素的位置,但出现以下错误。不太确定哪里出了问题。任何想法或想法!谢谢。 var population = [[98, 8, 45, 34, 56], [9, 1
我正在尝试获取一个 Ruby 数组数组并将其分组以计算其值。 数组有一个月份和一个 bool 值: array = [["June", false], ["June", false], ["June"
所以我们的目标是在遇到某个元素时将数组分割成子数组下面的示例 array.split("stop here") ["haii", "keep", "these in the same array bu
在this问题已经回答了两个表达式是相等的,但在这种情况下它们会产生不同的结果。对于给定的 int[] 分数,为什么会这样: Arrays.stream(scores) .forEac
我认为我需要的是哈希数组的数组,但我不知道如何制作它。 Perl 能做到吗? 如果是这样,代码会是什么样子? 最佳答案 perldoc perldsc是了解 Perl 数据结构的好文档。 关于arra
我遇到了这个问题,从 API 中我得到一个扩展 JSON,其中包含一个名为坐标的对象,该对象是一个包含数组 o 数组的数组。 为了更清楚地看这个例子: "coordinates": [
postgres 中有(v 9.5,如果重要的话): create table json_test( id varchar NOT NULL, data jsonb NOT NULL, PRIM
我用 echo "${array[@]}" 和 echo "${array[*]}" 得到了相同的结果。 如果我这样做: mkdir 假音乐; touch fakemusic/{Beatles,Sto
我正在尝试创建 typealias 对象的数组数组 - 但我收到“表达式类型不明确,没有更多上下文”编译错误。这是我的代码: typealias TestClosure = ((message: St
如果您在 Python 中创建一维数组,使用 NumPy 包有什么好处吗? 最佳答案 这完全取决于您打算如何处理数组。如果您所做的只是创建简单数据类型的数组并进行 I/O,array模块就可以了。 另
当我将数组推送到只有一个数组作为其唯一元素的数组数组时,为什么会得到这种数据结构? use v6; my @d = ( [ 1 .. 3 ] ); @d.push( [ 4 .. 6 ] ); @d.
在 Julia 中,我想将定义为二维数组向量的数据转换为二维矩阵数组。 如下例所述,我想把数据s转换成数据t,但是至今没有成功。 我该如何处理这个案子? julia> s = [[1 2 3], [4
C 没有elementsof 关键字来获取数组的元素数。所以这通常由计算 sizeof(Array)/sizeof(Array[0]) 代替但这需要重复数组变量名。1[&Array] 是指向数组后第一
所以,假设我有一个像这样的(愚蠢的)函数: function doSomething(input: number|string): boolean { if (input === 42 || in
我有以下数组: a = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16] 我将它用于一些像这样的视觉内容: 1 2 3 4 5 6 7 8 9 10
我想知道数组中的 .toList 与 .to[List] 之间有什么区别。我在spark-shell中做了这个测试,结果没有区别,但我不知道用什么更好。任何意见? scala> val l = Arr
我很难获得完全相同对象的多个元素的当前元素索引: $b = "A","D","B","D","C","E","D","F" $b | ? { $_ -contains "D" } 替代版本: $b =
我正在尝试使用来自我的 API 的 v-select 执行 options,我将数据放在数组数组中。 Array which I got from API 它应该是一个带有搜索的 select,因为它
这个问题在这里已经有了答案: String literals: pointer vs. char array (1 个回答) 4 个月前关闭。 当我执行下一个代码时 int main() {
我是一名优秀的程序员,十分优秀!