gpt4 book ai didi

python - 对列表的成员进行操作

转载 作者:太空宇宙 更新时间:2023-11-04 07:42:32 25 4
gpt4 key购买 nike

我有一个数字列表。

L1=[12,32,21,......]

我需要对每个成员执行以下测试,最多容忍 2 次失败 - 不能再多了。

注意:该功能是说明性的(不是实际的)- 目的是测试每个成员并将失败的成员作为列表返回。
同样为了性能起见,这个想法是一旦失败超过 2 就中止。

def isgreaterthan10(self,x):
if x<10:
return false
else:
return true

所以我执行以下操作。

def evaluateList(L1):
Failedlist=list()
Failures=0
for x in L1:
if not isgreaterthan10(x):
Failedlist.add(x)
Failures+=1
if Failures>2:
return (False,[])
return (True,Failedlist)

但我相信这可以通过更高效的“pythonic”方式完成,因为性能非常重要。将不胜感激任何帮助实现同样的目标。
我在 Python 2.6.5

最佳答案

如果性能是关键,我会使用 numpy(或 scipy)对其进行矢量化。

>>> import numpy
>>> L1 = [47, 92, 65, 25, 44, 8, 74, 42, 48, 56, 74, 5, 60, 84, 88, 16, 69, 87, 9, 82, 69, 82, 40, 49, 1, 45, 93, 70, 22, 40, 97, 49, 95, 34, 28, 91, 79, 9, 32, 91, 41, 22, 36, 2, 57, 69, 81, 73, 7, 71]
>>> arr = numpy.array(L1)
>>> count_of_num_greater_than_10 = numpy.sum(arr > 10)
>>> num_greater_than_10 <= 2
False

当然,它不会短路,所以如果您很早就有两个错误陈述,它会计算其余部分。

计时结果。

简单的计时测试,使用 1 到 100 的随机 1000 个元素列表进行 1000 次迭代(在启动计时器之前完成数组创建的设置),表明矢量化方法快了 100 多倍。

>>> import timeit
>>> timeit.timeit('sum([n>10 for n in L1])>=2',
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
2.539483070373535
>>> timeit.timeit('numpy.sum(L1>10)>=2',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.01939105987548828

如果你想要失败的成员,没那么难;你可以找到不大于 10 的数字:

>>> list(arr[numpy.where(arr<10)])
[8, 5, 9, 1, 9, 2, 7]

矢量化版本比非矢量化版本快几个数量级:

>>> timeit.timeit('[i for i in L1 if i < 10]', 
setup='import numpy; L1=list(numpy.random.randint(1,100,1000))',
number=1000)
0.4471170902252197
>>> timeit.timeit('L1[numpy.where(L1<10)]',
setup='import numpy; L1=numpy.random.randint(1,100,1000)',
number=1000)
0.011003971099853516

关于python - 对列表的成员进行操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16704853/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com