gpt4 book ai didi

python - 过滤列表以仅保留出现一次的对象

转载 作者:太空狗 更新时间:2023-10-29 22:00:11 26 4
gpt4 key购买 nike

我想过滤这个列表,

[0, 1, 1, 2, 2]

只能离开

[0]

我正在努力以“pythonic”方式进行操作。没有嵌套循环是否可能?

最佳答案

您将需要两个循环(或者相当于一个循环和一个 listcomp,如下所示),但不需要嵌套循环:

import collections
d = collections.defaultdict(int)
for x in L: d[x] += 1
L[:] = [x for x in L if d[x] == 1]

此解决方案假定列表项是可散列的,也就是说,它们可用作字典、集合成员等的索引。

OP 表示他们关心对象 IDENTITY 而不是 VALUE(例如,两个子列表都值 [1,2,3,它们相等但可能不相同,不会被视为重复项)。如果情况确实如此,那么这段代码是可用的,只需在两次出现时将 d[x] 替换为 d[id(x)] ,它将适用于任何类型的列表 L 中的对象。

可变对象(列表、字典、集合……)通常不可散列,因此不能以这种方式使用。用户定义的对象默认是可散列的(使用 hash(x) == id(x)),除非它们的类定义了比较特殊方法(__eq____cmp__, ...) 在这种情况下,当且仅当它们的类也定义了 __hash__ 方法时,它们才可散列。

如果列表 L 的项目不可哈希,但不等式具有可比性(因此可排序),并且您不关心它们在列表中的顺序,您可以及时执行任务 O(N log N) 首先对列表进行排序,然后应用 itertools.groupby(几乎但不完全是另一个答案建议的方式)。

当您确实关心列表的原始顺序时,其他逐渐降低性能和增加通用性的方法可以处理不可散列的可排序项(制作一个排序副本并在第二个循环中借助 检查重复项bisect -- 也是 O(N log N) 但有点慢),并且对象的唯一适用属性是它们在相等性方面具有可比性(无法避免可怕的 O(N**2) 性能在那个最一般的情况下)。

如果 OP 可以阐明哪种情况适用于他的特定问题,我将很乐意提供帮助(特别是,如果他的对象是可哈希的,我上面已经给出的代码就足够了;-)。

关于python - 过滤列表以仅保留出现一次的对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1285468/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com