- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
给定一个集合列表:
allsets = [set([1, 2, 4]), set([4, 5, 6]), set([4, 5, 7])]
计算不与其他集合重叠的相应元素集合列表的 Pythonic 方法是什么?
only = [set([1, 2]), set([6]), set([7])]
有没有办法通过列表理解来做到这一点?
最佳答案
为避免二次运行时间,您需要进行初始传递以找出哪些元素出现在多个集合中:
import itertools
import collections
element_counts = collections.Counter(itertools.chain.from_iterable(allsets))
然后你可以简单地制作一个集合列表,保留所有只出现一次的元素:
nondupes = [{elem for elem in original if element_counts[elem] == 1}
for original in allsets]
或者,不是直接从 element_counts
构造 nondupes
,我们可以进行额外的传递以构造一组恰好出现在一个输入中的所有元素。这需要一个额外的语句,但它允许我们利用 &
运算符进行集合交集,使列表理解更短、更高效:
element_counts = collections.Counter(itertools.chain.from_iterable(allsets))
all_uniques = {elem for elem, count in element_counts.items() if count == 1}
# ^ viewitems() in Python 2.7
nondupes = [original & all_uniques for original in allsets]
时间似乎表明使用 all_uniques
集可以显着加快整个重复消除过程。对于重度重复的输入集,Python 3 上大约为 3.5x speedup,但由于更多的运行时间由构建计数器控制,因此 Python 2 上的整体重复消除过程只有大约 30% speedup。这种加速是相当可观的,尽管不如首先使用 element_counts
避免二次运行时间那么重要。如果您使用的是 Python 2 并且这段代码对速度要求很高,那么您会希望使用普通的 dict
或 collections.defaultdict
而不是 Counter
。
另一种方法是从 element_counts
构造一个 dupes
集并使用 original - dupes
而不是 original & all_uniques
在列表理解中,如 munk 的 suggested。这是否比使用 all_uniques
集和 &
表现更好或更差取决于您输入的重复程度以及您使用的 Python 版本,但它 doesn't seem无论哪种方式都会产生很大的不同。
关于python - 集合列表的减法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35093304/
编辑:我似乎问错了这个问题。 我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
这两种方法似乎 produce the same results ,但我一直很难真正说服人们第二种方法有效,因为它显然并不为人所知。 // Create some data var foo = { '
我一直在学习Kotlin,并且遇到过Collections API。在Kotlin之前,我一直在学习Java,并且我知道Java中有很多不同类型的Collections API。例如,我们使用List
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。 我得到了指示,粗体部分,
我想存储一个对象集合,这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
在检查 ArrayList API 时,我注意到一些看起来很奇怪的东西。 确实,这里是 ArrayList 构造函数实现,其中 Collection 作为参数传递: public ArrayList(
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
我知道scala.collection包中有两个非常有用的对象,可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
我已经阅读了无数其他帖子,但似乎无法弄清楚发生了什么,所以是时候寻求帮助了。 我正在尝试将包含集合的域实体映射到也包含集合的 dtos。 这是一个原始示例; (我提前为代码墙道歉,我尽量保持简短):
我正在创建一个具有 ArrayList 的类,因此当我调用构造函数时,它会初始化该数组: public class ElementsList { private ArrayList list;
我正在阅读事件指南和指南的开头,它说: You can also add an event listener to any element in the this.$ collection using
我是 Python 新手,想知道如何使用键在字典中存储不同数据类型的列表 例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中 声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
我正在开发我的第一个 Java 项目,我有一个问题。问题应该很简单(虽然代码不是那么短,但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏,并且有一个定义每个角色的抽象类“Character”。在
我正在开发一款应用程序,可以为用户收集推文、Facebook 状态和 Facebook 照片。目前,用户确切地设定了他们希望这种收获发生的时间和时间,并且蜘蛛会在此期间拉取数据。 when 和 to
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法?我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合,但这不是一种非常优雅的方式
EXISTS 该函数返回 集合中第一个元素的索引,如果集合为空,返回NULLNULLNULL Collecti
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属
我是一名优秀的程序员,十分优秀!