gpt4 book ai didi

python - 快速删除包含其他列表元组的元组

转载 作者:行者123 更新时间:2023-12-04 09:16:02 24 4
gpt4 key购买 nike

我想删除列表 A 中包含列表 B 中的元组的所有元组。
这通常是一件小事,但我在列表 A 中有 1000 万条记录,在列表 B 中有 20 万条记录。我当前的脚本(见下文)非常慢(每次扫描列表 A 大约需要 10 秒)。
例子:

# Input:
listA = [(1,2,3,4,5),(1,2,4,5,6),(1,2,3,7,55),(8,21,22,24,37),...] # 10 million records
listB = [(1,2,4),(1,4,6),(21,24,37),...] # 200K records

# Desired Output (filtered listA):
listA = [(1,2,3,7,55),...]
当前脚本很慢:
listA=[(1,2,3,4,5),(1,2,4,5,6),(1,2,3,7,55),(8,21,22,24,37)]
listB=[(1,2,4),(1,4,6),(21,24,37)]
listATemp=[]

for b in listB:
for a in listA:
if not set(b).issubset(a) :
listATemp.append(a)
listA= listATemp
listATemp= []

最佳答案

使用 itertools.combinationsfrozenset :

setB = set(map(frozenset, listB))
n = len(listB[0])
listA = [a for a in listA if not any(frozenset(c) in setB for c in combinations(a, n))]
或者假设每个元组都已排序(如果没有,您当然可以先对它们进行排序):
setB = set(listB)
n = len(listB[0])
listA = [a for a in listA if setB.isdisjoint(combinations(a, n))]

关于python - 快速删除包含其他列表元组的元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63209874/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com