python - 使用 Python 将非唯一实体划分为唯一集合-6ren

python - 使用 Python 将非唯一实体划分为唯一集合

转载作者：太空宇宙更新时间：2023-11-04 10:42:03

25

4

我有一个项目列表，例如[1,1,1,1,2,2]，我试图找到所有唯一的组，其中这些项目被捆绑到长度为一或两个的元组中。例如，对于上面的组，我想找到以下 10 个可能的分组:

[[(1,),(1,),(1,),(1,),(2,),(2,)],
 [(1,1),(1,),(1,),(2,),(2,)],
 [(1,2),(1,),(1,),(1,),(2,)],
 [(2,2),(1,),(1,),(1,),(1,)],
 [(1,1),(1,1),(2,),(2,)],
 [(1,1),(1,2),(1,),(2,)],
 [(1,2),(1,2),(1,),(1,)],
 [(2,2),(1,1),(1,),(1,)],
 [(1,1),(1,1),(2,2)],
 [(1,1),(1,2),(1,2)]]

我一直在玩 itertools，但只能设法用它来找到唯一可能的元组(例如 set(list(itertools.combinations((1,1,1,1,2,2), 2)))) 和我做的任何搜索都会弹出解决方案，其中每个组的大小是恒定的和/或不考虑元素的重复(example1，example2)。

最终，我正在寻找一种解决方案，适用于所有情况([1,1,1,...,1])，所有情况([ 2,2,2,...,2]) 或包含任意数量的 1 和 2 的一些中间组合。

最佳答案

正如我在评论中指出的那样，输入列表的最大长度至关重要。下面是示例代码，它通过对完整的分区集进行后处理(清除重复项，并清除带有“太大”的片段的分区)来足够快地解决您给出的特定示例。但是对于“长”的原始列表，这将是可怕的低效的:

def part(xs):  # generate all partitions of xs
    xs = tuple(xs)
    n = len(xs)
    def extend(i):
        if i == n:
            yield ()
            return
        this = xs[i]
        for o in extend(i+1):
            yield ((this,),) + o
            for j, p in enumerate(o):
                yield o[:j] + ((this,) + p,) + o[j+1:]
    for o in extend(0):
        yield o

def upart(xs):  # weed out dups, and partitions with a piece bigger than 2
    from collections import Counter
    seen = []
    for p in part(xs):
        if all(len(chunk) <= 2 for chunk in p):
            c = Counter(p)
            if c not in seen:
                seen.append(c)
                yield p

xs = [1,1,1,1,2,2]
for o in upart(xs):
    print o

这会显示您要查找的 10 个唯一分区。

顺便说一句，对于 xs = [1,1,1,1,1,1]，它会产生:

((1,), (1,), (1,), (1,), (1,), (1,))
((1, 1), (1,), (1,), (1,), (1,))
((1, 1), (1, 1), (1,), (1,))
((1, 1), (1, 1), (1, 1))

自定义生成器

正如评论中还指出的那样，如果对一般构建 block 的结果进行后处理效率太低，则需要从头开始“自己动手”。这是一种非常节省空间的方法，通过构建(而不是通过后处理)构建独特的结果。确实没有做到这一点的“通用方法”——它需要分析手头的具体问题，并编写代码来利用你能找到的任何怪癖:

def custom_gen(xs):
    from collections import Counter
    assert all(1 <= i <= 2 for i in xs)
    # There are only 5 unique pieces that can be used:
    pieces = [(1,), (2,), (1, 1), (2, 2), (1, 2)]
    countpieces = {piece: Counter(piece) for piece in pieces}

    def extend(i, n1, n2, result):
        # try all ways of extending with pieces[i];
        # there are n1 1's and n2 2's remaining to be used
        assert n1 >= 0 and n2 >= 0
        if n1 == n2 == 0:
            yield result
            return
        if i == len(pieces):  # dead end
            return
        piece = pieces[i]
        c = countpieces[piece]
        p1 = c[1]
        p2 = c[2]
        # What's the most number of this piece we could
        # possibly take?
        assert p1 or p2
        if p1:
            if p2:
                most = min(n1 // p1, n2 // p2)
            else:
                most = n1 // p1
        else:
            most = n2 // p2
        for count in range(most + 1):
            for t in extend(i+1,
                            n1 - count * p1,
                            n2 - count * p2,
                            result + [piece] * count):
                yield t

    c = Counter(xs)
    for t in extend(0, c[1], c[2], []):
        yield t

请注意，递归永远不会超过 5 层(无论输入列表有多长)，所以我敢打赌，这是最有效的方法，无需对问题的数学进行更深入的分析。

关于python - 使用 Python 将非唯一实体划分为唯一集合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20014499/

25

4

0

文章推荐：导入中的python导入

文章推荐： java - 如何使用JSP/Servlet将文件上传到服务器？

文章推荐： c - rpcgen 添加 _svc 扩展

mysql - WHERE(集合)IN(集合)
编辑:我似乎问错了这个问题。我正在尝试寻找一种方法来查询一个集合是否在另一个集合中可用。例如: SELECT * FROM something WHERE (1, 3) IN (1, 2, 3, 4
jquery - $.each([集合]) 与 $([集合]).each()
这两种方法似乎 produce the same results ，但我一直很难真正说服人们第二种方法有效，因为它显然并不为人所知。 // Create some data var foo = { '
kotlin - 为什么我们在Kotlin中仅使用[列表， map ，集合]集合？
我一直在学习Kotlin，并且遇到过Collections API。在Kotlin之前，我一直在学习Java，并且我知道Java中有很多不同类型的Collections API。例如，我们使用List
Java addAll(集合)与 new ArrayList(集合)
为什么我会得到不同的行为: Collection col2 = new ArrayList(col); 集合 col2 = new ArrayList(); col2.addAll(col) 我正在与
javascript: 集合[id][prop] = 集合[id][prop] || []//将空数组分配给对象时出现问题
所以我有一个代表专辑信息的 JSON 对象。给定“function updateRecords(id, prop, value)”我希望能够更新每个条目。正确的完成代码如下。我得到了指示，粗体部分，
java - 我需要哪种 Java 对象类型(集合/列表/集合/其他)？
我想存储一个对象集合，这些对象根据它们所代表的值进行键控。这些键可以重复。例如: [4] => Bob [5] => Mary [5] => Sue [9] => Steve [10] =>
collections - ArrayList(集合 c)VS HashSet(集合 c)
在检查 ArrayList API 时，我注意到一些看起来很奇怪的东西。确实，这里是 ArrayList 构造函数实现，其中 Collection 作为参数传递: public ArrayList(
collections - 如何在我的 YAML Swagger 定义中将属性类型定义为字符串列表(列表、集合、数组、集合)
我正在为 API 编写一个 swagger 定义文件。 API 是用于 GET 请求的 /path/to/my/api: get: summary: My Custom API d
java - 如何将 Scala 集合 Seq[(Int, Seq[String])] 转换为 Java 集合 List[(int, List[String])]？
我知道scala.collection包中有两个非常有用的对象，可以帮助我们实现这个目标: JavaConverters(如果我想明确说明并准确说明我要转换的内容) JavaConversions(如
Automapper 集合
我已经阅读了无数其他帖子，但似乎无法弄清楚发生了什么，所以是时候寻求帮助了。我正在尝试将包含集合的域实体映射到也包含集合的 dtos。这是一个原始示例； (我提前为代码墙道歉，我尽量保持简短):
Java:集合
我正在创建一个具有 ArrayList 的类，因此当我调用构造函数时，它会初始化该数组: public class ElementsList { private ArrayList list;
polymer this.$ 集合
我正在阅读事件指南和指南的开头，它说: You can also add an event listener to any element in the this.$ collection using
Python - 集合
我是 Python 新手，想知道如何使用键在字典中存储不同数据类型的列表例如 - {[Key1,int1,int1,String1] , [Key2,int2,int2,String2], [Key
C# 集合
int[] mylist = { 2, 4, 5 }; IEnumerable list1 = mylist; list1.ToList().Add(1); // why 1 does not get
Java 集合
我在 UI 表单中的每一行之后将以下内容添加到 HashMap 集合中声明 Map> map = new HashMap>(); List valSetOne = new ArrayList();
Java - 集合
我正在开发我的第一个 Java 项目，我有一个问题。问题应该很简单(虽然代码不是那么短，但没有理由被吓倒:))。我创建了一个基本的角色扮演游戏，并且有一个定义每个角色的抽象类“Character”。在
MongoDB 集合
我正在开发一款应用程序，可以为用户收集推文、Facebook 状态和 Facebook 照片。目前，用户确切地设定了他们希望这种收获发生的时间和时间，并且蜘蛛会在此期间拉取数据。 when 和 to
C# 集合？
有谁知道在 C# 中是否有与 Java 的 Set 集合等效的好方法？我知道您可以通过填充但忽略值来使用 Dictionary 或 HashTable 在某种程度上模仿集合，但这不是一种非常优雅的方式
oracle 集合
EXISTS 该函数返回集合中第一个元素的索引，如果集合为空，返回NULLNULLNULL Collecti
07、RDF 集合
RDF集合是通过属性 rdf:parseType="Collection" 来描述仅包含指定成员的组 rdf:parseType="Collection" 属

首页

博学

6Ren·AI

商城

python - 使用 Python 将非唯一实体划分为唯一集合

自定义生成器