python - 独特产品与 itertools 的组合-6ren

python - 独特产品与 itertools 的组合

转载作者：行者123 更新时间：2023-12-01 08:43:31

26

4

我有一个嵌套列表，想要制作两个项目的产品。

test = [[('juice', 'NOUN'), ('orange', 'FLAVOR')], 
        [('juice', 'NOUN'), ('orange', 'FLAVOR'), ('lemon', 'FLAVOR')],
        [('orange', 'FLAVOR'), ('chip', 'NOUN')]]

我期望的是这样的:

[(('juice', 'NOUN'), ('lemon', 'FLAVOR')), 
 (('juice', 'NOUN'), ('chip', 'NOUN')),
 (('orange', 'FLAVOR'), ('lemon', 'FLAVOR')),
 (('orange', 'FLAVOR'), ('chip', 'NOUN')),
 (('lemon', 'FLAVOR'), ('chip', 'NOUN'))]

也就是说，我想获得跨列表的排列，但仅限于唯一的项目。我更喜欢使用itertools。以前，我尝试过 list(itertools.product(*test)) 但我意识到它会产生嵌套列表长度的乘积...

我当前的代码:

unique_list = list(set(itertools.chain(*test)))
list(itertools.combinations(unique_list, 2))

我的思考过程是首先获取嵌套列表中的唯一项目，因此嵌套列表将是 [[('juice', 'NOUN'), ('orange', 'FLAVOR')], [('lemon', 'FLAVOR')], [('chip', 'NOUN')]]，然后使用 itertools.combinations 进行排列。然而，它会在列表中排列(即果汁和橙子一起出现)，这是我不希望在结果中出现的情况。

最佳答案

这可以满足您的需求，无需将原始列表的大小固定为 3:

输入:

test = [[('juice', 'NOUN'), ('orange', 'FLAVOR')], 
        [('juice', 'NOUN'), ('orange', 'FLAVOR'), ('lemon', 'FLAVOR')],
        [('juice', 'NOUN'), ('chip', 'NOUN')]]

首先，重新格式化输入以删除重复项(参见注释 1):

test = [[x for x in sublist if x not in sum(test[:i], [])] for i, sublist in enumerate(test)]

最后，获取product combinations的.

from itertools import combinations, product

for c in combinations(test, 2):
    for x in product(*c):
        print(x)

产生:

(('juice', 'NOUN'), ('lemon', 'FLAVOR'))
(('orange', 'FLAVOR'), ('lemon', 'FLAVOR'))
(('juice', 'NOUN'), ('chip', 'NOUN'))
(('orange', 'FLAVOR'), ('chip', 'NOUN'))
(('lemon', 'FLAVOR'), ('chip', 'NOUN'))

<小时/>

删除内部元组(如果它们出现在任何先前的子列表中)。这里的魔力是由 sum(test[:i], []) 完成的，它将所有先前的子列表“添加”在一起以仅执行一次成员资格检查。

<小时/>

还有一个上面的列表理解版本，用于紧凑性和风格点:

res = [x for c in combinations(test, 2) for x in product(*c)]

关于python - 独特产品与 itertools 的组合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53396772/

26

4

0

文章推荐： python - 尝试创建 Egg 文件时限制软件包不起作用

文章推荐： python - 如何更改标签、行编辑等相对于窗口大小的位置？

文章推荐： python - 在 Pandas 中的字符串中解压列表中的字典

文章推荐： python - Paramiko 未正确返回 grep

prometheus - 哪些用例真正使普罗米修斯的汇总指标类型成为必要/独特？
对于 Prometheus 指标集合，如标题，我真的找不到只能通过 type Summary 完成的用例。，似乎它们都可以通过 type Histogram 以某种方式完成还。让我们以请求并发度量
r - 不区分大小写独特保持原样
这个问题在这里已经有了答案: Ignore case while using duplicated (1 个回答) 关闭 9 个月前。使用不区分大小写的 unique(tolower(x)) 删除
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
azure - 如何收到新(独特)错误的警报
应用程序监控服务的一个有用功能是每次发生新的、独特的错误/问题/异常时发送警报(例如电子邮件)(即不是每次发生)。要么只是第一次，要么最多每次 X 次(一天或一周等)。例如，这可以通过 Visual
group-by - DB2 独特 + xmlagg 查询
我想要相当于 DB2 中 MySql 的 GROUP_CONCAT 功能。我尝试过 DB2 的 XML Aggrigate 函数来合并 murows。 SELECT a.ID, sub
python - 雪花和 SQLAlchemy "unexpected ' 独特'
我正在运行 python 数据库迁移脚本 (Flask-Migrate) 并添加了 alembic.ddl.imp import DefaultImpl 来解决第一组错误，但现在我收到以下错误。我正在
bash - 排序 |独特 | xargs grep ... 其中行包含空格
我有一个逗号分隔的文件“myfile.csv”，其中第 5 列是日期/时间戳。 (mm/dd/yyyy hh:mm)。我需要列出所有包含重复日期的行(有很多) 我正在通过 cygwin 为 WinX
MySQL 5.7 | MySQL 5.7分组依据 |独特|聚合错误
我使用的是 MySQL 5.7。我有一个表格如下: -------------------------------------------------- | id | currentcy_id |
javascript - ng-repeat 中的 Angular 独特 ng-model
所以我有一个像这样的 ng-repeat: Join Ride /md-switch> 但是，每个 md-switch 都有相同的模型，因此当我在 Control
node.js - Mongoose 独特 :true pre-save hook calls hook before validation
据我了解， Mongoose 预保存 Hook 在将文档插入集合之前但在验证发生之后触发。因此，如果一次验证失败，则不会调用预保存 Hook 。就我而言，无论如何都会调用它们: 下面的简单代码的作用
awk - 重现 grep "my pattern"myfile.log |排序 |独特 | awk 中的 wc -l
如果我对我的目标文件执行此 grep，我会得到例如 275 作为结果。但是我想学习 awk，所以在 awk 中尝试了这个: awk 'BEGIN { count=0 } /my pattern/

首页

博学

6Ren·AI

商城

python - 独特产品与 itertools 的组合