- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个动态创建的元组列表。
列表显示为:
List = [(1,4), (8,10), (19,25), (10,13), (14,16), (25,30)]
list 的每个元组(a, b)
表示某个表的索引范围。
范围 (a, b) 和 (b, d)
在我的情况下与 (a, d)
相同
我想合并第二个元素与第一个元素匹配的元组。
因此,在上面的示例中,我想合并 (8, 10), (10,13)
以获得 (8,13)
并删除 (8, 10), (10,13)
(19,25) 和 (25,30)
合并应该产生 (19, 30)
我不知道从哪里开始。元组不重叠。
编辑:我一直试图避免任何类型的 for 循环,因为我有一个非常大的列表
最佳答案
如果您需要在评论中考虑诸如 skovorodkin 的示例之类的内容,
[(1, 4), (4, 8), (8, 10)]
(或更复杂的示例),那么一种有效的方法就是使用图表。
假设您创建了一个有向图(可能使用 networkx
),其中每一对都是一个节点,并且从 (a, b) 到节点 (c, d ) 如果 b == c。现在运行 topological sort ,按照顺序进行迭代,并进行相应的合并。您应该注意正确处理具有两个(或更多)出边的节点。
我知道您的问题表明您希望避免由于列表过长而出现循环。相反,对于长列表,我怀疑您是否会使用列表理解(或类似的东西)找到有效的线性时间解决方案。请注意,例如,您不能按线性时间对列表进行排序。
这是一个可能的实现:
假设我们从
开始l = [(1,4), (8,10), (19,25), (10,13), (14,16), (25,30)]
它简化了以下删除重复项的操作,所以让我们这样做:
l = list(set(l))
现在构建有向图:
import networkx as nx
import collections
g = nx.DiGraph()
顶点只是对:
g.add_nodes_from(l)
为了构建边缘,我们需要一个字典:
froms = collections.defaultdict(list)
for p in l:
froms[p[0]].append(p)
现在我们可以添加边了:
for p in l:
for from_p in froms[p[1]]:
g.add_edge(p, from_p)
接下来的两行是不需要的 - 它们只是在这里显示图表此时的样子:
>>> g.nodes()
[(25, 30), (14, 16), (10, 13), (8, 10), (1, 4), (19, 25)]
>>> g.edges()
[((8, 10), (10, 13)), ((19, 25), (25, 30))]
现在,让我们按拓扑排序对这些对进行排序:
l = nx.topological_sort(g)
最后,这是棘手的部分。结果将是一个 DAG。我们必须递归地遍历事物,但要记住我们已经访问过的事物。
让我们创建一个我们访问过的字典:
visited = {p: False for p in l}
现在一个递归函数,给定一个节点,返回从它可达的任何节点的最大范围边缘:
def visit(p):
neighbs = g.neighbors(p)
if visited[p] or not neighbs:
visited[p] = True
return p[1]
mx = max([visit(neighb_p) for neighb_p in neighbs])
visited[p] = True
return mx
我们都准备好了。让我们为最终对创建一个列表:
final_l = []
并访问所有节点:
for p in l:
if visited[p]:
continue
final_l.append((p[0], visit(p)))
最终结果如下:
>>> final_l
[(1, 4), (8, 13), (14, 16)]
关于python - 组织元组列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39904161/
我是 Django 新手并开始了一个项目,我想以正确的方式去做。 我想知道您认为组织项目的最佳实践是什么。 以下是我的一些问题: 如何将静态资源与 Python 代码分开,以免浪费时间通过 Djang
通过这个组织,是否可以引用“id”属性? function house(id) { this.id = id } house.prototype.buy = function() { }
我的任务是“识别并修复任何错误”。这张取自 Java 教科书的图片显示了 Swing 结构的组织。这对我来说很好,我没有发现任何问题。 谁能解释一下? JPanel 应该放在 JComponent 之
重要的事情 是否可以确定 WHERE 条件的最佳顺序以使其更快?例如,我有一个包含 6 个条件的查询。一些简单,另一些带有子查询或函数。我的想法是对查询进行概要分析,以确定条件语句 true 的常见程
我有 Java/AS3/Javascript 背景,我的所有类都组织成包,以帮助表示它们的功能。 在开始一个 C++ 项目时,我试图以几乎相同的方式模仿这个文件系统结构,但我一直遇到包含问题。 目前我
我正在使用 CKAN 作为开放数据门户。我已经完成了 CKAN 实例的设置并添加了数据集、组和组织。 主页上有一个特色组和一个特色组织框。如何在主页上显示我想要的组和组织。 如何在主页上更改这些特色组
我已经创建了我的第一个 iPhone 应用程序,它可以在表格 View 中显示类似类型的音轨。用户可以使用类似 ipod 的控件来播放音轨,这些控件可以流式传输 mp3。 我的所有代码都在两个主要类中
我将我的代码组织成 20-60 行模块,通常采用模块模式。我想要一个结构良好的面向对象的 JavaScript 库。 这是最好的方法吗?代码已经过测试并且有效。 我喜欢它,因为程序员可以从库中提取模块
我正在使用 riot.js 和 jquery 构建一个应用程序。一切都按预期工作,但是随着代码的增长,我也担心在代码中随机/意外的地方触发和处理事件 (.trigger/.on) 对保持我的代码有条理
这是另一个 GIT 新手。 我想在我们的项目中使用 GIT。 团队不熟悉 GIT。 这些项目基本上由一些通用项目(*)和一些应用项目组成。应用程序正在使用公地,公地也可以使用其他公地。通过“使用”我的
例如,考虑一个组织有一个包含两个分支的存储库的情况,master 和 1.0.0.1。 是否可以让团队对 master 具有只读访问权限,而对分支 (1.0.0.1) 具有读写访问权限? 最佳答案 自
我一直致力于寻找组织 CSS 代码的最佳方式,尤其是在大型网站上。我对编写风格不太感兴趣,而对人们如何构建和管理他们的代码更感兴趣。 我一直在遵循这个结构,我觉得它在可维护性方面工作得很好,但我想听取
我们正在扩展到一个大型微服务构建,并通过 postman 完成更多测试(现场验证、错误测试等)。好奇...您的团队如何组织大量 API 的集合? (按 API、按测试类型、按发布等)从一个团队传递到另
我最近遇到了这个编码面试问题,但似乎找不到答案。这是问题。 给定一个整数数组,编写一个函数,返回组织数组所需的最小交换,使得相邻元素的绝对差都小于或等于 K。交换可以是任意两个数组元素,不一定是相邻的
我有 100 多页。所有页面都使用不同的模板。 目前,我有一长串 .state('page.html').state('page2.html') 等。10-15 页后,我认为这变得不可读/难以管理。
我看下grails-app/i18n有一吨messages*.properties捆绑。我想将我的应用程序国际化,但每页有 1 个“捆绑集”。我所说的包集是指包含相同文本但用于不同语言的一组包/属性文
我正在编写一个非常非常长的 CUDA 内核,它对人类的可读性来说非常糟糕。有什么方法可以用内核外部的功能组织 CUDA 内核吗?示例: __global__ void CUDA_Kernel(int*
我的公司要求我将Outlook用于我的电子邮件。 Outlook几乎不执行我想做的任何事情,这让我感到非常沮丧。 (我并不是要在这里发动一场火焰大战,它必须完全执行数千名CEO想要做的事情,但我不是C
我一直在尝试一些不同的方法来组织我的 javascript 应用程序中的代码,我想知道哪种方法最合适。 第一个例子: var Application = { init: function()
Angular 样式指南包含有关在应用程序中使用类和接口(interface)的最佳实践的信息。但它没有任何关于如何组织我的接口(interface)和模型类的信息。 有一个问题:关于文件和类的组织有
我是一名优秀的程序员,十分优秀!