- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
几周前有人在这里发布了这个问题,但它看起来非常像没有事先研究的家庭作业,OP 在收到一些反对票后立即将其删除。
虽然这个问题本身很有趣,但我已经考虑了一个星期但没有找到令人满意的解决方案。希望有人能提供帮助?
问题如下:给定一个包含 N 个整数区间的列表,其边界可以取从 0
到 N³
的任何值,找到最小的整数 i
使得 i
不属于任何输入区间。
例如,如果给定列表 [3,5] [2,8] [0,3] [10,13]
(N = 4) ,算法应返回 9
。
我能想到的最简单的解决方案在 O(n log(n))
中运行,包括三个步骤:
[a, b]
)不接触第二个区间(比如 [c, d]
) — 也就是说,直到 b + 1 < c,或者直到只有一个区间。b + 1
这个简单的解决方案在 O(n log(n))
中运行,但是原始发帖人写道该算法应该在 O(n)
中运行。 如果间隔已经排序,那是微不足道的,但是 OP 给出的示例包括未排序的间隔。 我想这一定与 N³
界限有关,但我不确定是什么……散列?线性时间排序?欢迎提出想法。
这是上述算法的粗略 python 实现:
def merge(first, second):
(a, b), (c, d) = first, second
if c <= b + 1:
return (a, max(b, d))
else:
return False
def smallest_available_integer(intervals):
# Sort in reverse order so that push/pop operations are fast
intervals.sort(reverse = True)
if (intervals == [] or intervals[-1][0] > 0):
return 0
while len(intervals) > 1:
first = intervals.pop()
second = intervals.pop()
merged = merge(first, second)
if merged:
print("Merged", first, "with", second, " -> ", merged)
intervals.append(merged)
else:
print(first, "cannot be merged with", second)
return first[1] + 1
print(smallest_available_integer([(3,5), (2,8), (0,3), (10,13)]))
输出:
Merged (0, 3) with (2, 8) -> (0, 8)
Merged (0, 8) with (3, 5) -> (0, 8)
(0, 8) cannot be merged with (10, 13)
9
最佳答案
详细说明@mrip 的评论:您可以使用您描述的确切算法但更改排序算法的工作方式,在 O(n) 时间内完成此操作。
通常,基数排序使用基数 2:根据元素的位是 0 还是 1,将元素分为两个不同的桶。每一轮基数排序需要时间 O(n),并且每个位有一轮最大的数字。调用那个最大的数字 U,这意味着时间复杂度是 O(n log U)。
但是,您可以将基数排序的基数更改为其他基数。使用基数 b,每一轮都需要时间 O(n + b),因为初始化和遍历桶需要时间 O(b),将元素分配到桶中需要时间 O(n)。然后有 logb U 轮。这给出了 O((n + b)logb U) 的运行时间。
这里的技巧是,由于最大数 U = n3,您可以设置 b = n 并使用以 n 为底的基数排序。轮数现在是 logn U = logn n3 = 3 并且每轮需要 O(n) 时间,所以总对数字进行排序的工作是 O(n)。更一般地说,您可以在时间 O(kn) 内对 [0, nk) 范围内的任何 k 的数字进行排序。如果k是一个固定常数,这是O(n)时间。
结合你原来的算法,这个问题在时间 O(n) 内解决了。
希望这对您有所帮助!
关于python - 计算未被任何一组区间覆盖的最小正整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19300735/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!