python - TLE 计算列表中指定范围内的元素数量-6ren

python - TLE 计算列表中指定范围内的元素数量

转载作者：行者123 更新时间：2023-12-03 17:09:10

26

4

有一个未排序的列表 a 和一个范围列表，如 ranges = [(10, 20), (30, 50), (15, 35) ...]。 a 中的最大值为 uint64_t。目标是计算每个范围的元素数量。正常的解决方案非常直观，只需统计范围内的元素并打印结果即可。但是问题来自在线法官。我厌倦了几个解决方案，但对于每个解决方案，OJ 都给出了超出时间限制。

a 的最大长度为 10,000,000，ranges 的最大长度为 1,000,000。

具有 1000 万个随机数的测试列表 a 和具有 100 万对范围的 ranges:

import numpy as np

a = list(np.random.randint(low=1, high=0x7fffffffffffffff, size=10_000_000))

ranges = []
for _ in range(1_000_000):
    x, y = np.random.randint(low=1, high=0x7fffffffffffffff, size=2)
    ranges.append((x, y) if x < y else (y, x))

第一种解决方案是:

import bisect

a.sort()

low_d = {}
up_d = {}

def count(r):
    low, up = r

    if low not in low_d:
        l = bisect.bisect_left(a, low)
        low_d[low] = l
    else:
        l = low_d[low]

    if up not in up_d:
        u = bisect.bisect_right(a, up, lo=l)
        up_d[up] = u
    else:
        u = up_d[up]

    return u - l

result = [*map(count, ranges)]

缺点很明显，当a非常大时，sort()非常耗时。

The original second solution is much slower than the above solution.

Abandoned.

两种解决方案都会导致 TLE 错误。我使用的OJ就像一个黑盒子，我不知道它用来测试程序的测试例子。

由于程序运行在OJ上，所以不允许使用numpy。

有什么方法可以优化性能吗？

最佳答案

我设法将机器上的时间从 13.1 秒减少到 11.2 秒

我的最终代码:

from bisect import bisect_left, bisect_right
def f0_4(a, ranges, n_pre_b):
    a.sort()
    blen = [x*len(a)//n_pre_b for x in range(n_pre_b)]
    b1 = [a[i] for i in blen]
    blen.append(len(a))
    b1.append(a[-1])
    res = []
    for low, up in ranges: 
        low_pre_b_i = bisect_left(b1,low)
        lo = blen[low_pre_b_i-1]
        hi = blen[low_pre_b_i]
        l = bisect_left(a, low, lo=lo, hi=hi)
        high_pre_b_i = bisect_left(b1,up)
        lo = blen[high_pre_b_i-1]
        hi = blen[high_pre_b_i]
        if l > lo:
            res.append(bisect_right(a, up, lo=l, hi=hi)-l)
        else:
            res.append(bisect_right(a, up, lo=lo, hi=hi)-l)

    return res
res = f0_4(a,ranges,16384)

什么和为什么:

我删除了函数调用“count”，因为在 python 中每次调用都是开销
我删除了 bisect 值的缓存，因为具有相同 bisect 值的概率很小。测试表明没有缓存速度更快
我为 a 列表预先计算了一些范围。 16384 个预先计算的值是最佳的。这极大地提高了速度
我通过更改导入将 bisect.bisect_left 替换为 bisect_left。 bisect_right 也一样。点调用在 python 中有开销

我本来应该做的，但这是违反规则的(如果我错了请纠正我。下面的方法可以将速度提高 100 倍):

使用 numpy 数组而不是 python 列表。排序速度提高了 10 倍。允许使用快速 numba 和 cython 代码。元素访问速度更快
在 cython 或 numba 中对均匀分布的整数使用特殊的排序算法。可能会比原来的排序提高 100 倍。这种排序与数组大小成线性关系。这对于 python 列表和 numpy 数组使用的一般排序算法是不可能的
使用 numpy.searchsorted() 而不是 bisect
将所有 for 循环转换为 numba 或 cython 代码。 python 中的循环非常低效

通过实现上述所有内容，我可能会编写速度提高大约 100 倍的 C++ 代码。在我的 C++ 小经验中，它总是比 cython 或 numpy 的任何优化都快。但 C++ 是一个不同的问题。

我试过但更糟的是:

对范围进行排序而不对 a 进行排序。与提问者的版本相比，时间增加了 4 倍。很可能是由于代码的复杂性要高得多
用数字除以最大数来猜测二分法。然后在附近用二分法搜索。比提问者的版本快，但比具有预先计算间隔的最终版本慢。
使用字典而不是列表。更糟

代码的行分析器:

Line #      Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     1                                            def f0_4(a, ranges, n_pre_b):
     2         1    6465309.0 6465309.0     39.8      a.sort()
     3         1       3088.0    3088.0      0.0      blen = [x*len(a)//n_pre_b for x in range(n_pre_b)]
     4         1       4661.0    4661.0      0.0      b1 = [a[i] for i in blen]
     5         1          4.0       4.0      0.0      blen.append(len(a))
     6         1          1.0       1.0      0.0      b1.append(a[-1])
     7         1          1.0       1.0      0.0      res = []
     8   1000001     540421.0       0.5      3.3      for low, up in ranges: 
     9   1000000    1180737.0       1.2      7.3          low_pre_b_i = bisect.bisect_left(b1,low)
    10   1000000     608838.0       0.6      3.7          lo = blen[low_pre_b_i-1]
    11   1000000     490782.0       0.5      3.0          hi = blen[low_pre_b_i]
    12   1000000    2064953.0       2.1     12.7          l = bisect.bisect_left(a, low, lo=lo, hi=hi)
    13   1000000    1212568.0       1.2      7.5          high_pre_b_i = bisect.bisect_left(b1,up)
    14   1000000     606433.0       0.6      3.7          lo = blen[high_pre_b_i-1]
    15   1000000     492544.0       0.5      3.0          hi = blen[high_pre_b_i]
    16   1000000     460683.0       0.5      2.8          if l > lo:
    17        54        103.0       1.9      0.0              res.append(bisect.bisect_right(a, up, lo=l, hi=hi)-l)
    18                                                   else:
    19    999946    2132459.0       2.1     13.1              res.append(bisect.bisect_right(a, up, lo=lo, hi=hi)-l)
    20                                                   
    21         1          1.0       1.0      0.0      return res

关于python - TLE 计算列表中指定范围内的元素数量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59211140/

26

4

0

文章推荐： r - 在R中快速生成数字序列的方法

文章推荐： arrays - 在 Haskell 中就地修改数组？

文章推荐： .net - .net 中的高性能文本文件解析

文章推荐： sql - 关于 Oracle Explain Plan 成本的问题

jQuery - "each"范围内？
我有三个 td，并且正在尝试将每个内部的函数限制为仅该 td。我该怎么做呢？使用此代码，它会获取所有 3 个图像并将它们全部插入到 h2 之前: jQuery("td.frontpage_news")
excel - 大约在 Excel 范围内？
这是所需的通用公式:if((b2-b1)=c1,True,False但是，我需要 b2-b1约等于 c1 , 在 5 内大约单位(在本例中为秒)。有没有可以处理这个的函数？最佳答案你也可以试试这个
java - 验证变量在 Java 范围内
我有三个整数，作为命令行参数传入后赋值给变量。我想验证每个整数都在 1-5 范围内。有没有一种方法可以在不使用如下所示的 if 语句的情况下在 Java 中完成此操作？我想避免这样做(注意伪代码):
Javascript:检查一个数字是否在另一个数字的 n 范围内
检查某个变量 X 是否在某个变量 Z 的 n 个数字之内的最简洁方法是什么。n 是任意定义的数字(即 3)。所以我想要 if (z {something} x){ // run code i
Gradle 全局变量不在 buildscript 范围内
我的顶级 build.gradle (Gradle 2.2) 中有类似的东西 ext.repo = "https://my-artifactory-repo" buildscript { re
java - 如何在jsp中将请求对象存储在 session 范围内
我只是在我的 jsp 页面中进行随机技巧和测试。我想使用 Attributes 将 request 范围对象存储在 session 范围对象中。存储后，当尝试从请求属性中提取值(存储在 session
java - 如何将属性值保留在 session 范围内？
我正在使用 Spring 。我有一个外部化属性文件。我正在按如下方式加载它。现在我如何将 session 中的属性作为键值对保存？我尝试编写一个扩展 ServletContextListene
mysql - 获取行数在内连接 rails 范围内
我有以下范围: scope :billable, -> (range_start = nil, range_end = nil) { joins(:bids) .where("au
c# - 如何检测对象是否在 'using' 范围内？
请看我的示例代码: var testObject = new SomeClass(); using (testObject) { //At this point how can the te
c++ - 如何保持在 vector 范围内？
我目前在保持在 vector 范围内时遇到一些问题。在下面的代码中，我试图检查正在检查的数字是否小于或等于它后面的数字 #include #include #include bool fun(
javascript - 迷失在 javascript 范围内
有人可以帮我解决下面的(简化的)代码吗？我试图从幻灯片事件函数中调用 doTheSlide() 函数。我对 JS 范围的理解仍然有点可疑。实现这一目标的正确方法是什么？我收到此错误: Uncaugh
ios - 检查时间是否在 Swift 范围内
如何在 Swift 中检查时间是否在下午 6 点到晚上 11 点之间？我在使用 NSDateFormatter 时遇到了困难，我觉得一定有更简单的方法。最佳答案使用NSCalendar: let
c++ - 将世界保持在视口(viewport)范围内
我目前正在尝试创建一个 2D 横向滚动条，并且我目前有我的“世界”绘图(暂时是一个大白框)，但我无法弄清楚世界地图的边缘与边缘之间的任何关系确保视口(viewport)始终完全被 map 覆盖。我的
c++ - 模板声明不能出现在 block 范围内
我正在学习李普曼，而且我只是在学习。我在这里尝试编写一个代码，该代码将返回 vector 中的最小元素。当我在 Codeblocks 中编译我的代码时，它说:“模板声明不能出现在 block 范围内”
javascript - 范围内 JS 日期对象的百分比
我有三个日期对象。我该如何比较它们才能确定它们之间的相对差异。 oldDate = newDate() - 5; midDate = newDate() - 2.5; newDate = newDat
javascript - 检查变量是否在 Javascript 范围内
我需要检查对象“objCR”是否存在于当前范围内。我尝试使用以下代码。 if(objCR == null) alert("object is not defined"); 让我知道哪里错了。最佳答案
java - 检查ipAddress是否在私有(private)范围内
如何检查 IP 地址是否属于私有(private)类别？ if(isPrivateIPAddress(ipAddress)) { //do something } 如有
javascript - 如何查看用户选择是否在 HTML 范围内
我正在开发一个 Firefox 插件，它可以转换用户通过用户选择突出显示的屏幕温度。转换后，用户选择将替换为 ID 为 alreadyconverted 的 span HTML 元素，其中包含原始温度
Python:有效地检查整数是否在 *many* 范围内
我正在开发一个邮资应用程序，该应用程序需要根据多个邮政编码范围检查整数邮政编码，并根据邮政编码匹配的范围返回不同的代码。每个代码都有多个邮政编码范围。例如，如果邮政编码在 1000-2429、254
excel - 在 Excel 范围内 - 忽略空单元格
我正在使用 excel 范围进行连接:Set rng = Range("A1:A8")如果范围内的单元格之一为空，则会添加一个空格。你如何阻止这个空间被添加？最佳答案假设您在那些非空单元格中有常

首页

博学

6Ren·AI

商城

python - TLE 计算列表中指定范围内的元素数量