- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有一个未排序的列表 a
和一个范围列表,如 ranges = [(10, 20), (30, 50), (15, 35) ...]
。 a
中的最大值为 uint64_t
。目标是计算每个范围的元素数量。正常的解决方案非常直观,只需统计范围内的元素并打印结果即可。但是问题来自在线法官。我厌倦了几个解决方案,但对于每个解决方案,OJ 都给出了超出时间限制。
a
的最大长度为 10,000,000,ranges
的最大长度为 1,000,000。
具有 1000 万个随机数的测试列表 a
和具有 100 万对范围的 ranges
:
import numpy as np
a = list(np.random.randint(low=1, high=0x7fffffffffffffff, size=10_000_000))
ranges = []
for _ in range(1_000_000):
x, y = np.random.randint(low=1, high=0x7fffffffffffffff, size=2)
ranges.append((x, y) if x < y else (y, x))
第一种解决方案是:
import bisect
a.sort()
low_d = {}
up_d = {}
def count(r):
low, up = r
if low not in low_d:
l = bisect.bisect_left(a, low)
low_d[low] = l
else:
l = low_d[low]
if up not in up_d:
u = bisect.bisect_right(a, up, lo=l)
up_d[up] = u
else:
u = up_d[up]
return u - l
result = [*map(count, ranges)]
缺点很明显,当a
非常大时,sort()
非常耗时。
The original second solution is much slower than the above solution.
Abandoned.
两种解决方案都会导致 TLE 错误。我使用的OJ就像一个黑盒子,我不知道它用来测试程序的测试例子。
由于程序运行在OJ上,所以不允许使用numpy
。
有什么方法可以优化性能吗?
最佳答案
我设法将机器上的时间从 13.1 秒减少到 11.2 秒
我的最终代码:
from bisect import bisect_left, bisect_right
def f0_4(a, ranges, n_pre_b):
a.sort()
blen = [x*len(a)//n_pre_b for x in range(n_pre_b)]
b1 = [a[i] for i in blen]
blen.append(len(a))
b1.append(a[-1])
res = []
for low, up in ranges:
low_pre_b_i = bisect_left(b1,low)
lo = blen[low_pre_b_i-1]
hi = blen[low_pre_b_i]
l = bisect_left(a, low, lo=lo, hi=hi)
high_pre_b_i = bisect_left(b1,up)
lo = blen[high_pre_b_i-1]
hi = blen[high_pre_b_i]
if l > lo:
res.append(bisect_right(a, up, lo=l, hi=hi)-l)
else:
res.append(bisect_right(a, up, lo=lo, hi=hi)-l)
return res
res = f0_4(a,ranges,16384)
什么和为什么:
a
列表预先计算了一些范围。 16384 个预先计算的值是最佳的。这极大地提高了速度bisect.bisect_left
替换为 bisect_left
。 bisect_right
也一样。点调用在 python 中有开销我本来应该做的,但这是违反规则的(如果我错了请纠正我。下面的方法可以将速度提高 100 倍):
通过实现上述所有内容,我可能会编写速度提高大约 100 倍的 C++ 代码。在我的 C++ 小经验中,它总是比 cython 或 numpy 的任何优化都快。但 C++ 是一个不同的问题。
我试过但更糟的是:
a
进行排序。与提问者的版本相比,时间增加了 4 倍。很可能是由于代码的复杂性要高得多代码的行分析器:
Line # Hits Time Per Hit % Time Line Contents
==============================================================
1 def f0_4(a, ranges, n_pre_b):
2 1 6465309.0 6465309.0 39.8 a.sort()
3 1 3088.0 3088.0 0.0 blen = [x*len(a)//n_pre_b for x in range(n_pre_b)]
4 1 4661.0 4661.0 0.0 b1 = [a[i] for i in blen]
5 1 4.0 4.0 0.0 blen.append(len(a))
6 1 1.0 1.0 0.0 b1.append(a[-1])
7 1 1.0 1.0 0.0 res = []
8 1000001 540421.0 0.5 3.3 for low, up in ranges:
9 1000000 1180737.0 1.2 7.3 low_pre_b_i = bisect.bisect_left(b1,low)
10 1000000 608838.0 0.6 3.7 lo = blen[low_pre_b_i-1]
11 1000000 490782.0 0.5 3.0 hi = blen[low_pre_b_i]
12 1000000 2064953.0 2.1 12.7 l = bisect.bisect_left(a, low, lo=lo, hi=hi)
13 1000000 1212568.0 1.2 7.5 high_pre_b_i = bisect.bisect_left(b1,up)
14 1000000 606433.0 0.6 3.7 lo = blen[high_pre_b_i-1]
15 1000000 492544.0 0.5 3.0 hi = blen[high_pre_b_i]
16 1000000 460683.0 0.5 2.8 if l > lo:
17 54 103.0 1.9 0.0 res.append(bisect.bisect_right(a, up, lo=l, hi=hi)-l)
18 else:
19 999946 2132459.0 2.1 13.1 res.append(bisect.bisect_right(a, up, lo=lo, hi=hi)-l)
20
21 1 1.0 1.0 0.0 return res
关于python - TLE 计算列表中指定范围内的元素数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59211140/
SQL 和一般开发的新手,我有一个表(COUNTRIES),其中包含字段(INDEX、NAME、POPULATION、AREA) 通常我添加一个客户端(Delphi)计算字段(DENSITY)和 On
我想使用 calc(100%-100px),但在我的 demo 中不起作用由于高度只接受像素,因此如何将此百分比值转换为像素。 最佳答案 以下将为您提供高度: $(window).height();
我正在尝试在 MySQL 中添加列并动态填充其他列。 例如我有一张表“数字”并具有第 1 列、第 2 列、第 3 列,这些总数应填充在第 4 列中 最佳答案 除非我误解了你的问题,否则你不只是在寻找:
我想返回简单计算的结果,但我不确定如何执行此操作。我的表格如下: SELECT COUNT(fb.engineer_id) AS `total_feedback`, SUM(fb.ra
我一直在尝试做这个程序,但我被卡住了,我仍然是一个初学者,任何帮助将不胜感激。我需要程序来做 打印一个 10 X 10 的表格,其中表格中的每个条目都是行号和列号的总和 包含一个累加器,用于计算所有表
这个计算背后一定有一些逻辑。但我无法得到它。普通数学不会导致这种行为。谁能帮我解释一下原因 printf ("float %f\n", 2/7 * 100.0); 结果打印 1.000000 为什么会
我想计算从 0 到 (n)^{1/2} - 1 的数字的 AND每个数字从 0 到 (n)^{1/2} - 1 .我想在 O(n) 中执行此操作时间,不能使用 XOR、OR、AND 运算。 具体来说,
如何在 Excel 中将公式放入自定义数字格式?例如(出于说明目的随机示例), 假设我有以下数据: 输入 输出 在不编辑单元格中的实际数据的情况下,我想显示单元格中的值除以 2,并保留两位小数: 有没
每次我在 Flutter 应用程序中调用计算()时,我都会看到内存泄漏,据我所知,这基本上只是一种生成隔离的便捷方法。我的应用程序内存占用增加并且在 GC 之后永远不会减少。 我已将我的代码简化为仅调
我有数字特征观察 V1通过 V12用于目标变量 Wavelength .我想计算 Vx 之间的 RMSE列。数据格式如下。 每个变量“Vx”以 5 分钟的间隔进行测量。我想计算所有 Vx 变量的观测值
我正在寻找一种使用 C 语言计算文件中未知字符数的简单方法。谢谢你的帮助 最佳答案 POSIX 方式(可能是您想要的方式): off_t get_file_length( FILE *file ) {
我正在使用 Postgres,并且我正试图围绕如何在连续日期跨度中得出第一个开始日期的问题进行思考。例如 :- ID | Start Date | End Date =================
我有一个订单表格,我在其中使用 jQuery 计算插件来汇总总数。 此求和工作正常,但生成的“总和”存在问题。总之,我希望用逗号替换任何点。 代码的基础是; function ($this) {
我在使用 double 变量计算简单算术方程时遇到问题。 我有一个具有 double 属性 Value 的组件,我将此属性设置为 100。 然后我做一个简单的减法来检查这个值是否真的是 100: va
我在这里看到了一些关于 CRC 32 计算的其他问题。但没有一个让我满意,因此是这样。 openssl 库是否有任何用于计算 CRC32 的 api 支持?我已经在为 SHA1 使用 openssl,
当我在PHP日期计算中遇到问题时,我感到惊讶。 $add = '- 30 days'; echo date('Y-m-01', strtotime($add)); // result is 2017-
我正在使用 javascript 进行练习,我编写了这个脚本来计算 2 个变量的总和,然后在第三个方程中使用这个总和!关于如何完成这项工作的任何想法都将非常有用! First Number:
我有一个来自EAC的提示单和一个包含完整专辑的FLAC文件。 我正在尝试制作一些python脚本来播放文件,因为我需要能够设置在flac文件中开始的位置。 如何从CueSheet格式MM:SS:FF转
这个问题已经有答案了: Adding two numbers concatenates them instead of calculating the sum (24 个回答) 已关闭去年。 我有一个
4000 我需要上面字段 name="quantity" 和 id="price" 中的值,并使用 javascript 函数进行计算,并将其显示在字段 id= 中仅当我单击计算按钮时才显示“总
我是一名优秀的程序员,十分优秀!