- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我想用新实体压缩实体列表以生成坐标列表(二元组),但我想确保对于 (i, j) i < j 始终为真。
但是,我对目前的解决方案不是很满意:
from itertools import repeat
mems = range(1, 10, 2)
mem = 8
def ij(i, j):
if i < j:
return (i, j)
else:
return (j, i)
def zipij(m=mem, ms=mems, f=ij):
return map(lambda i: f(i, m), ms)
def zipij2(m=mem, ms=mems):
return map(lambda i: tuple(sorted([i, m])), ms)
def zipij3(m=mem, ms=mems):
return [tuple(sorted([i, m])) for i in ms]
def zipij4(m=mem, ms=mems):
mems = zip(ms, repeat(m))
half1 = [(i, j) for i, j in mems if i < j]
half2 = [(j, i) for i, j in mems[len(half1):]]
return half1 + half2
def zipij5(m=mem, ms=mems):
mems = zip(ms, repeat(m))
return [(i, j) for i, j in mems if i < j] + [(j, i) for i, j in mems if i > j]
上面的输出:
>>> print zipij() # or zipij{2-5}
[(1, 8), (3, 8), (5, 8), (7, 8), (8, 9)]
而不是通常:
>>> print zip(mems, repeat(mem))
[(1, 8), (3, 8), (5, 8), (7, 8), (9, 8)]
时间:被删减(不再相关,在下面的答案中查看更快的结果)
对于 len(mems) == 5
,任何解决方案都没有真正的问题,但是对于 zipij5() 例如,当i > j
对于第一次理解的人来说已经被评估为 True
。
就我的目的而言,我确信 len(mems)
永远不会超过 ~10000,如果这有助于形成最佳解决方案的任何答案。为了稍微解释一下我的用例(我觉得很有趣),我将存储一个稀疏的上三角相似矩阵,所以我需要坐标 (i, j)
来避免在 (j, i)
处被复制。我说 of sorts 是因为我将利用 2.7 中新的 Counter()
对象来执行准矩阵-矩阵和矩阵-向量加法。然后我简单地向 counter_obj.update()
提供一个二元组列表,它会增加这些坐标出现的次数。令我沮丧的是,对于我的用例,SciPy 稀疏矩阵的运行速度慢了大约 50 倍......所以我很快就放弃了它们。
所以无论如何,我对我的结果感到惊讶......我想到的第一个方法是 zipij4
和 zipij5
,但它们仍然是最快的,尽管构建一个普通的 zip()
,然后在更改值后生成一个新的 zip。相对而言,我对 Python 还是比较陌生(Alex Martelli,你能听到我说话吗?),所以这是我天真的结论:
tuple(sorted([i, j]))
非常昂贵(为什么?)map(lambda ...)
似乎总是比 list comp 做得更差(我想我已经读过这个并且它是有道理的)zipij5()
并没有慢多少。 (这是为什么?)最后,我想知道哪种方法被认为是最有效的……或者是否还有其他我还没有想到的快速且不占用内存的方法。谢谢。
## Most BRIEF, Quickest with UNSORTED input list:
## truppo's
def zipij9(m=mem, ms=mems):
return [(i, m) if i < m else (m, i) for i in ms]
## Quickest with pre-SORTED input list:
## Michal's
def zipij10(m=mem, ms=mems):
i = binsearch(m, ms) ## See Michal's answer for binsearch()
return zip(ms[:i], repeat(m)) + zip(repeat(m), ms[i:])
# Michal's
Presorted - 410µs per loop
Unsorted - 2.09ms per loop ## Due solely to the expensive sorted()
# truppo's
Presorted - 880µs per loop
Unsorted - 896µs per loop ## No sorted() needed
计时使用 mems = range(1, 10000, 2)
,其长度仅为 ~5000。 sorted()
可能会在更高的值和更困惑的列表中变得更糟。 random.shuffle()
用于“未排序”计时。
最佳答案
(在我的机器上使用 Python 2.6.4 发布时最快。)
更新 3:由于我们要全力以赴,所以让我们进行二进制搜索——以一种不需要将 m
注入(inject) mems
的方式:
def binsearch(x, lst):
low, high = -1, len(lst)
while low < high:
i = (high - low) // 2
if i > 0:
i += low
if lst[i] < x:
low = i
else:
high = i
else:
i = high
high = low
return i
def zipij(m=mem, ms=mems):
i = binsearch(m, ms)
return zip(ms[:i], repeat(m)) + zip(repeat(m), ms[i:])
这在我的机器上运行 828 µs = 0.828 毫秒,而 OP 当前解决方案的运行时间为 1.14 毫秒。假定输入列表已排序(当然,测试用例是通常的)。
此二分搜索实现返回给定列表中第一个元素的索引,该索引不小于要搜索的对象。因此,无需将 m
注入(inject) mems
并对整个事物进行排序(就像在 OP 当前的 .index(m)
解决方案中一样)或逐步遍历列表的开头(就像我之前所做的那样)以找到应该划分的偏移量。
这个怎么样? (在下面的 In [25]
旁边提出的解决方案,从 2.42 毫秒到 zipij5 的 3.13 毫秒。)
In [24]: timeit zipij5(m = mem, ms = mems)
100 loops, best of 3: 3.13 ms per loop
In [25]: timeit [(i, j) if i < j else (j, i) for (i, j) in zip(mems, repeat(mem))]
100 loops, best of 3: 2.42 ms per loop
In [27]: [(i, j) if i < j else (j, i) for (i, j) in zip(mems, repeat(mem))] == zipij5(m=mem, ms=mems)
Out[27]: True
更新:这似乎与 OP 的 self 回答一样快。不过,看起来更直接。
更新 2:实现 OP 提议的简化解决方案:
def zipij(m=mem, ms=mems):
split_at = 0
for item in ms:
if item < m:
split_at += 1
else:
break
return [(item, m) for item in mems[:split_at]] + [(m, item) for item in mems[split_at:]]
In [54]: timeit zipij()
1000 loops, best of 3: 1.15 ms per loop
此外,truppo 的解决方案在我的机器上运行时间为 1.36 毫秒。我想以上是迄今为止最快的。注意在将它们传递给此函数之前,您需要对mems
进行排序!如果您使用 range
生成它,那么它当然已经排序了。
关于python - Python 中成对列表中坐标对(2 元组)的高效重新排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2153976/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!