- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是python的新手,我想要一个包含2个元素的列表,第一个是0到20亿之间的整数,另一个是0到10之间的数字。我有很多这样的列表(十亿)。
假设我使用chr()函数为列表添加第二个参数。例如:
first_number = 123456678
second_number = chr(1)
mylist = [first_number,second_number]
{1: [[2, 1], [3, 1], [4, 2], [5, 1]], 2: [[5, 1]], 3: [[5, 2]], 4: [[6, 1]], 5: [[6, 1]]}
最佳答案
使用单个字符串将占用与一个小整数几乎相同的内存量,因为CPython只会创建每个值的一个对象,并在每次需要该字符串或该值的整数时使用该对象。使用字符串会占用更多的空间,但这并不重要。
但是让我们回答您真正的问题,如何减少Python程序使用的内存量?首先,我将计算您要创建的对象将使用多少内存。我使用的是Python 2.7的64位版本,但我的其他64位版本的Python应该与此相似。
首先,您只有一个dict
对象,但是它有2500万个节点。对于此大小的命令,Python将使用2 ^ 26个哈希存储桶,每个存储桶为24个字节。 dict本身约为1.5 GB。
该字典将具有2500万个键,所有键均为int
对象,每个键均为24个字节。对于代表节点的所有整数,总计约570 MB。它还将具有2500万个list
对象作为值。每个列表将占用72个字节,加上列表中每个元素8个字节。这些列表将总共有20亿个元素,因此它们总共将占用16.6 GB。
这20亿个列表元素中的每一个都将引用另一个长度为两个元素的list
对象。高达164 GB。两个元素列表中的每一个都将引用两个不同的int
对象。现在好消息是,虽然看起来总共有大约40亿个整数对象,但实际上实际上只有20亿个不同的整数对象。对于第二个元素中使用的每个小整数值,只会创建一个对象。因此,第一个元素所引用的整数对象使用的总内存为44.7 GB。
计划实现该数据结构时,至少需要227 GB的内存。重新查看该列表,我将解释如何将其减少您需要的内存,以使其更实用。
代表两个元素边缘列表中的节点的int
对象使用的44.7 GB内存是最容易处理的。由于只有2500万个节点,因此您不需要20亿个不同的对象,每个节点值只需要一个对象。另外,由于您已经将节点值用作键,因此可以重复使用这些对象。这样就达到了44.7 GB,并且根据您构建数据结构的方式,可能不会花费很多精力来确保仅创建冗余节点值对象。这样一来,总容量将降至183 GB。
接下来,我们解决所有两个元素边缘list
对象所需的164 GB。您可以共享碰巧具有相同节点值和权重的列表对象,但可以做得更好。通过展平列表列表,消除所有边缘列表。您必须对算术元素进行一些算术访问,但是除非您的系统具有大量内存,否则必须做出让步。用作dict值的list
对象的长度必须加倍,将其总大小从16.1 GB增加到31.5 GB。这样,将列表平坦化就可以节省149 GB的净资金,使总容量减少到更合理的33.5 GB。
比这更复杂。一种可能性是使用数组。与列表不同,它们的元素不引用其他对象,该值存储在每个元素中。 array.array
对象的长度为56个字节,再加上元素的大小(在这种情况下为32位整数)。总共可增加16.2 GB,可节省15.3 GB。现在总大小仅为18.3 GB。
通过利用您的权重是适合单字节字符的小整数这一事实,可以压缩更多的空间。为每个节点创建两个array.array
对象,一个为节点值创建32位整数,另一个为权重创建8位整数。因为现在有两个数组对象,所以使用tuple
对象保存该对。所有这些对象的总大小为13.6 GB。与单个数组相比,这并不是一个很大的节省,但是现在您不需要任何算法即可访问元素,只需切换索引方式即可。总大小为15.66 GB。
最后,我能想到的节省内存的最后一件事就是只有两个array.array
对象。然后,dict值成为引用两个tuple
对象的int
对象。第一个是两个数组的索引,第二个是长度。这种表示方式占用了11.6 GB的内存,又有一个小的净减少,总内存为13.6 GB。
最终的总计13.6 GB应该可以在具有16 GB RAM的机器上工作,而无需进行太多交换,但是它不会为其他任何东西留出太多空间。
关于python - 使用chr()时的python内存分配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25353792/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!