- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 python 中有一个相当大的字节数组。在最简单的情况下,字节数组仅包含 0 或 1 个值(0x00、0x01),并且数组长度始终是 8 的倍数。如何将这些“位”打包到另一个字节数组中(它不需要是可变的),以便源索引零转到第一个输出字节的 MSB 等。
例如,如果 src = bytearray([1,0,0,0,1,0,0,1, 1,1,1,0,0,0,1,0, 1,1, 1,1,1,1,1,1])
所需的输出为 b'\x89\xe2\xff'
。
我可以使用 for 循环、位移位、或运算和连接来完成此操作,但肯定有更快/更好的内置方法来完成此操作。
在后续问题中,我可能还希望源字节数组包含集合 0-3 中的值,并将这 4 个值一次打包到输出数组中。有办法做到这一点吗?
一般来说,有没有一种方法可以将列表的元素解释为 true 或 false,并将它们一次打包为 8 个字节数组?
最佳答案
尽管听起来很荒谬,但使用内置函数的最快解决方案可能是构建一个字符串并将其传递给 int
,就像计算 int
中 1 位的最快方法一样是 bin(n).count('1')
。而且它也非常简单:
def unbitify_byte(src):
s = ''.join(map(str, src))
n = int(s, 2)
return n.to_bytes(len(src)//8, 'big')
使用 gmpy2
的等效(但稍微复杂一些)代码而不是原生 Python int
有点快。
您可以轻松地将其扩展为 2 位值:
def unhalfnybblify_byte(src):
s = ''.join(map(str, src))
n = int(s, 4)
return n.to_bytes(len(src)//4, 'big')
<小时/>
如果您想要更灵活但可能更慢的东西,这里有一个简单的解决方案,使用 ctypes
.
如果您了解 C,您可能会发现 8 个单位位字段的结构在这里会派上用场。您可以在 Python 中编写等效的结构类型,如下所示:
class Bits(ctypes.Structure):
_fields_ = [(f'bit{8-i}', ctypes.c_uint, 1) for i in range(8)]
您可以用 8 个全为 0 或 1 的整数构造其中一个:
bits = Bits(*src[:8])
您可以使用丑陋的强制转换或简单的联合将其转换为单个 int:
class UBits(ctypes.Union):
_fields_ = [('bits', Bits), ('i', ctypes.c_uint8)]
i = UBits(Bits(*src[:8])).i
所以现在只是分块的问题 src
按大端顺序分成 8 组:
chunks = (src[i:i+8][::-1] for i in range(0, len(src), 8))
dst = bytearray(UBits(Bits(*chunk)).i for chunk in chunks)
如何将其扩展为每个字节四个 2 位字段、或两个 4 位字段、甚至两个 3 位字段和一个 2 位字段应该是非常明显的。
但是,尽管看起来像低级 C 代码,但它可能会更慢。不过,可能值得测试一下它是否足够快适合您的使用。
<小时/>自定义 C 扩展可能可以做得更好。 PyPI 上有许多位数组类型的模块可供尝试。但如果你想走那条路,numpy
是显而易见的答案。没有比这更简单的了:
np.packbits(src)
(A bytearray
作为“类似数组”工作得很好。)
它的速度也很难被击败。
<小时/>为了进行比较,这里有一些测量结果:
np.packbits
在array
上而不是bytearray
np.packbits
for
并使用 PyPy 而不是 CPython 进行一些操作int(…, 2).to_bytes(…)
使用 PyPy 而不是 CPythonbitarray
gmpy.mpz(…)…
int(…, 2).to_bytes(…)
(UBits(Bits(*chunk)) …)
for
和一些小事关于python - 如何在 python3 中有效地将位从一个字节数组打包到另一个字节数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51373302/
我在使用 nuget 打包新包时遇到问题,因为当我通过命令行指定版本时,它会将它应用于包而不是依赖项。即 NuGet.exe pack myproject.csproj -Version 3.0.4.
考虑这个简短的例子: $a = pack("d",255); print length($a)."\n"; # Prints 8 $aa = pack("ddddd", 255,123,0,45,12
我有一个我想要的无符号整数数组(32 位) pack 成二进制流: my @n = (4,8,15,16,23,42); my $foo = join('', map(pack('I', $_), @
在我的工作中,我们必须在各种环境中部署应用程序。这是一个标准的 WAR 文件,需要一些配置,部署在 Tomcat 6 上。 有没有什么方法可以使用 Tomcat 创建一个“部署包”,以便您只需提取它并
我正在编写一个简单的数据包序列化程序,但我很难为我的数据包创建 header 。我正在创建一个缓冲区,然后尝试将前两项加载到缓冲区中。我运行 memcopy 但缓冲区中实际上没有任何内容,然后当我尝试
有人可以解释为什么当你有一个普通的小部件时,一行代码 A 可以工作 Entry(root, width=10).pack(side=LEFT,anchor=W) 但是当你给它命名或附加命令时,代码 A
我正在尝试使用this tutorial构建Python包。这是文件夹结构: testpackage\ testpackage\ __init__.py
我有 JFrame 和 GridBagLayout。用户可以调整此窗口的大小。此外,他还可以执行一些更改窗口大小的编辑操作。我使用 pack(); repaint(); 现在在这样的操作之后。但是,实
我有一个现实世界的问题,我认为需要某种优化,而不是对我关心的数据数组进行简单排序。我将在下面概述问题: 我有一个由不同设备组成的数据集,每个设备都有属性 A 和 B。A 和 B 彼此不依赖,但是,我想
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我必须将旧的“加密”数据从旧系统转换为适当的加密算法。我有这段代码: function unpackString($s,$l){ $tmp=unpack('c'.$l,$s);
我有两个发电机。第一个生成器有时需要调用第二个生成器并返回它从那里获得的值: def a(): for _b in b(): yield _b def b(): yie
首先:对不起,我知道有很多关于相对导入的问题,但我只是没有找到解决方案。如果可能的话,我想使用以下目录布局: myClass/ __init__.py test/ de
1 ambari + bigtop 构建大数据基础平台 1.1 参考: 1.2 参考 amabri bigtop 打包部署
所以 SimpleInjector 现在有一个包装 nuget,您可以使用它来隔离根组合的不同方面。 假设我在一个库中有一个可配置的组合根,它被应用程序中的多个项目重用。例如,在 Azure 解决方案
我想以易于分发的形式打包 Groovy CLI 应用程序,类似于 Java 对 JAR 所做的。我一直无法找到任何似乎能够做到这一点的东西。我发现了一些类似 this 的东西用于一次性脚本,但不能编译
目前 ZMI 管理“打包数据库”的功能有点粗糙。 1) 是否有可能为 Web UI 提供某种进度指示器?例如。一个告诉你还剩多少分钟/小时,至少给出某种估计 2) ZODB 打包如何影响站点的响应性?
我有一个看起来像这样的结构: struct vdata { static_assert(sizeof(uint8_t *) == 8L, "size of pointer must be 8");
我已经尝试打包/发布我的 Azure 项目有一段时间了(但没有成功)。我尝试过以下方法: 右键单击 -> 从 Visual Studio 打包/发布 (OutOfMemoryException) CS
我创建了一个 JavaScript 库,并将其打包为以下选定的选项:Shrink Variables和Base62 Encoded在这个网址:http://dean.edwards.name/pack
我是一名优秀的程序员,十分优秀!