python - 如何在 cython 中执行 struct.pack 和 struct.unpack？-6ren

python - 如何在 cython 中执行 struct.pack 和 struct.unpack？

转载作者：太空狗更新时间：2023-10-30 00:50:13

25

4

我正在尝试将 python 模块转换为 cython，它做了很多序列化和反序列化工作。

目前我必须这样做:

import struct

from libc.stdint cimport (
    int32_t,
    int64_t,
)

cpdef bytes write_int(int32_t i):
    return struct.pack("!i", i)

cpdef bytes write_long(int64_t i):
    return struct.pack("!q", i)

cdef bytes write_double(double val):
    return struct.pack("!d", val)

cdef bytes write_string(bytes val):
    cdef int32_t length = len(val)
    cdef str fmt
    fmt = "!i%ds" % length
    return struct.pack(fmt, length, val)

c lib 中是否有等同于 struct.pack 和 struct.unpack 的东西？在 cython 中执行此类操作的最佳方法是什么？

最佳答案

我查看了模块( this 和 this )并将代码翻译成 Cython 并删除了 PyObject 部分。理论上这应该可行，但有些部分(如 float 部分)我无法严格测试:

一些导入:

from cpython.array cimport array, clone
from libc.string cimport memcmp, memcpy
from libc.math cimport frexp, ldexp
from libc.stdint cimport int32_t, int64_t

使用融合类型保存一些代码。它在技术上不是一个稳定的功能，但它对我来说完美无瑕:

ctypedef fused integer:
    int32_t
    int64_t

这部分测试机器的字节顺序。它对我有用，但这不是一个完整的套件。 OTOH，看起来不错

cdef enum float_format_type:
    unknown_format,
    ieee_big_endian_format,
    ieee_little_endian_format

# Set-up
cdef array stringtemplate = array('B')
cdef float_format_type double_format

cdef double x = 9006104071832581.0

if sizeof(double) == 8:
    if memcmp(&x, b"\x43\x3f\xff\x01\x02\x03\x04\x05", 8) == 0:
        double_format = ieee_big_endian_format
    elif memcmp(&x, b"\x05\x04\x03\x02\x01\xff\x3f\x43", 8) == 0:
        double_format = ieee_little_endian_format
    else:
        double_format = unknown_format

else:
    double_format = unknown_format;

(stringtemplate 用于快速生成bytes 对象)

这部分很简单:

cdef void _write_integer(integer x, char* output):
    cdef int i
    for i in range(sizeof(integer)-1, -1, -1):
        output[i] = <char>x
        x >>= 8

cpdef bytes write_int(int32_t i):
    cdef array output = clone(stringtemplate, sizeof(int32_t), False)
    _write_integer(i, output.data.as_chars)
    return output.data.as_chars[:sizeof(int32_t)]

cpdef bytes write_long(int64_t i):
    cdef array output = clone(stringtemplate, sizeof(int64_t), False)
    _write_integer(i, output.data.as_chars)
    return output.data.as_chars[:sizeof(int64_t)]

array 类似于 malloc 但它是垃圾回收的:)。

这部分我基本上不知道。我的“测试”通过了，但这主要是希望:

cdef void _write_double(double x, char* output):
    cdef:
        unsigned char sign
        int e
        double f
        unsigned int fhi, flo, i
        char *s

    if double_format == unknown_format or True:
        if x < 0:
            sign = 1
            x = -x

        else:
            sign = 0

        f = frexp(x, &e)

        # Normalize f to be in the range [1.0, 2.0)

        if 0.5 <= f < 1.0:
            f *= 2.0
            e -= 1

        elif f == 0.0:
            e = 0

        else:
            raise SystemError("frexp() result out of range")

        if e >= 1024:
            raise OverflowError("float too large to pack with d format")

        elif e < -1022:
            # Gradual underflow
            f = ldexp(f, 1022 + e)
            e = 0;

        elif not (e == 0 and f == 0.0):
            e += 1023
            f -= 1.0 # Get rid of leading 1

        # fhi receives the high 28 bits; flo the low 24 bits (== 52 bits)
        f *= 2.0 ** 28
        fhi = <unsigned int>f # Truncate

        assert fhi < 268435456

        f -= <double>fhi
        f *= 2.0 ** 24
        flo = <unsigned int>(f + 0.5) # Round

        assert(flo <= 16777216);

        if flo >> 24:
            # The carry propagated out of a string of 24 1 bits.
            flo = 0
            fhi += 1
            if fhi >> 28:
                # And it also progagated out of the next 28 bits.
                fhi = 0
                e += 1
                if e >= 2047:
                    raise OverflowError("float too large to pack with d format")

        output[0] = (sign << 7) | (e >> 4)
        output[1] = <unsigned char> (((e & 0xF) << 4) | (fhi >> 24))
        output[2] = 0xFF & (fhi >> 16)
        output[3] = 0xFF & (fhi >> 8)
        output[4] = 0xFF & fhi
        output[5] = 0xFF & (flo >> 16)
        output[6] = 0xFF & (flo >> 8)
        output[7] = 0xFF & flo

    else:
        s = <char*>&x;

        if double_format == ieee_little_endian_format:
            for i in range(8):
                output[i] = s[7-i]

        else:
            for i in range(8):
                output[i] = s[i]

如果你能理解它是如何工作的，一定要自己检查一下。

然后我们像以前一样包装它:

cdef bytes write_double(double x):
    cdef array output = clone(stringtemplate, sizeof(double), False)
    _write_double(x, output.data.as_chars)
    return output.data.as_chars[:sizeof(double)]

string one 其实很简单，解释了为什么我要像上面那样设置它:

cdef bytes write_string(bytes val):
    cdef:
        int32_t int_length = sizeof(int32_t)
        int32_t input_length = len(val)
        array output = clone(stringtemplate, int_length + input_length, True)

    _write_integer(input_length, output.data.as_chars)
    memcpy(output.data.as_chars + int_length, <char*>val, input_length)

    return output.data.as_chars[:int_length + input_length]

关于python - 如何在 cython 中执行 struct.pack 和 struct.unpack？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23108356/

25

4

0

文章推荐： python - 是否可以在 virtualenv 中安装 supervisord？

文章推荐： c# - 为什么所有 Glass.Mapper 字段都应该是虚拟的？

文章推荐： python - 如何将装饰器应用到每个 Flask View

arrays - 冷聚变 8 : Array of structs to struct of structs
我有一个数组 items[] items[] 中的每一项都是一个结构体。 item 有键 id、date、value(即 item.id、item.date、item.value) 我想使用 Stru
[Array of Struct in [Array of Struct in [Array of Struct ]]] 中的结构体动态数组
我想存储 100 名员工。 RollNo，姓名，工资，时间(各种数据，我无法在这里解释，但你可以看下面的代码片段来理解 main() { struct day { int hour
c++ - typedef struct 与 struct - ‘struct' 的存储大小未知
这个问题在这里已经有了答案: storage size of ‘names’ isn’t known (3 个答案) 关闭 5 年前。我正在尝试蓝牙编程，遇到了这个我不明白的问题。基本上，当我使用
C struct->struct->struct->element(通常)段错误
这是一个奇怪的事情: 我有一个结构，它包含指向相同类型结构的指针和指向其他类型结构的指针，以及一些其他值。 struct animal { struct animal * father;
C指针问题: &(*struct->struct)
我有一个结构定义如下(名称不同) struct str1 { int field1; struct str2; } 我在一个函数中有一个*str1。我想要一个指向 str2 的指针。所以
c - struct { ... } 和 struct { union { struct { ... } } } 有什么区别？
DISK_DETECTION_INFO is defined as有什么原因吗？ typedef struct _DISK_DETECTION_INFO { DWORD Size
尝试保存字节顺序时的 Python struct.pack() 'struct.error: bad char in struct format'
我正在尝试打包一个字符串和一个字符串的长度。 fmt = '
swift 4 : struct in struct
我在创建结构时遇到问题。我的结构: public struct Device: Codable { let data: DeviceData let meta: Meta? } pu
struct - 如何为 Struct 成员赋值？
struct Item { var name:String? var type:String? var value:Int? var tag:Int? } ... ..
struct - 星号(* struct)符号在golang中是什么意思
// NewReaderSize returns a new Reader whose buffer has at least the specified 43 // size. If the ar
C++:根据 struct 的整数之一对 vector (其中 struct 有 2 个整数)进行排序
这个问题在这里已经有了答案: Sorting a vector of custom objects (14 个答案) 关闭 3 年前。在下面的 C++ 片段中，如何基于 TwoInts 结构中的
c++ - struct S { int align; 之间的区别}; (在 struct 关键字之后命名)和 struct { int align; } S; (结构定义后的名称)
#include struct Header { unsigned long long int alignment; }; int main(void) { struct Heade
c - struct 中带有 struct 参数的函数指针
我有一个目前看起来像这样的结构(缩写为仅显示基本部分): typedef struct { uint32_t baudrate; ... some other internally u
c# - Struct inside Struct，能够改变内部Struct类型
对此没有太多解释，这就是我所拥有的: public struct PACKET_HEADER { public string computerIp; publi
Rust:为什么在 struct 中借用引用会借用整个 struct？
我有以下代码: struct MyStruct{ data: &'a str, } fn get(S: &'a MyStruct) -> &'a str{ S.data } fn se
c - struct 内部的 sizeof struct
struct S1 { char c; int i; }; struct S3 { char c1; struct S1 s; double c2; }; 我正
struct - 有没有办法隐藏 Swift Struct 的默认初始化程序？
我有一个名为 Parameter 的协议(protocol): protocol Parameter { var name: String { get } var unit: Unit
c - "struct inside struct"中的限制
有 2 个 struct 定义 A 和 A。我知道 struct A 可以包含指向 struct A 的 POINTER 但我不明白为什么 struct A 不能包含struct A(不是指针) 最佳
Rust:为什么在 struct 中借用引用会借用整个 struct？
我有以下代码: struct MyStruct{ data: &'a str, } fn get(S: &'a MyStruct) -> &'a str{ S.data } fn se
struct - 你如何获得 struct-copy 来创建一个与原始类型相同的结构？
为了说明这一点，这里有一个小的不可变结构和一个更新它的函数: (struct timeseries (variable observations) #:transparent) (define (ad

首页

博学

6Ren·AI

商城

python - 如何在 cython 中执行 struct.pack 和 struct.unpack？