python - numpy 通过 ctypes 调用 sse2-6ren

python - numpy 通过 ctypes 调用 sse2

转载作者：太空狗更新时间：2023-10-29 19:28:45

27

4

简而言之，我正在尝试从 python 调用共享库，更具体地说，是从 numpy。共享库是使用 sse2 指令在 C 中实现的。启用优化，即使用 -O2 或 –O1 构建库，我在通过 ctypes 调用共享库时遇到奇怪的段错误。禁用优化 (-O0)，一切都按预期进行，就像将库直接链接到 c 程序(优化或未优化)时的情况一样。您会在附件中找到一个片段，其中展示了我系统上描述的行为。启用优化后，gdb 在 __builtin_ia32_loadupd (__P) at emmintrin.h:113 报告段错误。 __P 的值被报告为优化掉。

测试.c:

#include <emmintrin.h>
#include <complex.h>
void test(const int m, const double* x, double complex* y) {

    int i;
    __m128d _f, _x, _b;
    double complex f __attribute__( (aligned(16)) );
    double complex b __attribute__( (aligned(16)) );
    __m128d* _p;

    b = 1;
    _b = _mm_loadu_pd( (double *) &b );

    _p = (__m128d*) y;

    for(i=0; i<m; ++i) {
        f = cexp(-I*x[i]);
        _f = _mm_loadu_pd( (double *) &f );
        _x = _mm_loadu_pd( (double *) &x[i] );      
        _f = _mm_shuffle_pd(_f, _f, 1);
        *_p = _mm_add_pd(*_p, _f);
        *_p = _mm_add_pd(*_p, _x); 
        *_p = _mm_mul_pd(*_p,_b);
        _p++;
    }
    return;
}

编译器标志:gcc -o libtest.so -shared -std=c99 -msse2 -fPIC -O2 -g -lm test.c

测试.py:

import numpy as np
import os

def zerovec_aligned(nr, dtype=np.float64, boundary=16):
    '''Create an aligned array of zeros.
    '''
    size = nr * np.dtype(dtype).itemsize
    tmp = np.zeros(size + boundary, dtype=np.uint8)
    address = tmp.__array_interface__['data'][0]
    offset = boundary - address % boundary
    return tmp[offset:offset + size].view(dtype=dtype)


lib = np.ctypeslib.load_library('libtest', '.' )
lib.test.restype = None
lib.test.argtypes = [np.ctypeslib.ctypes.c_int,
                     np.ctypeslib.ndpointer(np.float64, flags=('C', 'A') ),
                     np.ctypeslib.ndpointer(np.complex128, flags=('C', 'A', 'W') )]


n = 13
y = zerovec_aligned(n, dtype=np.complex128)
x = np.ones(n, dtype=np.float64)
# x = zerovec_aligned(n, dtype=np.float64)
# x[:] = 1.

lib.test(n,x,y)

从 C 调用测试按预期工作:

call_from_c.c:

#include <stdio.h>
#include <complex.h>
#include <stdlib.h>
#include <emmintrin.h>

void test(const int m, const double* x, double complex* y);

int main() {

    int i; 
    const int n = 11;
    double complex *y = (double complex*) _mm_malloc(n*sizeof(double complex), 16);
    double *x = (double *) malloc(n*sizeof(double));
    for(i=0; i<n; ++i) {
        x[i] = 1;
        y[i] = 0;
    }

    test(n, x, y);
    for(i=0; i<n; ++i)
            printf("[%f %f]\n", creal(y[i]), cimag(y[i]));

    return 1;

}

编译调用:
gcc -std=c99 -otestc -msse2 -L. -ltest call_from_c.c
导出 LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:.
./testc
... 有效。

我的系统:

Ubuntu Linux i686 2.6.31-22-generic
编译器:gcc (Ubuntu 4.4.1-4ubuntu9)
Python:Python 2.6.4(r264:75706，2009 年 12 月 7 日，18:45:15)[GCC 4.4.1]
NumPy :1.4.0

我已经规定(参见 python 代码)y 对齐并且 x 的对齐无关紧要(我认为；显式对齐 x 并不能解决问题)。

另请注意，我在加载 b 和 f 时使用 _mm_loadu_pd 而不是 _mm_load_pd。对于 C-only 版本，_mm_load_pd 有效(如预期)。但是，当使用 ctypes 调用函数时_mm_load_pd 总是段错误(独立于优化)。

我已经尝试了好几天来解决这个问题，但没有成功……我差点把我的显示器打死。欢迎任何输入。丹尼尔

最佳答案

我只是被这个试图从 python 调用一些 SSE 代码所困扰，问题似乎是 GCC 想要假设堆栈在 16 字节边界上对齐(架构上最大的 native 类型，即SSE 类型)，并使用该假设计算所有偏移量。当该假设为假时，SSE 指令将陷入困境。

答案好像是编译用

gcc -mstackrealign

这将函数序言更改为始终将堆栈对齐到 16 个字节。

关于python - numpy 通过 ctypes 调用 sse2，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3045158/

27

4

0

文章推荐： Python 超时脚本杀死线程事件超过 X 秒

文章推荐： forms - Angular 动态表单可观察属性绑定(bind)

文章推荐： angular - 如何保护 .net 核心 API 项目

文章推荐： Java 和空格作为语法(ala Python)？

ctypes - 将 ctypes.c_void_p() 和 ctypes.c_size_t() 转换为字节数组或字符串？
我似乎找不到任何将 ctypes.c_void_p() 转换为字符串或字节数组的简单示例。有没有简单的衬里可以做到这一点？最佳答案给你: import ctypes as ct # set up
python - ctypes.pointer、ctypes.POINTER 和 ctypes.byref 之间有什么区别？
在ctypes中，pointer和byref有什么区别？它们似乎都是将指针传递给函数的一种方式，例如作为输出参数。最佳答案在功能上，它们是等价的。然而，python docs请指出 pointe
ctypes - 有没有办法确保我所有的 ctypes 都有 argtypes？
我知道我应该指定 argtypes对于我的 C/C++ 函数，因为我的某些调用会导致堆栈损坏。 myCfunc.argtypes = [ct.c_void_p, ct.POINTER(ct.c
python - ctypes 数组中元素上的 Ctypes 指针
有没有办法获取指向 ctypes 数组中间元素的指针？示例: lib = ctypes.cdll.LoadLibrary('./lib.so') arr = (ctypes.c_int32 * 100
typo3 - 自定义 CType 与 CType 列表和列表类型
在我自定义的 TYPO3 Extbase 扩展中，我创建了一个后端模块来管理个人记录。现在我需要一个内容元素来在前端显示记录。我看到了两种实现此目的的方法: 使用 CType“list”和自定义 l
python - 如何从 ctypes 数组中获取 ctypes 类型对象
实际上，我正在尝试将 ctypes 数组转换为 python 列表并返回。如果找到this thread 。但它假设我们在编译时知道类型。但是是否可以检索元素的 ctypes 类型？我有一个 p
python - 使用缓冲区更快地转换为 ctypes 对象或从 ctypes 对象转换？
我正在将 float 列表转换为具有以下字段的 ctypes Structure 类，然后再将它们传递给 FFI 函数: FFIArray(Structure): _fields_ = [("
ctypes - 使用 ctypes 将元组的元组从 c 返回到 python
我需要将异质数据的二维数组从我的 c dll 返回到 python。为此目的，我从我的 c dll 返回一个元组的元组。它作为 PyObject 返回 * 这个元组的元组需要作为第一行第一列的 tu
python - 如何访问 ctypes 结构的属性，就好像它们是 ctypes 一样，而不是通过给定的包装器？
这是不一致的: from ctypes import * class S(Structure): _fields_ = [("x", POINTER(c_int)), ("y", c_int)
python - 如何使用基于 ctypes 和 ctypes 的枚举正确调用以 "custom enum"作为参数的函数？
我真的希望一些 Python/Ctypes/C 专家可以帮助我解决这个问题，这可能是我在使用 Python 与 C 库交互时正确使用 Ctypes 的类型结构方面缺乏知识。目标:我需要访问几个使用
python - Ctypes - 从使用 ctypes 的 python 代码获取 C 回溯
我正在尝试调试 python 使用 ctypes 调用 C 函数的代码。我感兴趣的 python 代码中的一行看起来像: returnValue = cfunction() 其中 cfunction
python - 如何在 Python 中模拟使用 ctypes.byref 作为参数之一的 ctypes 函数
我正在开发 DLL/SO 的 Python 包装器。我已经验证了代码可以调用实际的 DLL 和 SO。我想对我的包装器进行单元测试，而不需要安装底层 DLL/SO。我正在考虑使用 mock 。我遇到
Python:ctypes + C malloc 错误。 C 内存问题还是 Python/ctypes 问题？
大家。我在使用 ctypes 和 C 代码时遇到内存分配错误。我想知道内存问题是在 C 内部，还是由 ctypes 使用不当引起的。内存错误是 python(79698) malloc: * erro
python - 如何使用 ctypes.windll.user32.SetWindowsHookExW Hook ctypes.windll.user32.MessageBoxW？
我想制作一个笑话程序，首先它打开一个消息框，关闭后另一个消息框出现在随机位置。它会一直这样重复，直到有什么东西终止了它的任务。使用 tkinter 消息框，那么这些消息框就无法被 Hook ，我必须制
python - 使用 `sys.getsizeof(Var)` 方法与 `ctypes.sizeof(Var)` 的 python 大小的 ctypes
我对 python 中的变量大小有疑问，我使用 Ctypes 因为我想要一个 1 字节的数字，但是当我试图在 python 中检查它的大小时(通过 sys.getsize ) 它说它是 80 字节但是
python - 无法导入模块 'lambda_function' : cannot import name 'WinDLL' from 'ctypes' (/var/lang/lib/python3. 7/ctypes/__init__.py
我正在尝试在 python lambda 函数中使用 matplotlib 生成图形。我使用库 mathplotlib 导入了一个图层，但它不起作用。这个想法是生成一个图形，将其保存为临时文件并上传
python - 使用 ctypes 模块将 blake 哈希函数 C 实现包装到 Python 中，还包括简单的 python ctypes testvector 脚本
我正在尝试使用 C 中的 python ctypes 制作简单的库 blake 哈希函数包装器。但只是为了首先测试我的简单 C 辅助函数是否能正常工作，我编写了小的 python 脚本 blake 哈
go - 以 C 类型作为参数导出函数 [不能在 package.Func 的参数中使用 x (type *C.ctype) 作为类型 *package.C.ctype]
图书馆代码(简化版): // package1.go package package1 import "C" func Play(s *C.char) { } 客户代码: // main.go pac
python ctypes 抛出错误？
到目前为止，我已经得到了一个不适用于 python 的 DLL，并输入 return: I just can't pass it arguments because I doing it wrong
ocaml - Ctypes 和指向字符串数组的指针
我有一个具有以下签名的 C 函数: void init(int* argc, char** argv[]); 我想使用 Ctypes 从我的 OCaml 代码中调用此函数，但我想不出一个正确的方法来传

首页

博学

6Ren·AI

商城

python - numpy 通过 ctypes 调用 sse2