- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用 mpi4py 库使用 Python 编写 MPI 程序。 Python 生成并调用低级 C 代码。
我刚刚遇到了段错误,需要对其进行追踪。
如果我直接用 C 语言编写,我会在 gdb
中编译并运行我的程序,找到有问题的代码行,然后从那里开始调试。
如果我用Python编写,我仍然会使用gdb
(您可以调用gdb python filename.py
,gdb会将您指向C的有问题的行。)
但是可惜我正在使用 MPI,它使用 Python,而 Python 使用 C。我得到这样的堆栈跟踪
mrocklin@baconost:~/workspace/ape$ mpiexec -np 3 -hostfile tmp/hostfile -rankfile tmp/rankfile python ape/codegen/run.py tmp/
[baconost:27370] *** Process received signal ***
[baconost:27370] Signal: Segmentation fault (11)
[baconost:27370] Signal code: Address not mapped (1)
[baconost:27370] Failing at address: 0x8
[baconost:27370] [ 0] /lib/x86_64-linux-gnu/libpthread.so.0(+0xfc60) [0x7fcd529c5c60]
[baconost:27370] [ 1] /home/mrocklin/Software/openmpi/lib/libmpi.so.0(MPI_Comm_get_errhandler+0xa0) [0x7fcd46fae240]
[baconost:27370] [ 2] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/python2.7/site-packages/mpi4py/MPI.so(+0x2ddbc) [0x7fcd47234dbc]
[baconost:27370] [ 3] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/python2.7/site-packages/mpi4py/MPI.so(initMPI+0x1f2e) [0x7fcd4724f95e]
[baconost:27370] [ 4] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(_PyImport_LoadDynamicModule+0xc2) [0x7fcd52cc2e02]
[baconost:27370] [ 5] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xecd90) [0x7fcd52cc0d90]
[baconost:27370] [ 6] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xed031) [0x7fcd52cc1031]
[baconost:27370] [ 7] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyImport_ImportModuleLevel+0x2be) [0x7fcd52cc206e]
[baconost:27370] [ 8] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xd3fed) [0x7fcd52ca7fed]
[baconost:27370] [ 9] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyObject_Call+0x68) [0x7fcd52c19d18]
[baconost:27370] [10] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_CallObjectWithKeywords+0x56) [0x7fcd52ca8516]
[baconost:27370] [11] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalFrameEx+0x28b8) [0x7fcd52caba78]
[baconost:27370] [12] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalCodeEx+0x8d2) [0x7fcd52cb0722]
[baconost:27370] [13] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalCode+0x32) [0x7fcd52cb0772]
[baconost:27370] [14] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyImport_ExecCodeModuleEx+0xc2) [0x7fcd52cbf6e2]
[baconost:27370] [15] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xebcae) [0x7fcd52cbfcae]
[baconost:27370] [16] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xecd90) [0x7fcd52cc0d90]
[baconost:27370] [17] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xed264) [0x7fcd52cc1264]
[baconost:27370] [18] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyImport_ImportModuleLevel+0x118) [0x7fcd52cc1ec8]
[baconost:27370] [19] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xd3fed) [0x7fcd52ca7fed]
[baconost:27370] [20] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyObject_Call+0x68) [0x7fcd52c19d18]
[baconost:27370] [21] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_CallObjectWithKeywords+0x56) [0x7fcd52ca8516]
[baconost:27370] [22] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalFrameEx+0x28b8) [0x7fcd52caba78]
[baconost:27370] [23] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalCodeEx+0x8d2) [0x7fcd52cb0722]
[baconost:27370] [24] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyEval_EvalCode+0x32) [0x7fcd52cb0772]
[baconost:27370] [25] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(PyImport_ExecCodeModuleEx+0xc2) [0x7fcd52cbf6e2]
[baconost:27370] [26] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xebcae) [0x7fcd52cbfcae]
[baconost:27370] [27] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xed58d) [0x7fcd52cc158d]
[baconost:27370] [28] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xecd90) [0x7fcd52cc0d90]
[baconost:27370] [29] /home/mrocklin/Software/epd-7.2-1-rh5-x86_64/lib/libpython2.7.so.1.0(+0xed264) [0x7fcd52cc1264]
[baconost:27370] *** End of error message ***
--------------------------------------------------------------------------
mpiexec noticed that process rank 0 with PID 27370 on node baconost.cs.uchicago.edu exited on signal 11 (Segmentation fault).
--------------------------------------------------------------------------
两个问题:
在一般情况下,在检测到错误后使用此软件堆栈调试程序的最佳方法是什么(我想避免“您应该通过测试来防止错误而不是诊断错误”的评论。我同意这一点,但尽管我们尽了最大努力,有时还是会发生段错误)
在这种特定情况下,这是否表明我遇到了 MPI/mpi4py
问题?最后几行表明情况可能就是这样。
最佳答案
此特定错误的问题是旧版本的 OpenMPI 不能很好地处理排名文件。此错误已报告,并且似乎已从 1.6.2
开始修复。显然这部分代码很少使用且未经测试。
关于python - 在 MPI Python 程序中查找 SegFault 的一般建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12728943/
所以我需要一个简单的分配器来分配(有时使用清零)并随后从映射内存池中释放 4K block 。然而,在实现这个之后,在测试时我发现在释放一两个 block 之后,如果我尝试分配一个 block ,程序
我的任务是用 C 编写一个程序。该程序应该能够检查参数并创建与我提供的参数一样大的数组。我必须用随机数填充数组。到目前为止工作正常。稍后我的任务是使用指针对数组进行排序。第一件事是我不太明白指针是如何
我对 C 很陌生(仍然)所以如果我误解了一些基本的东西,请耐心等待 我有一个简单的程序,它应该将文件作为字符串读取,然后将该字符串拆分成行 - 将结果存储到 n 个字符串数组中。但是,当我运行以下代码
我在工作中使用的应用程序之一遇到了一个奇怪且烦人的问题。该应用程序是用 C++ 编写的,当应用程序终止(主函数返回或调用 exit)时,它会因段错误而崩溃。段错误似乎是由 basic_string 类
我使用 python swig 包装的 C++ 库。在它的 __init__.py 文件中,它 sets在导入包含实现代码的共享对象文件之前,使用 dlopen 标志 RTLD_GLOBAL。 这会导
我在这里遇到了段错误。我很困惑。请帮帮我。 f1 和 y 都是结构体节点的指针。我想把 y 的左转 f1 右转。 #include #include struct node{
我有一个在公共(public)结构中声明的数组,如下所示: uint16_t *registers; 在一个函数中,我正在检索一个字符字符串(存储在缓冲区中,请参阅下面的代码),其中包含以逗号分隔的数
我正在用 C 实现二叉搜索树。下面的代码工作正常,只是当我尝试从树中删除子树时得到 SEGFAULT: 源代码: #include #include struct node { int dat
struct vehicle *add_vehicle(struct vehicle *v){ struct vehicle *newcar = (struct vehicle*)malloc
我正在使用链接列表实现符号表,代码工作正常,但代码中存在内存泄漏, 我有以下结构 struct node { char* pcKey; void* pvValue; struct node
我正在尝试将字符串复制到数组并打印它。它适用于第一个 for 循环,但第二次出现 seg 错误。 main (int argc, char *argv[]){ int argcIndex; cha
自从我用 C 编写代码已经一年了,但我不明白为什么会出现段错误 // Assume all imports are made int printAgain(double** array, int si
这是我的代码。编辑:调用者包含在底部。 该函数读取数据文件,确定有多少行和列,然后将数据存储到 data_array 中。 int getdata(double* *data_array, int*
我认为有两组代码是等效的,但一组会导致段错误,而另一组则不会。我真的很困惑为什么会这样...... 我想创建一个查找函数 此代码确实有效: MyPair *> dummy(x, NULL);
希望有人能提供帮助。我可以毫无错误地编译,我没有发现任何语法错误,但是当我运行它时,它崩溃了。在启动时调试段错误。全面披露,这是作业。我不是要找人来编写这个代码,只是看看我的问题和我现有的代码,也许会
我正在尝试在OpenMP中并行化相当大的for-loop。大约有20%的时间运行正常,但其余时间会因各种段错误而崩溃,例如: *** glibc detected *** ./execute: dou
我有一个模板类 ISingleton class ISingleton { public: static T* getInstance() { lock_guard g
我正在为使用 LibSVM 的 Android 构建 NDK 应用程序。我在 XCode 中为我的 mac 构建了一个等价物(都是 C++) 我发现 Mac 可以高速准确地处理我给它的非常大的特征向量
我在 ARM linux 平台上有一个由简单代码引起的非常奇怪的崩溃。问题是它很少重现(一天一次),另一个问题是它在实际上无法重现的地方崩溃。 让我们从 C++ 代码开始。线程函数执行此操作:
我有这段代码 int main() { int *b = new int(8); cout<<" &b = "<
我是一名优秀的程序员,十分优秀!