c - 死锁(fork + malloc)libc(glibc-2.17、glibc-2.23)-6ren

c - 死锁(fork + malloc)libc(glibc-2.17、glibc-2.23)

转载作者：行者123 更新时间：2023-12-02 03:10:03

70

4

我遇到了一个非常烦人的问题:我有一个程序，它在开始时创建一个线程，该线程将在执行期间启动其他内容(fork() 紧随其后的是 execve())。

这是我的程序达到(我认为)死锁时两个线程的 bt:

线程 2 (LWP 8839):

#0 0x00007ffff6cdf736 in __libc_fork () at ../sysdeps/nptl/fork.c:125

#1 0x00007ffff6c8f8c0 in _IO_new_proc_open (fp=fp@entry=0x7ffff00031d0, command=command@entry=0x7ffff6c26e20 "ps -u brejon | grep\"cvc\"

#2 0x00007ffff6c8fbcc in _IO_new_popen (command=0x7ffff6c26e20 "ps -u user | grep\"cvc\"| wc -l", mode=0x42c7fd "r") at iopopen.c:296

#3-4 ...

pthread_create.c:333 处的 start_thread (arg=0x7ffff6c27700) 中的#5 0x00007ffff74d9434

克隆()中的#6 0x00007ffff6d0fcfd位于../sysdeps/unix/sysv/linux/x86_64/clone.S:109

线程 1 (LWP 8835):

#0 __lll_lock_wait_private () 位于 ../sysdeps/unix/sysv/linux/x86_64/lowlevellock.S:95

#1 0x00007ffff6ca0ad9 in malloc_atfork (sz=140737337120848, caller=) at arena.c:179

#2 0x00007ffff6c8d875 在 __GI__IO_file_doallocate (fp=0x17a72230) 在 filedoalloc.c:127

#3 0x00007ffff6c9a964 in __GI__IO_doallocbuf (fp=fp@entry=0x17a72230) at genops.c:398

#4 0x00007ffff6c99de8 in _IO_new_file_overflow (f=0x17a72230, ch=-1) at fileops.c:820

#5 0x00007ffff6c98f8a in _IO_new_file_xsputn (f=0x17a72230, data=0x17a16420, n=682) at fileops.c:1331

#6 0x00007ffff6c6fcb2 in _IO_vfprintf_internal (s=0x17a72230, format=, ap=ap@entry=0x7fffffffcf18) at vfprintf.c:1632

#7 0x00007ffff6c76a97 in __fprintf (stream=, format=) at fprintf.c:32

#8-11 ...

#12 0x000000000042706e 在 main (argc=3, argv=0x7fffffffd698, envp=0x7fffffffd6b8) 处 mains/ignore/.c:146

glibc-2.17 和 glibc-2.23 都永远卡在这里

欢迎任何帮助:'D

编辑:

这是一个最小的例子:

  1 #include <stdlib.h>
  2 #include <pthread.h>
  3 #include <unistd.h>
  4 
  5 void * thread_handler(void * args)
  6 {
  7         char * argv[] = { "/usr/bin/ls" };
  8         char * newargv[] = { "/usr/bin/ls", NULL };
  9         char * newenviron[] = { NULL };
 10         while (1) {
 11                 if (vfork() == 0) {
 12                         execve(argv[0], newargv, newenviron);
 13                 }
 14         }
 15 
 16         return 0;
 17 }
 18 
 19 int main(void)
 20 {
 21         pthread_t thread;
 22         pthread_create(&thread, NULL, thread_handler, NULL);
 23 
 24         int * dummy_alloc;
 25 
 26         while (1) {
 27                 dummy_alloc = malloc(sizeof(int));
 28                 free(dummy_alloc);
 29         }
 30 
 31         return 0;
 32 }

环境:用户:deadlock$ cat/etc/redhat-release

Scientific Linux 7.3 版(氮)

用户:死锁$ ldd --version

ldd(GNU libc)2.17

编辑2:rpm包版本为:glibc-2.17-196.el7.x86_64

~~我无法使用 rpm 包获取行号。这是使用发行版中给出的 glibc 的 BT:~~ 使用 debuginfo 解决。

(gdb)线程应用所有bt

线程 2(线程 0x7ffff77fb700 (LWP 59753)):

#0 vfork () 位于 ../sysdeps/unix/sysv/linux/x86_64/vfork.S:44

deadlock.c:11 处 thread_handler (args=0x0) 中的#1 0x000000000040074e

pthread_create.c:308 处的 start_thread (arg=0x7ffff77fb700) 中的#2 0x00007ffff7bc6e25

克隆()中的#3 0x00007ffff78f434d位于../sysdeps/unix/sysv/linux/x86_64/clone.S:113

线程 1(线程 0x7ffff7fba740 (LWP 59746)):

#0 0x00007ffff7878226 in _int_free (av=0x7ffff7bb8760, p=0x602240, have_lock=0) at malloc.c:3927

#1 0x00000000004007aa in main () at deadlock.c:28

最佳答案

这是一个自定义编译的 glibc。安装过程中可能出现问题。请注意Red Hat Enterprise Linux 7.4 backports a fix for a deadlock between malloc and fork ，而你错过了它，因为你编译了自己的 glibc。 fix for the upstream bug仅进入上游版本 2.24，因此如果您的自定义构建基于该版本，则可能没有此修复。 (尽管回溯看起来会有所不同。)

我认为我们至少修复了另一个 2.17 后 libio 相关的死锁错误。

编辑我处理与 fork 相关的死锁已经太久了。发布的再现器存在多个问题:

没有针对 PID 的 waitpid 调用。结果，进程表很快就会被僵尸填满。
不对 execve 进行错误检查。如果 /usr/bin/ls 路径名不存在(例如，在未经历 UsrMove 的系统上)，execve 将返回，并进行下一次迭代循环的将启动另一个 vfork 调用。

我修复了这两个问题(因为调试接近 fork 炸弹的东西一点也不有趣)，但我无法使用 glibc-2.17-196.el7.x86_64 重现挂起。

关于c - 死锁(fork + malloc)libc(glibc-2.17、glibc-2.23)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46893860/

70

4

0

文章推荐： cobol - 如何在新行中写入记录。(在output.dat文件上)

文章推荐： PHP代码版本依赖

文章推荐： c# - 如何从脚本更改着色器的 "BaseMap"属性？ - 通用RP模板

libc++ - LLVM 中的 libc++ 和 libc++abi 库有什么区别？
我看到这两个项目非常相关，但它们之间有什么区别？官方网页并没有说明太多。我知道ABI(Application Binary Interface)用于在不同平台之间提供低级二进制接口(interfac
libc - 我刚刚在我的机器上销毁了 libc.so。我现在能做什么？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
linux - 为什么 glibc 二进制文件称为 libc.so.6 而不是 libc.so.1 或 libc.so.4？
现代 glibc 二进制文件在 Linux 中称为 libc.so.6。为什么这里用“6”？ libc.so.1 或 libc.so.8 也可以是好名字恕我直言。维基百科在 http://en.wi
gcc -/lib/i386-linux-gnu/libc.so.6、/lib/x86_64-linux-gnu/libc.so.6 和/usr/lib/x86_64-linux-gnu/libc.so 有什么区别？
我在我的 Linux Mint 14 Nadia 中安装了 Matlab(a uname -a 显示:Linux Ideapad-Z570 3.5.0-17-generic#28-Ubuntu SMP
c++ - 静态链接新的 libc 符号以与较低的 libc 版本一起使用
我有一个使用 eventfd 和 timerfd 内核系统调用的应用程序。为此，您需要一个现代内核和一个支持它们的 libc，至少是 2.8。我目前的情况是，我的系统具有正确的内核，但是 2.7.1
glibc - 在同一个进程中加载 musl libc.so 和 gcc libc.so？
我有一个用 musl libc 编译的共享库 $ readelf -d ./libinterop_d.so Dynamic section at offset 0x8ecb0 contains 22
c - 为什么一个简单的 C 程序链接到 libc.a，而不是 libc.so？
我的问题是，是否总是需要 libc.a，即使我希望链接到 libc.so。我搜索了互联网，它给出了 3 个可能的答案(冲突) 1. c program will require to link to
c++ - 链接 libc-dbg 和 libc-prof
我安装了多个版本的 libc，我如何在编译时选择要链接的对象？现在我正在编译 g++ prog.cpp 最佳答案您的程序将链接到 libc。当您在 gdb 中运行时，libc-dbg 将用于读取符
c - 默认情况下，gcc 是否链接到 libc.a 或 libc.so？
我在 Ubuntu 16.04 64 位上使用 gcc 5.4.0。当我编译程序时: gcc -o prog prog.c GCC 会自动链接到 C 标准库，因此我不必专门这样做。我如何查看 gcc
c - 写一个 return-to-libc 攻击，但是 libc 被加载到内存中的 0x00
我正在为我的系统安全类编写返回 libc 攻击。一、漏洞代码: //vuln.c #include #include int loadconfig(void){ char buf[1024];
linux - 将符号链接(symbolic link) libc.so.6 替换为另一个更新的 libc.so.6 后如何恢复？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎不是关于 a specific programming problem, a software
visual-studio - Windows 上的 CLang libc、libc++，带有与 Visual Studio 兼容的调试符号
我正在尝试查找信息，但我没有在 clang 网站上看到它。我想尝试在 Windows 上使用它，但我不知道它是有自己的 libc 还是使用 MS 损坏的 libc？另一个问题:如果我用 clang
c++ - 运行从源代码构建的 clang 时，如何指定 libc++ 的位置，或者，有人向我解释 -stdlib=libc++ 的作用
我正在使用 clang 的规定通过插件和 clang 的 LibTooling 开发插件和工具。我能够做以下事情: 从 svn(Linux 和 OSX)，通过运行配置脚本(不使用 cmake)按照入门
c++ - Linux 和 C/C++ :Appliction created by linking libc-2. 11 并尝试在具有 libc-2.5.so 的 Linux 机器上运行
尝试运行时出现以下错误。 lib/libc.so.6:找不到(test.so)所需的版本“GLIBC_2.7” 要解决这个问题，在编译时静态链接到 libc-2.11.a 是否安全，这样在运行时就不会
Error /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.34' not found(错误/lib/x86_64-linux-gnu/libc.so.6：未找到版本`GLIBC_2.34‘)
首先，我在谷歌上搜索了很多，但没有找到与我的案例相关的任何东西，我有一个ELF可执行文件，我试图在我的Ubuntu WSL中运行它，我已经更改了权限(chmod+x文件)，当我运行它时，显示以下错误。
libc - 什么时候应该使用atexit()？
GNU page说: Your program can arrange to run its own cleanup functions if normal termination happens.
更改链接哪个 libc.so ？
我正在尝试在我的路由器上交叉编译 MIPSEL。我在汇编中找到了一些东西，但现在我开始尝试编译基本的 C 代码。目前只有简单的 hello world c 代码，并使用 mipsel-linux-g
libc 中的字符编码？
libc 中预期的字符编码是什么？例如，gethostname(char name, size_t namelen);以 char 作为参数。名称参数是否应该以 utf8(保持 ascii 完整)或纯
c - libc 包含不尊重源类型参数更改的守卫
题如果我包括 time.h ，更改“源类型参数”并重新包含该 header ，难道不应该添加这些新定义吗？我知道这是由于包括 guard 而发生的。我的问题是:这是 libc 中的错误吗？难道它不能
ubuntu - 如何只加载程序需要的那些函数而不是加载整个 libc？
我正在学习Ubuntu上的动态链接器。我想导入我需要的libc函数，但是它链接了while libc.so文件。我不知道该怎么做，所以我来这里寻求帮助。最佳答案如果您将程序链接到动态库(例如 li

首页

博学

6Ren·AI

商城

c - 死锁(fork + malloc)libc(glibc-2.17、glibc-2.23)