gpt4 book ai didi

链接到两个第 3 方共享库时,C++ 程序崩溃

转载 作者:IT王子 更新时间:2023-10-29 00:22:06 25 4
gpt4 key购买 nike

我有两个用于 linux 平台的外包共享库(没有源代码,没有文档)。这些库在单独链接到程序(g++ xx.cpp lib1.so 或 g++ xx.cpp lib2.so)时工作正常。

但是,当任何 c++ 程序同时链接到这两个共享库时,程序不可避免地会崩溃并出现“double free”错误 (g++ xx.cpp lib1.so lib2.so)。

即使 c++ 程序是一个 hello world 程序,与这些库无关,它仍然会崩溃。

#include <iostream>
using namespace std;
int main(){
cout<<"haha, I crash again. Catch me if you can"<<endl;
return 0;
}

生成文件:

g++ helloword.cpp lib1.so lib2.so

我得到了一些线索,这些 lib1.so 和 lib2.so 库可能共享一些通用的全局变量,并且它们两次销毁了一些变量。我试过 gdb 和 valgrind,但无法从回溯中提取有用的信息。

有什么方法可以隔离这两个共享库并使它们以沙盒方式工作?

已编辑(添加核心转储和 gdb 回溯):

我只是将上述玩具空 helloword 程序与两个库(平台:centos 7.0 64 位与 gcc4.8.2)链接起来:

g++ helloworld.cpp  lib1.so lib2.so -o check

瓦尔格林德:

==29953== Invalid free() / delete / delete[] / realloc()
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x549B725: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x5551720: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)
==29953== Address 0x6afb780 is 0 bytes inside a block of size 624 free'd
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x4F07AC5: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x5039900: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)

gdb 回溯信息:

(gdb) bt
#0 0x00007ffff677d989 in raise () from /lib64/libc.so.6
#1 0x00007ffff677f098 in abort () from /lib64/libc.so.6
#2 0x00007ffff67be197 in __libc_message () from /lib64/libc.so.6
#3 0x00007ffff67c556d in _int_free () from /lib64/libc.so.6
#4 0x00007ffff7414aa2 in __tcf_0 () from ./lib1.so
#5 0x00007ffff678158a in __cxa_finalize () from /lib64/libc.so.6
#6 0x00007ffff739f726 in __do_global_dtors_aux () from ./lib1.so
#7 0x0000000000600dc8 in __init_array_start ()
#8 0x00007fffffffe2c0 in ?? ()
#9 0x00007ffff7455721 in _fini () from ./lib1.so
#10 0x00007fffffffe2c0 in ?? ()
#11 0x00007ffff7debb98 in _dl_fini () from /lib64/ld-linux-x86-64.so.2
Backtrace stopped: previous frame inner to this frame (corrupt stack?)

更新

感谢@RaduChivu 的帮助,我发现了一个非常相似的场景:segmentation fault at __tcf_0 when program exits ,看起来这两个库之间确实存在全局变量冲突。考虑到我没有这两个外部共享库的源文件,除了使用两个单独的进程外,还有其他方法可以解决此冲突吗?

最佳答案

经过一天的搜索,我已经解决了这个问题,并在这里留言,以防将来其他人遇到这个问题。

解释

证明@RaduChivn和我的猜测是正确的:两个共享库可能共享一个公共(public)的全局变量。即使一个空程序同时链接到两个共享库,当它退出时,公共(public)全局变量也会被尝试释放两次,因此,双重释放损坏。

线索来自 gdb backtrace 中的这条消息:

#4  0x00007ffff7414aa2 in __tcf_0 () from ./lib1.so

如本帖所述:

What is function __tcf_0? (Seen when using gprof and g++) ,

tcf_0 是 g++ 生成的函数,用于在触发 exit() 时销毁静态对象。此消息暗示当一个共享库试图在另一个共享库之后退出时会发生双重释放。

由于这两个库旨在协同工作,因此损坏是 Not Acceptable 工程师灾难。如此低质量但明显的错误如何能够在五个版本发布后存活下来?这可能是由于大多数图书馆用户在 windows 平台上工作(其软件包运行良好)。然而,这个假设为错误的起源提供了另一个线索:共享库在 windows 上运行良好,但在 linux 上崩溃;那么它一定是一些依赖于操作系统的行为差异导致了这个错误。该线程提供了一些见解:

Global variable has multiple copies on Windows and a single on Linux when compiled in both exec and shared libaray .

简而言之,来自共享库的“外部全局变量”在 linux 上获得单个拷贝,但在 windows 上获得多个拷贝。

解决方案

(1) 当然,我们会有一种解决方法,即创建两个进程,每个进程分别链接到一个库。

(2) @DavidSchwartz 提供了另一种解决方法,即在程序末尾使用 _exit(0),而不是常见的“return 0”或“exit(0)”,它可以工作。根据

What is the difference between using _exit() & exit() in a conventional Linux fork-exec?

,必须手动刷新文件并检查 atexit 作业;对于内存问题,由于程序正在退出,操作系统无论如何都会回收所有进程内存,无需担心。

(3) 另一种方式是使用dlopen(xx.so, RTLD_LOCAL),先将所有的symbols盲化,然后手动dlysm自己需要的函数symbols

(@JonathanWakely 在这里指出 RTLD_LOCAL 有副作用,请参阅评论)。

在这种情况下,库编码人员甚至没有在他们的共享库中使用“extern C”,导致 so 文件中的名称混淆变得非常不可读;如果其他人喜欢这个,以下线程可能会有所帮助:

Getting undefined symbol error while dynamic loading of shared library

如果您的共享库没有得到很好的支持,就像我的情况一样,解决方案仍然是可能的。我手动整理了所有需要的函数,用nm在.so文件中找到每个对应的符号,一一链接,成功了。

关于链接到两个第 3 方共享库时,C++ 程序崩溃,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25051679/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com