fan*_*bin 8 c++ linux crash shared-libraries double-free
我有两个用于linux平台的外包共享库(没有源代码,没有文档).当它们单独链接到程序时(g ++ xx.cpp lib1.so或g ++ xx.cpp lib2.so),这些库工作正常.
但是,当任何c ++程序同时链接到这两个共享库时,程序不可避免地会因"双重释放"错误而崩溃(g ++ xx.cpp lib1.so lib2.so).
即使c ++程序是一个空的 hello world程序并且与这些库无关,它仍然会崩溃.
#include <iostream>
using namespace std;
int main(){
cout<<"haha, I crash again. Catch me if you can"<<endl;
return 0;
}
Run Code Online (Sandbox Code Playgroud)
Makefile文件:
g++ helloword.cpp lib1.so lib2.so
Run Code Online (Sandbox Code Playgroud)
我得到一些线索,这些lib1.so lib2.so库可能共享一些常见的全局变量,并且它们会两次销毁一些变量.我尝试过gdb和valgrind,但是无法从backtrace中提取有用的信息.
有什么方法可以隔离这两个共享库并使它们以沙箱方式工作?
EDITED(添加核心转储和gdb回溯):
我只是将前面提到的玩具空helloword程序与两个库(平台:带有gcc4.8.2的centos 7.0 64bits)联系起来:
g++ helloworld.cpp lib1.so lib2.so -o check
Run Code Online (Sandbox Code Playgroud)
Valgrind的:
==29953== Invalid free() / delete / delete[] / realloc()
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x549B725: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x5551720: ??? (in /home/fanbin/InventoryManagment/lib1.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)
==29953== Address 0x6afb780 is 0 bytes inside a block of size 624 free'd
==29953== at 0x4C29991: operator delete(void*) (in /usr/lib64/valgrind/vgpreload_memcheck-amd64-linux.so)
==29953== by 0x613E589: __cxa_finalize (in /usr/lib64/libc-2.17.so)
==29953== by 0x4F07AC5: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x5039900: ??? (in /home/fanbin/InventoryManagment/lib2.so)
==29953== by 0x613E218: __run_exit_handlers (in /usr/lib64/libc-2.17.so)
==29953== by 0x613E264: exit (in /usr/lib64/libc-2.17.so)
==29953== by 0x6126AFB: (below main) (in /usr/lib64/libc-2.17.so)
Run Code Online (Sandbox Code Playgroud)
gdb回溯消息:
(gdb) bt
#0 0x00007ffff677d989 in raise () from /lib64/libc.so.6
#1 0x00007ffff677f098 in abort () from /lib64/libc.so.6
#2 0x00007ffff67be197 in __libc_message () from /lib64/libc.so.6
#3 0x00007ffff67c556d in _int_free () from /lib64/libc.so.6
#4 0x00007ffff7414aa2 in __tcf_0 () from ./lib1.so
#5 0x00007ffff678158a in __cxa_finalize () from /lib64/libc.so.6
#6 0x00007ffff739f726 in __do_global_dtors_aux () from ./lib1.so
#7 0x0000000000600dc8 in __init_array_start ()
#8 0x00007fffffffe2c0 in ?? ()
#9 0x00007ffff7455721 in _fini () from ./lib1.so
#10 0x00007fffffffe2c0 in ?? ()
#11 0x00007ffff7debb98 in _dl_fini () from /lib64/ld-linux-x86-64.so.2
Backtrace stopped: previous frame inner to this frame (corrupt stack?)
Run Code Online (Sandbox Code Playgroud)
更新
感谢@RaduChivu的帮助,我发现了一个非常类似的场景: 当程序退出时__tcf_0处的分段错误,看起来确实两个库之间存在全局变量冲突.考虑到我没有这两个外部共享库的源文件,除了使用两个单独的进程外,还有其他方法可以解决这个冲突吗?
经过一天的搜索,我已经解决了这个问题,并在这里留下注释,以防其他人将来遇到这个问题。
它证明@RaduChivn和我的猜测是正确的:两个共享库可能共享一个公共的全局变量。即使一个空程序同时链接到两个共享库,当它退出时,公共全局变量也会尝试释放两次,从而导致双重释放损坏。
线索来自 gdb backtrace 中的这条消息:
#4 0x00007ffff7414aa2 in __tcf_0 () from ./lib1.so
Run Code Online (Sandbox Code Playgroud)
如该线程中所述:
什么是函数 __tcf_0?(使用 gprof 和 g++ 时可见),
tcf_0 是 g++ 生成的函数,用于在触发 exit() 时销毁静态对象。此消息暗示当一个共享库尝试退出另一个共享库时,会发生双重释放。
由于这两个库被设计为协同工作,因此损坏是工程师无法接受的灾难。如此低质量但明显的错误如何能够在五个版本发布中幸存下来?这可能是由于大多数库用户在 Windows 平台上工作(其包运行良好)。然而,这个假设为错误的根源提供了另一个暗示:共享库在 Windows 上运行良好,但在 Linux 上崩溃;那么一定是某些与操作系统相关的行为差异导致了该错误。该线程提供了一些见解:
在 exec 和共享 libaray 中编译时,全局变量在 Windows 上有多个副本,在 Linux 上有一个副本。
简而言之,共享库中的“外部全局变量”在 Linux 上获得单个副本,但在 Windows 上获得多个副本。
(1) 当然,我们会有一种解决方法,即创建两个进程,每个进程分别链接到一个库。
(2) @DavidSchwartz 提供了另一种在程序末尾使用 _exit(0) 的解决方法,而不是常见的“return 0”或“exit(0)”,它可以工作。根据
在传统的 Linux fork-exec 中使用 _exit() 和 exit() 有什么区别?
,必须手动刷新文件并检查 atexit 作业;对于内存问题,由于程序正在退出,操作系统无论如何都会回收所有进程内存,无需担心。
(3)另一种方法是使用 dlopen(xx.so, RTLD_LOCAL),先将所有符号致盲,然后手动 dlysm 需要的函数符号
(@JonathanWakely 在此指出 RTLD_LOCAL 有副作用,请参阅评论)。
在这种情况下,库编码器甚至没有在其共享库中使用“extern C”,导致 so 文件中的名称损坏非常不可读;如果其他人喜欢这个,以下线程可能会有所帮助:
如果您的共享库没有得到很好的支持,就像我的情况一样,解决方案仍然是可能的。我手动把需要的函数全部整理出来,用nm找到.so文件中每个对应的符号,一一链接起来,就成功了。
| 归档时间: |
|
| 查看次数: |
1881 次 |
| 最近记录: |