如何增加Linux核心转储匹配符号的概率?

the*_*ine 5 linux gcc gdb coredump

我有一个非常复杂的跨平台应用程序.最近我和我的团队一直在进行压力测试,并遇到了几次崩溃(以及随之而来的核心转储).其中一些核心转储非常精确,并向我展示了大约10个或更多堆栈帧发生崩溃的确切位置.其他人有时只有一个堆叠框架?? ?? 是唯一的象征!

我想知道的是:

  1. 有没有办法增加核心转储指向正确方向的可能性?
  2. 为什么报告的堆栈帧数不一致?
  3. 管理核心转储的任何最佳实践建议.

这是我编译二进制文件的方式(在发布模式下):

  1. 编译器和平台:在CentOS 3.6 x86_64上使用glibc-2.3.2-95.50的g ++ - 这有助于我保持与旧版Linux的兼容性.
  2. 所有文件都使用-g标志进行编译.
  3. 调试符号从最终二进制文件中删除并保存在单独的文件中.
  4. 当我有一个核心转储时,我使用GDB和创建核心的可执行文件以及符号文件.GDB从不抱怨核心/二进制/符号之间存在不匹配.

然而,我有时会得到没有符号的核心转储!可以理解的是,我正在链接libstdc ++和libgcc的非调试版本,但如果至少堆栈跟踪显示我的代码中的错误指令调用源自哪里(尽管它可能最终以??结尾),这将是很好的. .

use*_*374 7

其他人有时只有一个堆叠框架"??" 是唯一的象征!

这可能有很多原因,其中包括:

  • 堆栈帧被删除(覆盖)
  • EBP/RBP(在x86/x64上)目前没有任何有意义的值 - 这可能发生在例如用-fomit-frame-pointeras或asm单位编译的单位中

注意,第二点可以简单地通过例如以这种方式编译的glibc来进行.安装此类系统库的调试信息可以缓解这种情况(类似于openSUSE上的glibc-debug {info,source}软件包).

gdb比glibc更能控制程序,所以backtrace如果gdb也不能这样做,glibc的调用自然会无法打印回溯.

但是运输来源会容易得多:-)

  • 这很可能是问题 - 如果堆栈框架被bug破坏了,那么它就消失了. (2认同)