我有一个不是使用调试符号构建的可执行文件的核心转储.
我可以恢复argv内容,看看命令行是什么?
如果我运行gdb,我可以看到一个回溯,我可以导航到main()框架.有一次,有没有办法恢复argv,而不知道它的确切地址?
我在x86_x64(Intel Xeon cpu)上运行一个CEntOS Linux发行版/内核,
我有希望的一个原因是核心转储似乎显示了部分争议.
(程序是postgres,当我加载核心文件时,gdb打印一个消息,其中包含postgres数据库用户名,客户端OP地址和查询的前10个字符))
解决方法
在x86_64上,参数以%rdi,%rsi等寄存器(
calling convention)传递.
因此,当您进入主框架时,您应该能够:
- (gdb) p $rdi # == argc
- (gdb) p (char**) $rsi # == argv
- (gdb) set $argv = (char**)$rsi
- (gdb) set $i = 0
- (gdb) while $argv[$i]
- > print $argv[$i++]
- > end
不幸的是,当您切换帧时,GDB通常不会恢复$rdi和$rsi.所以这个例子不行:
- cat t.c
- #include <stdlib.h>
- int bar() { abort(); }
- int foo() { return bar(); }
- int main()
- {
- foo();
- return 0;
- }
- gcc t.c && ./a.out
- Aborted (core dumped)
- gdb -q ./a.out core
- Core was generated by `./a.out'.
- Program terminated with signal 6,Aborted.
- #0 0x00007fdc8284aa75 in *__GI_raise (sig=<optimized out>) at ../nptl/sysdeps/unix/sysv/linux/raise.c:64
- 64 ../nptl/sysdeps/unix/sysv/linux/raise.c: No such file or directory.
- in ../nptl/sysdeps/unix/sysv/linux/raise.c
- (gdb) bt
- #0 0x00007fdc8284aa75 in *__GI_raise (sig=<optimized out>) at ../nptl/sysdeps/unix/sysv/linux/raise.c:64
- #1 0x00007fdc8284e5c0 in *__GI_abort () at abort.c:92
- #2 0x000000000040052d in bar ()
- #3 0x000000000040053b in foo ()
- #4 0x000000000040054b in main ()
- (gdb) fr 4
- #4 0x000000000040054b in main ()
- (gdb) p $rdi
- $1 = 5524 ### clearly not the right value
所以你必须再工作一些…
您可以做的是使用知识如何在process startup设置Linux堆栈,结合GDB将恢复堆栈指针的事实:
- (gdb) set backtrace past-main
- (gdb) bt
- #0 0x00007ffff7a8da75 in *__GI_raise (sig=<optimized out>) at ../nptl/sysdeps/unix/sysv/linux/raise.c:64
- #1 0x00007ffff7a915c0 in *__GI_abort () at abort.c:92
- #2 0x000000000040052d in bar ()
- #3 0x000000000040053b in foo ()
- #4 0x0000000000400556 in main ()
- #5 0x00007ffff7a78c4d in __libc_start_main (main=<optimized out>,argc=<optimized out>,ubp_av=<optimized out>,init=<optimized out>,fini=<optimized out>,rtld_fini=<optimized out>,stack_end=0x7fffffffdad8) at libc-start.c:226
- #6 0x0000000000400469 in _start ()
- (gdb) frame 6
- (gdb) disas
- Dump of assembler code for function _start:
- 0x0000000000400440 <+0>: xor %ebp,%ebp
- 0x0000000000400442 <+2>: mov %rdx,%r9
- 0x0000000000400445 <+5>: pop %rsi
- 0x0000000000400446 <+6>: mov %rsp,%rdx
- 0x0000000000400449 <+9>: and $0xfffffffffffffff0,%rsp
- 0x000000000040044d <+13>: push %rax
- 0x000000000040044e <+14>: push %rsp
- 0x000000000040044f <+15>: mov $0x400560,%r8
- 0x0000000000400456 <+22>: mov $0x400570,%rcx
- 0x000000000040045d <+29>: mov $0x40053d,%rdi
- 0x0000000000400464 <+36>: callq 0x400428 <__libc_start_main@plt>
- => 0x0000000000400469 <+41>: hlt
- 0x000000000040046a <+42>: nop
- 0x000000000040046b <+43>: nop
- End of assembler dump.
所以现在我们预期原始的%rsp为$rsp 8(一个POP,两个PUSH),但是由于在指令0x0000000000400449中完成的对齐,它可能在$rsp 16
我们来看看有什么?
- (gdb) x/8gx $rsp+8
- 0x7fffbe5d5e98: 0x000000000000001c 0x0000000000000004
- 0x7fffbe5d5ea8: 0x00007fffbe5d6eb8 0x00007fffbe5d6ec0
- 0x7fffbe5d5eb8: 0x00007fffbe5d6ec4 0x00007fffbe5d6ec8
- 0x7fffbe5d5ec8: 0x0000000000000000 0x00007fffbe5d6ecf
这看起来很有希望:4(怀疑argc),其次是4个非空指针,后跟NULL.
我们来看看是否平静下来:
- (gdb) x/s 0x00007fffbe5d6eb8
- 0x7fffbe5d6eb8: "./a.out"
- (gdb) x/s 0x00007fffbe5d6ec0
- 0x7fffbe5d6ec0: "foo"
- (gdb) x/s 0x00007fffbe5d6ec4
- 0x7fffbe5d6ec4: "bar"
- (gdb) x/s 0x00007fffbe5d6ec8
- 0x7fffbe5d6ec8: "bazzzz"
的确,这就是我调用二进制文件的方式.作为最后的理智检查,0x00007fffbe5d6ecf看起来像环境的一部分?
- (gdb) x/s 0x00007fffbe5d6f3f
- 0x7fffbe5d6f3f: "SSH_AGENT_PID=2874"
是的,这就是环境的开始(或结束).
所以你有它.
最终注意事项:如果GDB没有打印< optimize out>很多,我们可以从帧#5中恢复argc和argv.在GDB和GCC两方面都有工作,使GDB打印少得多的“优化出”…
另外,当加载核心时,我的GDB打印:
- Core was generated by `./a.out foo bar bazzzz'.
否定了整个运动的需要.但是,这仅适用于短命令行,而上述解决方案将适用于任何命令行.