主要是我有一个“调试事件”线程,它只是循环等待waitpid返回并将接收到的事件传递给其他线程.我这样做是因为waitpid没有超时,这使得很难将它与其他事件循环集成并保持响应(waitpid可以无限期挂起!).
到目前为止,这种策略对于Linux构建非常有效.最近我一直试图让我的调试器线程知道(如在调试应用程序中的线程,而不是调试器本身).
因此,我将ptrace选项设置为跟随克隆事件,并查找将高16位设置为PTRACE_EVENT_CLONE的状态.然后我使用PTRACE_GETEVENTMSG来获取新线程的TID.这一切都适用于我的小型测试工具应用程序.但由于某种原因,当我将该代码放入我的实际调试器时,它失败了. (我得到一个“没有这样的过程”错误代码)
我遇到的一件事是,Windows有一条规则,即只有连接到应用程序的线程才能监听调试事件. Linux的ptrace是否有类似的限制?如果是这样,为什么我的代码适用于其他调试事件?
编辑:
似乎至少waitpid支持从另一个线程等待,该手册页说:
Before Linux 2.4,a thread was just a
special case of a process,and as a
consequence one thread could not wait on the
children of another thread,even when
the latter belongs to the same thread
group. However,POSIX prescribes
such functionality,and since Linux 2.4 a
thread can,and by default
will,wait on children of other
threads in the same thread group.
所以最多这是一个ptrace限制.
解决方法
似乎应该允许多线程跟踪,因为线程是同一进程的一部分,但是在实现方面,Linux内核中的线程和进程之间实际上没有太大的区别.线程只是一个与其他任务共享大部分资源的任务.
如果您有兴趣,可以在内核中浏览source code for ptrace.具体来看ptrace_check_attach
,对于大多数请求,由sys_ptrace
调用.如果目标任务的父项不是当前任务,它将返回-ESRCH(听起来像您正在获取的错误代码).