使用我们的计时器逐个函数(仅最大)跟踪 Linux 内核

osg*_*sgx 4 trace linux-kernel

我想知道,linux内核是如何做一些事情的(接收tcp数据包)。主要 tcp 函数按什么顺序调用。我想看到中断处理程序(上半部分)、下半部分,甚至在用户调用后内核完成的工作"read()"

如何从内核中获取具有线性时间尺度的函数跟踪?

我想从单个数据包中获取跟踪信息,而不是接收第 1000 个数据包时的内核配置文件。

内核是 2.6.18 或 2.6.23(在我的 debian 中支持)。我可以给它添加一些补丁。

Han*_*olo 5

我认为至少部分可以实现您想要的最接近的工具是 kernel ftrace。这是一个示例用法:

root@ansis-xeon:/sys/kernel/debug/tracing# cat available_tracers 
blk function_graph mmiotrace function sched_switch nop
root@ansis-xeon:/sys/kernel/debug/tracing# echo 1 > ./tracing_on 
root@ansis-xeon:/sys/kernel/debug/tracing# echo function_graph > ./current_trace
root@ansis-xeon:/sys/kernel/debug/tracing# cat trace

 3)   0.379 us    |        __dequeue_entity();
 3)   1.552 us    |      }
 3)   0.300 us    |      hrtick_start_fair();
 3)   2.803 us    |    }
 3)   0.304 us    |    perf_event_task_sched_out();
 3)   0.287 us    |    __phys_addr();
 3)   0.382 us    |    native_load_sp0();
 3)   0.290 us    |    native_load_tls();
 ------------------------------------------
 3)    <idle>-0    =>  ubuntuo-2079 
 ------------------------------------------

 3)   0.509 us    |              __math_state_restore();
 3)               |              finish_task_switch() {
 3)   0.337 us    |                perf_event_task_sched_in();
 3)   0.971 us    |              }
 3) ! 100015.0 us |            }
 3)               |            hrtimer_cancel() {
 3)               |              hrtimer_try_to_cancel() {
 3)               |                lock_hrtimer_base() {
 3)   0.327 us    |                  _spin_lock_irqsave();
 3)   0.897 us    |                }
 3)   0.305 us    |                _spin_unlock_irqrestore();
 3)   2.185 us    |              }
 3)   2.749 us    |            }
 3) ! 100022.5 us |          }
 3) ! 100023.2 us |        }
 3)   0.704 us    |        fget_light();
 3)   0.522 us    |        pipe_poll();
 3)   0.342 us    |        fput();
 3)   0.476 us    |        fget_light();
 3)   0.467 us    |        pipe_poll();
 3)   0.292 us    |        fput();
 3)   0.394 us    |        fget_light();
 3)               |        inotify_poll() {
 3)               |          mutex_lock() {
 3)   0.285 us    |            _cond_resched();
 3)   1.134 us    |          }
 3)   0.289 us    |          fsnotify_notify_queue_is_empty();
 3)               |          mutex_unlock() {
 3)   2.987 us    |        }
 3)   0.292 us    |        fput();
 3)   0.517 us    |        fget_light();
 3)   0.415 us    |        pipe_poll();
 3)   0.292 us    |        fput();
 3)   0.504 us    |        fget_light();
 3)               |        sock_poll() {
 3)   0.480 us    |          unix_poll();
 3)   4.224 us    |        }
 3)   0.183 us    |        fput();
 3)   0.341 us    |        fget_light();
 3)               |        sock_poll() {
 3)   0.274 us    |          unix_poll();
 3)   0.731 us    |        }
 3)   0.182 us    |        fput();
 3)   0.269 us    |        fget_light();
Run Code Online (Sandbox Code Playgroud)

它并不完美,因为它不打印函数参数并且错过了一些静态函数,但您可以了解谁在内核内部调用谁。

如果这还不够,那么使用 GDB。但您可能已经知道,为内核调试设置 GDB 并不像为用户空间进程设置那么容易。如果需要的话,我更喜欢使用 GDB+qemu。

快乐追踪!

更新:在更高版本的 Linux 发行版上,我建议使用trace-cmd“包装” /sys/kernel/debug/tracing. trace-cmd比内核提供的原始界面使用起来更加直观。