Bootstrap

strace 用法介绍

strace 是什么

strace 是一个可用于诊断和调试的 Linux 用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。

strace 作为一种动态跟踪工具,能够帮助我们高效地定位进程和服务故障。它像是一个侦探,打开应用进程的这个黑盒子,通过系统调用的蛛丝马迹,告诉你进程大概在干嘛,进而找到异常的真相。

strace 怎么用

运行模式

strace 有两种运行模式。

一种是通过它启动要跟踪的进程。用法很简单,在原本的命令前加上 strace 即可。

比如我们要跟踪 “/usr/local/bin/a.out” 这个命令的执行,可以这样:

strace /usr/local/bin/a.out

另外一种运行模式,是跟踪已经在运行的进程,在不中断进程执行的情况下,理解它在干嘛。

这种情况,给 strace 传递个 -p pid 选项即可。

比如,a.out 进程的 pid 是 345,可以这样:

strace -p 345

完成跟踪时,按 Ctrl + C 结束 strace 即可。

常用选项

从一个示例命令来看:

strace -tt -T -v -f -e trace=file -o /tmp/strace.log -s 1024 -p 345
  • -tt:在每行输出的前面,显示毫秒级别的时间
  • -T:显示每次系统调用所花费的时间
  • -v:对于某些相关调用,把完整的环境变量,文件 stat 结构等打出来
  • -f:跟踪目标进程,以及目标进程创建的所有子进程
  • -e:控制要跟踪的事件和跟踪行为,比如指定要跟踪的系统调用名称
  • -o:把 strace 的输出单独写到指定的文件
  • -s:当系统调用的某个参数是字符串时,最多输出指定长度的内容,默认是 32 个字节
  • -p:指定要跟踪的进程 pid,要同时跟踪多个 pid,重复多次 -p 选项即可
  • -c:统计系统调用的次数和其所花的时间

这里特别说下 strace 的 -e trace 选项。

要跟踪某个具体的系统调用,如 -e trace=open 即可。

但有时候我们要跟踪一类系统调用,比如所有和文件名有关的调用、所有和内存分配有关的调用。

如果人工输入每一个具体的系统调用名称,可能容易遗漏。

于是 strace 提供了几类常用的系统调用组合名字。

  • -e trace=file 跟踪和文件访问相关的调用(参数中有文件名)
  • -e trace=process 和进程管理相关的调用,比如 fork/exec/exit_group
  • -e trace=network 和网络通信相关的调用,比如 socket/sendto/connect
  • -e trace=signal 信号发送和处理相关,比如 kill/sigaction
  • -e trace=desc 和文件描述符相关,比如 write/read/select/epoll
  • -e trace=ipc 进程间通信相关,比如 shmget

strace 问题定位案例

定位进程异常退出

/usr/local/samba/bin/nmbd 启动失败,nmbd 是一个域名服务的进程。

这个服务进程是开源代码编译出来的,也就是说,并不是我们自己开发的代码,因此该服务进程的启动流程我们并不熟悉。像这样的情况,可以用 strace 来跟踪看看,到底是哪里出现了异常。

strace -tt -T /usr/local/samba/bin/nmbd

在这里插入图片描述

咦?看到 nmbd 进程 exited with 0 正常退出了,考虑到这个进程是个守护进程,主进程确实会 exit 的。

再看到有个 clone 的系统调用,想到 fork 这个系统调用最终调用的是 clone,就知道 nmbd 进程创建了一个子进程,然后父进程就退出了。所以要加一个参数 -f 来跟踪子进程

strace -tt -T -f /usr/local/samba/bin/nmbd

在这里插入图片描述

看到确实子进程是异常退出了,exited with 1,所以 nmbd 进程启动失败。

对比了一下之前版本 OK 的启动 log。

在这里插入图片描述

发现 /usr/local/samba/var/nmbd 这个目录有异常

OK 时是一个普通的目录

NG 时是一个软链接

最终查看了相关代码,改成目录,nmbd 进程就可以正常启动了

性能分析

假如有个需求,统计某个目录 cpp 文件的代码行数。这里提供两个 Shell 脚本实现:

poor_script.sh

#!/bin/bash
total_line=0
while read filename; do
     line=$(wc -l $filename | awk '{print $1}')
     (( total_line += line ))
done < <(find . -type f -iname '*.cpp')
echo "total line: $total_line"

good_script.sh

#!/bin/bash

find . -type f -iname '*.cpp' -print0 | wc -l --files0-from=- | tail -n 1

两段代码实现的目的是一样的。我们通过 strace 的 -c 选项来分别统计两种版本的系统调用情况和其所花的时间(使用 -f 同时统计子进程的情况)

strace -c -f ./poor_script.sh
在这里插入图片描述

strace -c -f ./good_script.sh
在这里插入图片描述

从两个输出可以看出,good_script.sh 很快就可以得到结果:95985 行。它大部分的调用(calls)开销是文件操作(read/open/write/close)等,统计代码行数本来就是干这些事情。

而 poor_script.sh 完成同样的任务则花了更久的时间。它大部分的调用开销都在进程和内存管理上(wait4/mmap/getpid…)。

实际上,从两个图中 clone 系统调用的次数,我们可以看出 good_script.sh 只需要启动 3 个进程,而 poor_script.sh 完成整个任务居然启动了 392 个进程,而进程创建和销毁的代价是相当高的,性能不差才怪。如果目录下的 cpp 文件再多一些,那要花费的时间将会更久!

总结

当发现进程或服务异常时,我们可以通过 strace 来跟踪其系统调用,“看看它在干啥”,进而找到异常的原因。熟悉常用系统调用,能够更好地理解和使用 strace。

当然,strace 也不是万能的,当目标进程卡死在用户态时,strace 就没有输出了。

这个时候我们需要其他的跟踪手段,比如 gdb 等。

悦读

道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。

;