1. 前言
限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺。
2. 背景
本文分析基于 linux-4.14.132
上游代码。
运行环境为:
Ubuntu 16.04.4 LTS
+ QEMU
+ Arm vexpress-a9
rootfs 基于 ubuntu-base-16.04-core-armhf.tar.gz
制作。
3. 问题场景和分析过程
交叉编译了 perf 后,将 perf 放到 rootfs 的 /usr/bin/perf
路径,用QEMU启动系统后,执行 perf ,系统提示 No such file or directory
。通过 ls
命令发现文件 /usr/bin/perf
确实存在,所以,No such file or directory
信息提示的并不是文件 /usr/bin/perf
不存在,而应该是提示 perf 执行过程中,需要加载的其它文件不存在。由于 perf 程序是通过动态链接方式编译的,所以 perf 执行过程中,需加载相关的解释器程序(动态链接器)
和动态链接库
。事情到了这里,我们通常可能会怀疑是编译链接过程出了差错。用file
命令,对比了不能正常运行的 perf 程序,和能正常运行的 make 程序的基本执行信息:
$ file /usr/bin/perf
/usr/bin/perf: ELF 32-bit LSB executable, ARM, EABI5 version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux.so.3, for GNU/Linux 3.2.0, BuildID[sha1]=b33d1b50a0a7636b8f5c48cc111e0c816c691fc9, not stripped
$ file /usr/bin/make
/usr/bin/make: ELF 32-bit LSB executable, ARM, EABI5 version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux-armhf.so.3, for GNU/Linux 2.6.32, BuildID[sha1]=0b89bb2e75e4a812e398a069ad88628f6f535dd5, stripped
通过上面两条信息,我们看到关键差异在于,perf 和 make 指向的解释器程序(即动态链接器)不同,分别是/lib/ld-linux.so.3
和/lib/ld-linux-armhf.so.3
。由于根文件系统基于ubuntu-base-16.04-core-armhf.tar.gz
构建 ,该基础包包含的解释器程序是/lib/ld-linux-armhf.so.3
,而不是/lib/ld-linux.so.3
,导致系统在执行 perf 程序时,找不到需要的解释器程序/lib/ld-linux.so.3
,从而输出 No such file or directory
提示信息。在将编译器由arm-linux-gnueabi-gcc
(通过 apt 安装的用来编译内核的编译器),更换为arm-linux-gnueabihf-gcc
后,运行如下命令序列
cd tools # 切换到内核代码 tools 目录
make perf_clean # 清空 perf 目录下旧的编译文件,或 make clean 清空 tools 的所有子目录
make ARCH=arm CROSS_COMPILE=arm-linux-gnueabihf- perf # 编译 perf
重新编译 perf 后,我们看到程序可以正常运行了:
$ perf
usage: perf [--version] [--help] [OPTIONS] COMMAND [ARGS]
...
$ file `which perf`
/usr/bin/perf: ELF 32-bit LSB executable, ARM, EABI5 version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux-armhf.so.3, for GNU/Linux 2.6.16, BuildID[sha1]=fa482c30f51a3b34231c9a6011681a7bb43679bd, not stripped
问题已经解决了,但我还是从代码层面进一步分析了出错的原因。我们是从 bash 启动 perf 程序的,而 bash 启动程序的过程是通过系统调用fork() + execve()
发起的。在我们的场景下,报错代码路径执行的简要流程如下:
sys_execve()
do_execve(getname(filename), argv, envp)
...
/* 打开程序文件 /usr/bin/perf */
file = do_open_execat(fd, filename, flags);
...
/* 执行程序 /usr/bin/perf */
exec_binprm(bprm)
...
load_elf_binary() /* 执行 ELF 格式程序 */
...
/* 读取ELF文件的所有phdr */
elf_phdata = load_elf_phdrs(&loc->elf_ex, bprm->file);
...
for (i = 0; i < loc->elf_ex.e_phnum; i++) {
if (elf_ppnt->p_type == PT_INTERP) { /* 解释器程序路径, 如 /lib/ld-linux-armhf.so.3 */
...
/* 如果找不到解释器程序,将返回错误码 ENOENT,对应的错误信息为 No such file or directory */
interpreter = open_exec(elf_interpreter);
retval = PTR_ERR(interpreter);
if (IS_ERR(interpreter))
goto out_free_interp;
}
...
}
当然,在 sys_execve()
系统调用的代码路径中,并非只有一处返回 ENOENT
错误码,在这里是通过 ftrace
来确认在内核代码哪一处返回ENOENT
的。以下是确认上述调用路径的操作步骤:
# cd /sys/kernel/debug/tracing
# echo 0 > tracing_on
# echo > trace
# echo function_graph > current_tracer
# echo do_execveat_common > set_graph_function
# echo 4 > max_graph_depth
# echo 1 > tracing_on
# perf
# echo 0 > tracing_on
# cat trace
cat trace
命令用来查看 ftrace
追踪记录,我们截取 perf 执行过程追踪部分如下:
# tracer: function_graph
#
# CPU DURATION FUNCTION CALLS
# | | | | | | |
2) | do_execveat_common() {
2) | unshare_files() {
2) 2.917 us | unshare_fd();
2) + 20.791 us | }
2) + 12.500 us | kmem_cache_alloc_trace();
2) | prepare_bprm_creds() {
2) 3.250 us | mutex_lock_interruptible();
2) | prepare_exec_creds() {
2) + 17.834 us | prepare_creds();
2) + 46.042 us | }
2) + 89.666 us | }
2) 2.875 us | _raw_spin_lock();
2) | do_open_execat() {
2) | do_filp_open() {
2) ! 125.542 us | path_openat();
2) 3.500 us | restore_nameidata();
2) ! 174.833 us | }
2) 2.792 us | __fsnotify_parent();
2) 3.625 us | fsnotify();
2) ! 233.875 us | }
2) | sched_exec() {
2) 5.709 us | _raw_spin_lock_irqsave();
2) + 30.708 us | select_task_rq_fair();
2) 3.917 us | _raw_spin_unlock_irqrestore();
2) ! 105.833 us | }
2) | mm_alloc() {
2) 4.375 us | kmem_cache_alloc();
2) | mm_init() {
2) 1.541 us | __init_rwsem();
2) + 68.000 us | pgd_alloc();
2) ! 105.708 us | }
2) ! 141.500 us | }
2) 5.000 us | kmem_cache_alloc();
2) 3.125 us | down_write_killable();
2) 2.458 us | vm_get_page_prot();
2) | insert_vm_struct() {
2) | cap_vm_enough_memory() {
2) 3.291 us | cap_capable();
2) + 17.708 us | }
2) 4.292 us | __vm_enough_memory();
2) | vma_link() {
2) 1.042 us | __vma_link_list();
2) 5.083 us | __vma_link_rb();
2) 0.833 us | __vma_link_file();
2) + 26.875 us | }
2) ! 494.417 us | }
2) 1.084 us | up_write();
2) | count.constprop.4() {
2) + 13.625 us | get_user_arg_ptr();
2) 1.416 us | _cond_resched();
2) 9.334 us | get_user_arg_ptr();
2) + 63.291 us | }
2) | count.constprop.4() {
2) | get_user_arg_ptr() {
2) + 25.542 us | do_page_fault();
2) + 68.500 us | }
2) 1.083 us | _cond_resched();
2) 9.083 us | get_user_arg_ptr();
2) 0.958 us | _cond_resched();
2) 8.916 us | get_user_arg_ptr();
2) 0.958 us | _cond_resched();
2) 8.916 us | get_user_arg_ptr();
2) 0.917 us | _cond_resched();
2) 8.750 us | get_user_arg_ptr();
2) 0.959 us | _cond_resched();
2) 8.833 us | get_user_arg_ptr();
2) 0.959 us | _cond_resched();
2) 8.875 us | get_user_arg_ptr();
2) 0.916 us | _cond_resched();
2) 8.792 us | get_user_arg_ptr();
2) 0.916 us | _cond_resched();
2) 8.792 us | get_user_arg_ptr();
2) 0.917 us | _cond_resched();
2) + 35.958 us | get_user_arg_ptr();
2) + 28.083 us | _cond_resched();
2) + 19.833 us | get_user_arg_ptr();
2) 1.917 us | _cond_resched();
2) + 43.042 us | get_user_arg_ptr();
2) 1.875 us | _cond_resched();
2) + 16.500 us | get_user_arg_ptr();
2) 1.708 us | _cond_resched();
2) + 16.208 us | get_user_arg_ptr();
2) 2.334 us | _cond_resched();
2) + 18.333 us | get_user_arg_ptr();
2) ! 850.917 us | }
2) | prepare_binprm() {
2) 3.416 us | mnt_may_suid();
2) | cap_bprm_set_creds() {
2) 1.500 us | mnt_may_suid();
2) + 11.542 us | get_vfs_caps_from_disk();
2) + 46.334 us | }
2) | kernel_read() {
2) + 64.667 us | vfs_read();
2) + 81.792 us | }
2) ! 174.084 us | }
2) | copy_strings_kernel() {
2) | copy_strings() {
2) + 16.916 us | get_user_arg_ptr();
2) 2.667 us | _cond_resched();
2) ! 120.792 us | get_user_pages_remote();
2) 2.625 us | acct_arg_size();
2) 1.458 us | flush_cache_page();
2) 1.625 us | flush_kernel_dcache_page();
2) 1.375 us | put_arg_page();
2) ! 413.833 us | }
2) ! 423.500 us | }
2) | copy_strings() {
2) 9.583 us | get_user_arg_ptr();
2) 1.375 us | _cond_resched();
2) | get_user_pages_remote() {
2) + 13.209 us | __get_user_pages();
2) + 20.666 us | }
2) 0.875 us | acct_arg_size();
2) 0.792 us | flush_cache_page();
2) 9.292 us | get_user_arg_ptr();
2) | do_page_fault() {
2) 1.458 us | down_read_trylock();
2) 2.875 us | find_vma();
2) + 12.875 us | handle_mm_fault();
2) 0.959 us | up_read();
2) + 46.542 us | }
2) 1.333 us | _cond_resched();
2) 9.125 us | get_user_arg_ptr();
2) 1.292 us | _cond_resched();
2) 9.083 us | get_user_arg_ptr();
2) 1.250 us | _cond_resched();
2) 9.083 us | get_user_arg_ptr();
2) 1.250 us | _cond_resched();
2) 9.084 us | get_user_arg_ptr();
2) | do_page_fault() {
2) 1.125 us | down_read_trylock();
2) 2.334 us | find_vma();
2) 9.042 us | handle_mm_fault();
2) 0.875 us | up_read();
2) + 42.917 us | }
2) 1.375 us | _cond_resched();
2) 9.167 us | get_user_arg_ptr();
2) 1.250 us | _cond_resched();
2) 9.042 us | get_user_arg_ptr();
2) | do_page_fault() {
2) 1.167 us | down_read_trylock();
2) 2.292 us | find_vma();
2) 8.750 us | handle_mm_fault();
2) 0.833 us | up_read();
2) + 43.375 us | }
2) ==========> |
2) | gic_handle_irq() {
2) ! 151.958 us | __handle_domain_irq();
2) ! 170.791 us | }
2) <========== |
2) 1.625 us | _cond_resched();
2) + 10.167 us | get_user_arg_ptr();
2) 1.625 us | _cond_resched();
2) + 17.500 us | get_user_arg_ptr();
2) 2.292 us | _cond_resched();
2) + 16.625 us | get_user_arg_ptr();
2) 2.250 us | _cond_resched();
2) + 16.542 us | get_user_arg_ptr();
2) 2.208 us | _cond_resched();
2) + 16.500 us | get_user_arg_ptr();
2) 2.250 us | _cond_resched();
2) + 16.541 us | get_user_arg_ptr();
2) | do_page_fault() {
2) 3.042 us | down_read_trylock();
2) 5.209 us | find_vma();
2) + 22.166 us | handle_mm_fault();
2) 1.583 us | up_read();
2) + 92.500 us | }
2) 2.458 us | _cond_resched();
2) 2.584 us | flush_kernel_dcache_page();
2) 2.459 us | put_arg_page();
2) # 2887.709 us | }
2) | copy_strings() {
2) + 25.167 us | get_user_arg_ptr();
2) 1.334 us | _cond_resched();
2) | get_user_pages_remote() {
2) + 16.250 us | __get_user_pages();
2) + 24.042 us | }
2) 0.791 us | acct_arg_size();
2) 0.792 us | flush_cache_page();
2) 1.291 us | flush_kernel_dcache_page();
2) 1.042 us | put_arg_page();
2) ! 147.708 us | }
2) | would_dump() {
2) | inode_permission() {
2) 2.916 us | __inode_permission();
2) 9.792 us | }
2) + 17.042 us | }
2) 2.000 us | task_active_pid_ns();
2) 1.792 us | __task_pid_nr_ns();
2) | search_binary_handler() {
2) 1.417 us | _raw_read_lock();
2) 1.500 us | try_module_get();
2) 1.458 us | load_script();
2) 0.833 us | _raw_read_lock();
2) 0.833 us | module_put();
2) 0.833 us | try_module_get();
2) | load_elf_binary() {
2) 3.000 us | kmem_cache_alloc_trace();
2) 1.250 us | elf_check_arch();
2) + 42.041 us | load_elf_phdrs();
2) 2.916 us | __kmalloc();
2) + 13.625 us | kernel_read();
2) + 59.125 us | open_exec();
2) 3.417 us | kfree();
2) 1.458 us | kfree();
2) 1.333 us | kfree();
2) ! 192.750 us | }
2) 1.042 us | _raw_read_lock();
2) 0.791 us | module_put();
2) ! 257.292 us | }
2) 1.208 us | acct_arg_size();
通过查看上面的追踪记录,同时结合内核代码,我们可以判定,load_elf_binary()
调用终止于如下代码路径:
load_elf_binary()
loc = kmalloc(sizeof(*loc), GFP_KERNEL);
...
elf_phdata = load_elf_phdrs(&loc->elf_ex, bprm->file);
...
for (i = 0; i < loc->elf_ex.e_phnum; i++) {
if (elf_ppnt->p_type == PT_INTERP) {
elf_interpreter = kmalloc(elf_ppnt->p_filesz, GFP_KERNEL);
...
kernel_read(bprm->file, elf_interpreter, elf_ppnt->p_filesz, &pos);
interpreter = open_exec(elf_interpreter); /* 找不到动态链接器文件,返回 ENOENT */
retval = PTR_ERR(interpreter);
if (IS_ERR(interpreter))
goto out_free_interp; /* 出错了,从这里退出了 load_elf_binary() 函数 */
/* 如果没有出错,would_dump() 会出现在 load_elf_binary() 函数调用的追踪记录中 */
would_dump(bprm, interpreter);
...
}
}
...
out_free_interp: /* 我们的场景中,出错后跳转到这里 */
kfree(elf_interpreter);
out_free_ph:
kfree(elf_phdata);
goto out;
ftrace
的配置和使用方法在这里不作展开,读者可自行查阅相关资料或参考博文 Linux: ftrace使用手册 。
4. 后记
在确认文件/usr/bin/perf
存在的情形下,仍然提示No such file or directory
,确实让人有些困惑,但我们相信,事出必有因,逐步分析,抽丝剥茧,真相总会浮出水面,而在这个过程中,我们终有所得。
现实中,存在更多文件存在,但不能运行的情景,如程序路径不对
、远程传送拷贝导致程序不完整
、运行为其它架构编译的程序
等等。
5. 番外
我们经常看到类似如下的编译器
arm-none-eabi-gcc
arm-linux-gnueabi-gcc
arm-linux-gnueabihf-gcc
让人不知所措,很是迷茫。下面一个简单的小结,可以帮助我们理解它们。
交叉编译工具链的命名规则为:arch[-vendor][-os][-(gnu)eabi]
arch: 体系架构,如ARM,MIPS
vendor: 工具链提供商
os: 目标操作系统,如 linux
eabi: 嵌入式应用二进制接口(Embedded Application Binary Interface)
根据对操作系统的支持与否,ARM GCC可分为支持和不支持操作系统,如arm-none-eabi
,这个是没有操作系统的,自然不可能支持那些跟操作系统关系密切的函数,比如fork(2),它使用的是newlib
这个专用于嵌入式系统的C库。而arm-none-linux-eabi
,是用于Linux的,使用glibc
。