首先:/proc/sys/kernel/core_pattern指定core文件的存储位置
配置文件正常(本工程中,当发生coredump时启动一个进程用于记录异常错误信息。其中‘|’ 管道符将生成的core文件传递给后面所跟的脚本去处理。)
排查步骤:当发生coredump时,会执行函数do_coredump<fs/coredump.c>。参考博客:https://blog.csdn.net/Rong_Toa/article/details/120048269
1)通过增加打印信息,发现函数在这里退出了。
struct linux_binfmt binfmt = mm->binfmt;
if (!binfmt || !binfmt->core_dump)
goto fail;
这里表明binfmt指针为NULL或者core_dump指针为NULL
2)全局搜索struct linux_binfmt(这里有点简单粗暴,最笨的方法) 发现在fs/binfmt_elf.c中存在如下代码
#ifdef CONFIG_ELF_CORE
static int elf_core_dump(struct coredump_params *cprm);
#else
#define elf_core_dump NULL
#endif
static struct linux_binfmt elf_format = {
.module = THIS_MODULE,
.load_binary = load_elf_binary,
.load_shlib = load_elf_library,
.core_dump = elf_core_dump,
.min_coredump = ELF_EXEC_PAGESIZE,
}; 注意看这里的NULL指针,关联性很大。
3)验证:在内核配置中查找是否包含CONFIG_ELF_CORE。
很明显这里没设置,重新编译测试 =》发生coredump时生成了core文件
补充:do_coredump函数中helper_argv[0]为core_pattern中配置的执行脚本的名称
call_usermodehelper_setup(helper_argv[0],**);
solution:
在内核配置中增加CONFIG_ELF_CORE=y
(maybe + CONFIG_CORE_DUMP_DEFAULT_ELF_HEADERS=y)
[linux内核版本:5.4.55]