Bootstrap

计算机操作系统——进程控制(Linux)

进程创建

fork()函数

fork() 是 Linux 和类 Unix 系统中用于创建新进程的系统调用。它是进程创建的核心机制之一。当一个进程调用 fork() 时,它会创建一个几乎完全相同的新进程,称为子进程

fork() 的基本功能

创建子进程:调用 fork() 时,操作系统会复制调用进程(父进程)的地址空间、堆栈、文件描述符等信息,创建一个新的子进程。子进程几乎是父进程的一个副本,但有两个关键区别

  • 子进程拥有一个新的进程ID(PID)。
  • 子进程和父进程的返回值不同,fork() 会返回两次:一次在父进程中,返回子进程的PID;另一次在子进程中,返回0。

父子进程的区分:通过 fork() 返回的值,父进程和子进程可以根据不同的返回值执行不同的代码逻辑:

  • 在父进程中,fork() 返回子进程的 PID(大于 0 的值)。
  • 在子进程中,fork() 返回 0。
  • 进程表:每个进程在操作系统内都有一个进程表项,包括进程ID(PID)、父进程ID(PPID)等信息。父进程的 PID 就是子进程的 PPID。

fork() 的基本语法

#include <unistd.h>
#include <sys/types.h>

pid_t fork(void);

返回值

  • 如果 fork() 成功,返回值在父进程中是子进程的 PID,在子进程中是 0。
  • 如果 fork() 失败,返回 -1,并设置 errno。

fork() 的工作原理

复制父进程:fork() 会复制父进程的所有资源,如内存、文件描述符、环境变量等。这里需要注意的是,现代操作系统通常会使用 写时复制(Copy on Write,COW) 技术来延迟复制内存,直到父子进程尝试修改数据时,才会进行真正的内存复制,从而提高效率。

在这里插入图片描述
在这里插入图片描述

进程调⽤fork,当控制转移到内核中的fork代码后,内核做:

  • 分配新的内存块和内核数据结构给⼦进程
  • 将⽗进程部分数据结构内容拷⻉⾄⼦进程
  • 添加⼦进程到系统进程列表当中
  • fork返回,开始调度器调度

资源共享:父进程和子进程共享某些资源(例如文件描述符、信号等),但它们有独立的内存空间。

返回值

父进程:返回子进程的 PID。
子进程:返回 0。
进程创建

fork() 的典型使用示例

#include <stdio.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();  // 创建子进程

    if (pid == -1) {
        // fork失败
        perror("fork failed");
        return 1;
    } else if (pid > 0) {
        // 父进程
        printf("This is the parent process, child PID is %d\n", pid);
    } else {
        // 子进程
        printf("This is the child process\n");
    }

    return 0;
}

输出:

This is the parent process, child PID is 12345
This is the child process

注意:fork() 调用时,父进程和子进程的输出顺序不一定相同,具体执行顺序由操作系统调度器决定。

fork() 的常见问题

子进程不会继承父进程的锁:fork() 会复制父进程的资源,包括文件描述符,但不会复制父进程持有的锁(如互斥锁、读写锁)。如果父进程在 fork() 后还持有某些锁,可能会导致子进程死锁。

资源消耗:每次 fork() 都会创建一个新的进程,这会消耗一定的内存和系统资源,尤其是在创建多个进程时,可能会影响系统性能。因此,要注意避免频繁调用 fork()。

进程僵尸:当子进程退出后,父进程应该通过调用 wait() 或 waitpid() 等函数来回收子进程的资源。如果父进程没有处理,子进程会变成 “僵尸进程”(Zombie Process),占用系统资源直到父进程清理它。

进程ID的分配:每个进程都有唯一的进程ID(PID)。父进程的 PID 和子进程的 PID 是不同的。

fork() 和 exec() 结合使用

在许多情况下,fork() 和 exec() 被结合使用来启动新的程序。fork() 用于创建一个子进程,而 exec() 系列函数则用于加载不同的程序。

#include <stdio.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == 0) {
        // 子进程执行新程序
        execlp("/bin/ls", "ls", "-l", (char *) NULL);
        // 如果 execlp 失败,输出错误
        perror("execlp failed");
    } else if (pid > 0) {
        // 父进程等待子进程结束
        wait(NULL);
        printf("Child process finished\n");
    }

    return 0;
}

在这个示例中,子进程会执行 ls -l 命令,而父进程则等待子进程结束。

总结

  • fork() 是 Linux 中用于创建新进程的系统调用,返回两次:一次在父进程中返回子进程的 PID,一次在子进程中返回 0。
  • 它复制父进程的资源,并使用写时复制技术优化性能。
  • 子进程和父进程是相互独立的,但它们共享某些资源,如文件描述符。
  • 父进程应该使用 wait() 等函数来回收子进程的资源,避免僵尸进程。

进程终止与$

进程终止的本质

进程终止指的是操作系统内的进程在完成其任务或遇到异常时,从系统中注销,释放其占用的资源,并通过某种方式通知父进程(如果存在)其退出状态。进程的终止意味着其执行的生命周期结束,操作系统会清理进程占用的内存、文件描述符、子进程等资源。

进程的终止通常由以下几种情况引起:

正常终止:进程完成任务并主动退出。
异常终止:进程遇到错误或异常情况而被操作系统强制终止。
被信号中断:进程接收到外部信号(如 SIGKILL 或 SIGTERM)而终止。

进程终止的情况

进程终止可以发生在不同的情况下,具体有以下几种情况:

正常退出(Exit)

进程执行完其所有任务后,可以主动退出,通常通过调用 exit() 系统调用来实现。进程结束时,操作系统会回收进程的资源,并通知其父进程。父进程通过 wait() 或 waitpid() 等系统调用来获取子进程的退出状态。

由于信号终止

进程在运行时可以接收到来自外部或内部的信号,这些信号可能导致进程中止。例如:

  • SIGKILL:无条件终止进程,无法被捕捉或忽略。
  • SIGTERM:请求进程终止,允许进程清理资源。
  • SIGSEGV:段错误,通常表示进程访问了非法内存。
  • SIGABRT:进程由于调用 abort() 函数而终止,通常是由于程序发生了严重错误。

非正常退出(错误或崩溃)

进程可能由于错误(如非法内存访问、除零错误、系统资源不足等)导致崩溃退出。在这种情况下,操作系统会发送错误信号给进程,通常会生成核心转储文件(core dump)以帮助调试。

进程被父进程终止

父进程可以通过发送信号来终止子进程。例如,父进程可以使用 kill() 函数发送一个 SIGKILL 或 SIGTERM 信号来中止子进程的执行。

进程退出的方法

进程可以通过多种方式退出:

exit() 函数

exit() 是标准库函数,用于正常终止进程。它会做以下几件事情:

  • 关闭所有已打开的文件描述符。
  • 清理由进程分配的内存。
  • 调用终止处理程序(如果有)。
  • 通知操作系统进程已终止。
#include <stdlib.h>

int main() {
    // 进行某些操作
    exit(0);  // 正常退出,返回退出码0
}

_exit() 系统调用

_exit() 是系统调用,用于立即退出进程,而不执行任何清理操作(如关闭文件描述符、调用终止处理程序等)。它主要用于子进程退出,避免清理父进程设置的资源。

#include <unistd.h>

int main() {
    // 执行操作
    _exit(0);  // 立即退出,不进行标准库的清理操作
}

abort() 函数

abort() 函数用于非正常退出,它通常在程序遇到严重错误时调用。它会立即终止进程并生成核心转储文件,方便调试。

#include <stdlib.h>

int main() {
    // 出现严重错误,退出程序
    abort();  // 终止进程并生成核心文件
}

接收到信号

进程也可能通过接收到某些信号而被终止。操作系统通过信号机制通知进程发生了某些事件,如 SIGKILL(强制终止)或 SIGSEGV(段错误)。进程可以捕获某些信号并执行自定义的信号处理程序,或者直接退出。

#include <signal.h>

void signal_handler(int sig) {
    if (sig == SIGSEGV) {
        // 处理段错误
        exit(1);
    }
}

int main() {
    signal(SIGSEGV, signal_handler);  // 捕获段错误信号
    // 代码中可能发生段错误
    return 0;
}

退出码详解

退出码(Exit Status)是一个用于标识进程退出状态的整数。退出码是进程结束时向操作系统报告的一个数字,通常用来告诉父进程进程是如何退出的。

正常退出码

  • 0:表示进程成功执行完毕并正常退出,常见的退出码。

非零退出码

非零值:表示进程遇到错误或异常而退出。操作系统和父进程通常会根据非零值来判断错误类型。常见的非零退出码有:

  • 1:一般性错误。
  • 2:命令行参数错误。
  • 126:命令不能执行(权限问题)。
  • 127:命令未找到。
  • 128:进程由于信号导致的退出,退出码为 128 + 信号编号(例如,SIGKILL 信号编号为 9,退出码为 137)。

在这里插入图片描述

父进程获取退出码

父进程可以通过调用 wait() 或 waitpid() 等系统调用来获取子进程的退出码。退出码的高字节和低字节分别表示不同的信息:

高字节:表示子进程是否因信号退出。
低字节:表示进程正常退出时的退出码。
例如,WEXITSTATUS(status) 宏可以用来获取正常退出的退出码,WIFSIGNALED(status) 用来判断进程是否因信号退出。
在 Linux 中,程序的退出码(Exit Code)是一个 8 位无符号整数,通常表示程序的退出状态。它由两个部分组成:低位(低 7 位)和 高位(高 1 位)。这两个部分分别代表不同的含义。

退出码的构成

退出码的范围从 0 到 255(即 0x00 到 0xFF)。通常情况下,退出码的构成可以分为两个部分:

低 7 位(0-127):用于表示程序的执行结果,通常用来表示 成功或错误 的不同状态。
高 1 位(128-255):表示程序是否是因为某个 信号终止 而退出。

低位(0-127)

0:表示程序正常退出,执行成功。通常,任何程序正常执行完毕后,都会返回退出码 0。

1-127:表示程序执行过程中出现了错误。不同的程序可能会定义不同的退出码来表示不同的错误类型。比如:

  • 1 通常表示常见的错误。
  • 2 可能表示使用错误的命令行参数。
  • 126 可能表示权限问题(命令无法执行)。
  • 127 通常表示找不到命令。

这部分退出码由程序开发者或操作系统约定,用于标识程序执行的错误类型。

高位(128-255)

当程序因为 信号 被终止时,退出码会反映这种信号的编号。退出码的计算公式是:

退出码 = 128 + 信号编号

例如,程序因为 SIGKILL 信号(信号编号 9)而被强制终止时,退出码将是 137(128 + 9)。

如果程序由于 SIGSEGV 信号(信号编号 11,即段错误)崩溃退出,则退出码将是 139(128 + 11)。

这种退出码范围从 128 到 255,表示程序因接收到特定的信号而终止。

#include <stdio.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();
    if (pid == 0) {
        // 子进程正常退出
        _exit(42);  // 退出码为42
    } else {
        int status;
        wait(&status);
        if (WIFEXITED(status)) {
            printf("Child exited with code %d\n", WEXITSTATUS(status));
        } else if (WIFSIGNALED(status)) {
            printf("Child terminated by signal %d\n", WTERMSIG(status));
        }
    }
    return 0;
}

总结

  • 进程终止的本质:进程终止是操作系统回收进程资源、清理内存并通知父进程的过程。
  • 终止原因:可以是正常结束、错误崩溃、外部信号等。
  • 退出方法:包括 exit()、_exit()、abort()、信号等方式。
  • 退出码:是进程退出时向操作系统报告的状态,通常 0 表示成功,非零值表示异常退出,父进程可以通过 wait() 获取子进程的退出状态。

进程等待

在操作系统中,进程的等待通常是指父进程等待子进程完成执行后获取其退出状态(exit status)。这个机制对于进程管理和资源回收非常重要,能够避免僵尸进程的出现,并确保父进程能够得到子进程的执行结果。

进程等待的必要性

当一个进程创建了子进程时,父进程需要等到子进程完成执行,并获取子进程的退出状态。否则,子进程的资源将无法及时回收,导致僵尸进程的产生。僵尸进程指的是子进程已经终止,但其退出状态尚未被父进程获取的进程。僵尸进程会占用系统资源,如进程表项,影响系统性能,并且无法被kill -9杀死

为什么需要等待?

避免僵尸进程:子进程终止后,操作系统不会立即销毁子进程的进程表项,父进程需要通过wait()或waitpid()获取子进程的退出状态,从而清理相关资源。
获取子进程的执行结果:父进程需要知道子进程是否正常完成工作、是否发生了错误等信息。这些信息通过退出码传递。
同步进程间的操作:父进程可以在等待子进程时,确保子进程已经完成特定任务,避免在子进程还没完成时继续执行某些操作。

等待方法

在 Linux 系统中,父进程获取子进程状态的方法主要有以下几种:

wait()

wait() 是最基本的等待方法,它会阻塞父进程,直到任一子进程终止。父进程调用该系统调用时,会挂起,直到一个子进程结束。

语法

pid_t wait(int *status);

status:如果不为 NULL,该参数会返回子进程的退出状态。
返回值:成功时返回终止的子进程的进程ID(PID),失败时返回 -1。
示例

#include <stdio.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();
    
    if (pid == 0) {
        // 子进程
        printf("Child process\n");
        exit(0);
    } else {
        // 父进程
        int status;
        wait(&status);  // 等待子进程退出
        if (WIFEXITED(status)) {
            printf("Child exited with status %d\n", WEXITSTATUS(status));
        }
    }

    return 0;
}

在这个例子中,父进程等待子进程退出,并获取子进程的退出状态。

waitpid()

waitpid() 是 wait() 的增强版本,父进程可以选择等待特定的子进程,或者控制是否阻塞。

语法

pid_t waitpid(pid_t pid, int *status, int options);

(1)pid:可以指定等待特定的子进程(通过其 PID),或者等待所有子进程。

  • pid > 0:等待具有指定 PID 的子进程。
  • pid == -1:等待任何子进程(类似 wait() 的行为)。
  • pid == 0:等待与当前进程属于同一进程组的子进程。
  • pid < -1:等待属于某个进程组的子进程。
    status:与 wait() 相同,用于存储子进程的退出状态。

(2)options:控制等待的选项,如:

  • WNOHANG:非阻塞方式,如果没有子进程退出,立即返回。
  • WUNTRACED:如果子进程停止(例如通过SIGSTOP信号),返回。
  • WCONTINUED:如果子进程恢复运行,返回。

示例

#include <stdio.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <unistd.h>

int main() {
    pid_t pid = fork();

    if (pid == 0) {
        // 子进程
        printf("Child process\n");
        sleep(2);  // 模拟子进程运行
        exit(0);
    } else {
        // 父进程
        int status;
        pid_t result = waitpid(pid, &status, WNOHANG);  // 非阻塞等待
        if (result == 0) {
            printf("Child is still running\n");
        } else if (result == pid) {
            if (WIFEXITED(status)) {
                printf("Child exited with status %d\n", WEXITSTATUS(status));
            }
        }
    }

    return 0;
}

在这个例子中,父进程使用非阻塞的 waitpid() 来检查子进程的状态,如果子进程还未退出,则返回 0。

waitid()

waitid() 是 waitpid() 的另一种变体,提供了更细力度的控制,允许父进程获取更多的状态信息,如进程是否由于信号终止等。

语法

int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options);
  • idtype:指定要等待的进程类别(如 P_PID 等)。
  • id:指定要等待的进程 ID。
  • infop:存储关于终止进程的详细信息。
  • options:与 waitpid() 类似,控制等待行为。

阻塞和非阻塞等待详解

阻塞等待

默认的 wait() 和 waitpid() 都是阻塞的,父进程会等待子进程的终止,直到获取子进程的退出状态。如果没有子进程可等待,父进程将挂起直到有子进程退出。

非阻塞等待

通过在 waitpid() 中传递 WNOHANG 选项,可以使父进程进行非阻塞等待。如果没有子进程退出,父进程会立即返回,程序可以继续执行其他任务。

pid_t waitpid(pid_t pid, int *status, int options);

其中,options 可以指定 WNOHANG,使得调用非阻塞。

  • WNOHANG:如果没有子进程退出,waitpid() 会立即返回 0,而不是阻塞等待。
  • WUNTRACED:如果子进程已停止,waitpid() 会返回,即使没有退出。

获取子进程的状态

通过 status 变量可以获取子进程的退出状态。父进程可以使用如下宏来分析 status:

  • WIFEXITED(status):检查子进程是否正常退出。
  • WIFSIGNALED(status):检查子进程是否由于信号导致终止。
  • WIFSTOPPED(status):检查子进程是否由于信号停止。
  • WEXITSTATUS(status):获取子进程的退出状态码(如果正常退出)。
  • WTERMSIG(status):获取导致子进程终止的信号编号。

总结

父进程等待子进程的必要性:防止僵尸进程、获取子进程的退出状态和同步操作。

等待方法:wait()、waitpid() 和 waitid() 提供不同的等待机制。

阻塞与非阻塞等待:wait() 和 waitpid() 默认阻塞,waitpid() 可以通过 WNOHANG 实现非阻塞。

获取子进程状态:通过 status 获取退出状态,并使用宏分析退出原因。

进程程序替换

进程替换是操作系统中用于管理进程执行的一种机制,特别是在多任务操作系统中。它的主要目的是通过上下文切换(Context Switch)实现多个进程的并发执行。操作系统通常通过进程调度来决定哪个进程在某一时刻占用 CPU,这个过程涉及到进程的保存和恢复状态,通常称为“进程替换”。

进程替换的基本概念

进程替换(或进程切换)是指操作系统从一个进程切换到另一个进程的过程。在进程替换的过程中,操作系统需要保存当前进程的执行状态,并恢复下一个进程的执行状态。它通常发生在以下几种情况:

  • 时间片到期:如果采用时间片轮转调度算法,当一个进程的时间片用完时,操作系统会选择另一个进程来占用 CPU。
  • 进程阻塞:如果进程因等待 I/O 操作、等待资源等原因进入阻塞状态,操作系统会选择其他进程来执行。
  • 进程终止:当一个进程执行完成或被终止时,操作系统会调度另一个进程来继续执行。
  • 高优先级进程到来:如果一个高优先级的进程被创建,操作系统可能会中断当前进程,切换到高优先级进程。

替换函数

 #include <unistd.h>
 
 int execl(const char *path, const char *arg, ...);
 int execlp(const char *file, const char *arg, ...);
 int execle(const char *path, const char *arg, ...,char *const envp[]);
 int execv(const char *path, char *const argv[]);
 int execvp(const char *file, char *const argv[]);
 int execve(const char *path, char *const argv[], char *const envp[]);

替换函数解释

在这里插入图片描述

exec 系列函数是 Linux 系统中的一组用于进程替换的系统调用。这些函数会用新的程序替换当前进程的映像(即加载另一个可执行文件),并且会将当前进程的控制转移到新程序中。进程替换后,原有的进程的代码、数据和堆栈等都会被新的程序所替换,但新程序会继承旧进程的进程标识符(PID),文件描述符等。

这些函数有不同的变种,主要的区别在于传递参数和环境变量的方式。下面是各个 exec 系列函数的详细解释。

execl(const char *path, const char *arg, …)

原型

int execl(const char *path, const char *arg, ..., (char *)NULL);

解释

  • execl 是 “exec with a list of arguments” 的缩写。
  • path 是要执行的可执行文件的路径。
  • arg 是传递给新程序的第一个参数,后面可以跟任意数量的额外参数。
  • 参数列表必须以 NULL 结束,这与 C 风格的字符串数组类似。
  • execl 的特点是,参数是以可变参数的形式提供的(即通过 …)。
  • 该函数调用成功时,不会返回,当前进程将被新程序替换;如果发生错误,返回 -1,并设置 errno。

示例

execl("/bin/ls", "ls", "-l", (char *)NULL);

这个例子会用 /bin/ls 程序替换当前进程,并传递 “ls” 和 “-l” 作为参数。

execlp(const char *file, const char *arg, …)

原型

int execlp(const char *file, const char *arg, ..., (char *)NULL);

解释

  • execlp 类似于 execl,唯一的区别是它会在系统的 PATH 环境变量指定的路径中查找 file,从而不需要提供完整的路径。
  • file 是可执行文件的名称,而不是文件的完整路径。
  • 参数列表以 NULL 结尾。
  • 如果 execlp 成功,它将用新程序替换当前进程;否则,返回 -1。

示例

execlp("ls", "ls", "-l", (char *)NULL);

这将会在 PATH 环境变量指定的路径中查找 ls 可执行文件,并将其作为新程序执行。

execle(const char *path, const char *arg, …, char *const envp[])

原型

int execle(const char *path, const char *arg, ..., char *const envp[]);

解释

  • execle 与 execl 类似,但它允许指定新的环境变量。环境变量是通过 envp[] 数组传递的。
  • path 是要执行的程序的完整路径。
  • 参数列表以 NULL 结束。
  • envp[] 是一个字符指针数组,其中每个元素是一个环境变量,格式通常是 key=value。
  • 调用成功时,当前进程将被新程序替换,失败时返回 -1。

示例

char *env[] = { "HOME=/home/user", "PATH=/bin", (char *)NULL };
execle("/bin/ls", "ls", "-l", (char *)NULL, env);

这个例子将用 /bin/ls 程序替换当前进程,传递 “ls” 和 “-l” 作为参数,并且设置新的环境变量 HOME=/home/user 和 PATH=/bin。

execv(const char *path, char *const argv[])
原型

int execv(const char *path, char *const argv[]);

解释

  • execv 是 “exec with an array of arguments” 的缩写。
  • path 是要执行的程序的完整路径。
  • argv[] 是一个指向字符串数组的指针,数组的每个元素是程序的一个参数,第一个元素通常是程序的名称,最后一个元素必须是 NULL。
  • execv 不像 execl 那样使用可变参数,而是使用一个数组来传递所有参数。
  • 调用成功时,当前进程被新程序替换,失败时返回 -1。

示例

char *args[] = { "ls", "-l", NULL };
execv("/bin/ls", args);

这个例子用 /bin/ls 程序替换当前进程,并将 “ls” 和 “-l” 作为参数传递给新程序。

execvp(const char *file, char *const argv[])
原型

int execvp(const char *file, char *const argv[]);

解释

  • execvp 类似于 execv,但它会在系统的 PATH 环境变量指定的路径中查找 file,而不需要提供完整路径。
  • file 是可执行文件的名称,argv[] 是一个参数数组,和 execv 一样。
  • 如果成功,它将用新程序替换当前进程;如果失败,返回 -1。

示例

char *args[] = { "ls", "-l", NULL };
execvp("ls", args);

这个例子会在 PATH 环境变量中查找 ls 程序,并将 “ls” 和 “-l” 作为参数传递给新程序。

execve(const char *path, char *const argv[], char *const envp[])

原型

int execve(const char *path, char *const argv[], char *const envp[]);

解释

  • execve 是所有 exec 系列函数的基础。它直接调用内核,执行一个新的程序。
  • path 是要执行的程序的完整路径。
  • argv[] 是一个指向字符串数组的指针,数组的每个元素是程序的一个参数,第一个元素通常是程序的名称,最后一个元素必须是 NULL。
  • envp[] 是一个指向环境变量的指针数组,格式通常是 key=value。
  • execve 是唯一一个可以直接指定环境变量的 exec 函数,其他的函数(如 execlp、execvp)都是在内部调用 execve 并传递环境变量。

示例

char *args[] = { "ls", "-l", NULL };
char *env[] = { "HOME=/home/user", "PATH=/bin", NULL };
execve("/bin/ls", args, env);

这个例子用 /bin/ls 程序替换当前进程,传递 “ls” 和 “-l” 作为参数,并设置新的环境变量 HOME=/home/user 和 PATH=/bin。

总结

  • execl 传递参数以可变参数列表形式,路径由完整路径指定
  • execlp 传递参数以可变参数列表形式,路径由 PATH 环境变量查找
  • execle 传递参数以可变参数列表形式,并允许设置新的环境变量
  • execv 传递参数通过字符串数组,路径由完整路径指定
  • execvp 传递参数通过字符串数组,路径由 PATH 环境变量查找
  • execve 传递参数通过字符串数组,允许设置新的环境变量

这些 exec 系列函数都能替换当前进程,并且只会在失败时返回 -1,成功时不会返回。

;