Bootstrap

【Linux】24. 线程同步与互斥

Linux线程互斥

进程线程间的互斥相关背景概念

  • 临界资源:多线程执行流共享的资源就叫做临界资源
  • 临界区:每个线程内部,访问临界资源的代码,就叫做临界区
  • 互斥:任何时刻,互斥保证有且只有一个执行流进入临界区,访问临界资源,通常对临界资源起保护作用
  • 原子性(后面讨论如何实现):不会被任何调度机制打断的操作,该操作只有两态,要么完成,要么未完成

互斥量mutex

  • 大部分情况,线程使用的数据都是局部变量,变量的地址空间在线程栈空间内,这种情况,变量归属单个线程,其他线程无法获得这种变量。
  • 但有时候,很多变量都需要在线程间共享,这样的变量称为共享变量,可以通过数据的共享,完成线程之间的交互。
  • 多个线程并发的操作共享变量,会带来一些问题。
    在这里插入图片描述
    在这里插入图片描述
    想暴露出上述情况:就需要尽可能的让多个线程交叉执行
    多个线程交叉执行本质:就是让调度器尽可能的频繁发生线程调度与切换
    线程一般在什么时候发生切换呢?时间片到了/来了更高优先级的线程/线程等待的时候。
    线程是在什么时候检测上面的问题呢?
    从内核态返回用户态的时候,线程要对调度状态进行检测,如果可以,就直接发生线程切换

为什么可能无法获得争取结果?

  • if 语句判断条件为真以后,代码可以并发的切换到其他线程
  • usleep 这个模拟漫长业务的过程,在这个漫长的业务过程中,可能有很多个线程会进入该代码段
  • –ticket 操作本身就不是一个原子操作

取出ticket–部分的汇编代码

objdump -d a.out > test.objdump
152 40064b: 8b 05 e3 04 20 00 mov 0x2004e3(%rip),%eax # 600b34 <ticket>
153 400651: 83 e8 01 sub $0x1,%eax
154 400654: 89 05 da 04 20 00 mov %eax,0x2004da(%rip) # 600b34 <ticket>

– 操作并不是原子操作,而是对应三条汇编指令:

  • load :将共享变量ticket从内存加载到寄存器中
  • update : 更新寄存器里面的值,执行-1操作
  • store :将新值,从寄存器写回共享变量ticket的内存地址

要解决以上问题,需要做到三点:

  • 代码必须要有互斥行为:当代码进入临界区执行时,不允许其他线程进入该临界区。
  • 如果多个线程同时要求执行临界区的代码,并且临界区没有线程在执行,那么只能允许一个线程进入该临界区。
  • 如果线程不在临界区中执行,那么该线程不能阻止其他线程进入临界区。

要做到这三点,本质上就是需要一把锁。Linux上提供的这把锁叫互斥量。
既然多线程并发操作共享变量会出现问题,那么就需要解决问题。于是提出概念:锁
在这里插入图片描述
在这里插入图片描述

互斥量的接口

初始化互斥量

初始化互斥量有两种方法:
方法1,静态分配:

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER

方法2,动态分配:

int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);

参数:
mutex:要初始化的互斥量
attr:NULL

销毁互斥量

销毁互斥量需要注意:

  • 使用 PTHREAD_ MUTEX_ INITIALIZER 初始化的互斥量不需要销毁
  • 不要销毁一个已经加锁的互斥量
  • 已经销毁的互斥量,要确保后面不会有线程再尝试加锁
int pthread_mutex_destroy(pthread_mutex_t *mutex)

互斥量加锁和解锁

int pthread_mutex_lock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);

返回值:成功返回0,失败返回错误号

调用 pthread_ lock 时,可能会遇到以下情况:

  • 互斥量处于未锁状态,该函数会将互斥量锁定,同时返回成功
  • 发起函数调用时,其他线程已经锁定互斥量,或者存在其他线程同时申请互斥量,但没有竞争到互斥量,那么pthread_lock调用会陷入阻塞(执行流被挂起),等待互斥量解锁。
// 加锁和解锁的过程多个线程串行执行的,程序变慢了!
// 锁只规定互斥访问,没有规定必须让谁优先执行
// 锁就是真实的让多个执行流进行竞争的结果
// 1. 多个执行流进行安全访问的共享资源 - 临界资源
// 2. 我们把多个执行流中,访问临界资源的代码 -- 临界区 -- 往往是线程代码的很小的一部分
// 3. 想让多个线程串行访问共享资源 -- 互斥
// 4. 对一个资源进行访问的时候,要么不做,要么做完 -- 原子性 , 
// 如何判断是不是原子性的情况 -- 一个对资源进行的操作,如果只用一条汇编就能完成 -- 原子性
// 反之:不是原子的 -- 当前理解,方便表述
// 1. 如何看待锁
//    a. 锁,本身就是一个共享资源!全局的变量是要被保护的,锁是用来保护全局的资源的。
// 		 锁本身也是全局资源,锁的安全谁来保护呢?
//    b. pthread_mutex_lock、pthread_mutex_unlock:加锁的过程必须是安全的!加锁的过程其实是原子的!
//    c. 如果申请成功,就继续向后执行,如果申请暂时没有成功,执行流会阻塞!
//    d. 谁持有锁,谁进入临界区!
// 2. 如何理解加锁和解锁的本质 --- 加锁的过程是原子的!
// 3. 如果我们想简单的使用,该如何进行封装设计 --- 做一个设计

锁的封装设计

#pragma once

#include <iostream>
#include <pthread.h>

class Mutex
{
public:
    Mutex(pthread_mutex_t *lock_p = nullptr) : lock_p_(lock_p)
    {
    }
    // 加锁
    void lock()
    {
        if (lock_p_)
            pthread_mutex_lock(lock_p_);
    }
    // 解锁
    void unlock()
    {
        if (lock_p_)
            pthread_mutex_unlock(lock_p_);
    }
    ~Mutex()
    {
    }

private:
    // 这个lock_p_需要外部传进来
    pthread_mutex_t *lock_p_;
};

class LockGuard
{
public:
    LockGuard(pthread_mutex_t *mutex) : mutex_(mutex)
    {
        mutex_.lock(); // 在构造函数中进行加锁
    }
    ~LockGuard()
    {
        mutex_.unlock(); // 在析构函数中进行解锁
    }
private:
    // 将自定义的mutex封装进来
    Mutex mutex_;
};

// 搞两层封装的意义 就是对互斥量进一步封装 在构造/析构中自动调用加/解锁
// 不需要在外部调用函数 外部只要定义了LockGuard就自动实现加解锁

在这里插入图片描述

加锁抢票代码

// 模拟实现抢票逻辑
#include <iostream>
#include <string>
#include <vector>
#include <pthread.h>
#include <unistd.h>
#include "Mutex.hpp"


// 加锁
pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER;

// 共享资源 -- 火车票
int tickets = 10000;

class ThreadData
{
public:
    ThreadData(const std::string &threadname)
        : threadname_(threadname)
    {
    }
    ~ThreadData()
    {
    }

public:
    std::string threadname_;
};

// 购票逻辑
void *getTicket(void *args)
{
    // other code
    ThreadData *td = static_cast<ThreadData *>(args);
    while (true)
    {
        // 加个大括号 -- 将共享区单独拿出来
        {
            // lockguard是对象 随代码块的生命周期变化 -- 换言之就是随代码块构造和析构
            // 只要定义好了 就不用管了 这就是封装的好处
            LockGuard lockguard(&lock); // RAII风格的加锁

            // 在共享区加锁
            // pthread_mutex_lock(&lock);

            if (tickets > 0)
            {
                // 值得抢
                usleep(1000);
                std::cout << td->threadname_ << " 正在进行抢票: " << tickets << std::endl;
                tickets--;

                // 解锁
                // pthread_mutex_unlock(&lock);
            }
            else
            {
                // 解锁
                // pthread_mutex_unlock(&lock);
                break;
            }
        }
        // 抢完票后 -- 模拟形成订单
        usleep(1000);
    }
    // other code
    return nullptr;
}

int main()
{
#define NUM 4
    // 创建一批线程
    std::vector<pthread_t> tids(NUM);
    for (int i = 0; i < NUM; i++)
    {
        char buffer[64];
        snprintf(buffer, sizeof(buffer), "thread %d", i + 1);
        ThreadData *td = new ThreadData(buffer);
        pthread_create(&tids[i], nullptr, getTicket, td);
    }

    for (const auto &tid : tids)
    {
        pthread_join(tid, nullptr);
    }

    return 0;
}

互斥量实现原理探究

  • 经过上面的例子,大家已经意识到单纯的 i++ 或者 ++i 都不是原子的,有可能会有数据一致性问题
  • 为了实现互斥锁操作,大多数体系结构都提供了swap或exchange指令,该指令的作用是把寄存器和内存单元的数据相交换,由于只有一条指令,保证了原子性,即使是多处理器平台,访问内存的 总线周期也有先后,一个处理器上的交换指令执行时另一个处理器的交换指令只能等待总线周期。
    在这里插入图片描述

可重入VS线程安全

概念

  • 线程安全:多个线程并发同一段代码时,不会出现不同的结果。常见对全局变量或者静态变量进行操作, 并且没有锁保护的情况下,会出现该问题。
  • 重入:同一个函数被不同的执行流调用,当前一个流程还没有执行完,就有其他的执行流再次进入,我们称之为重入。一个函数在重入的情况下,运行结果不会出现任何不同或者任何问题,则该函数被称为可重入函数,否则,是不可重入函数。

常见的线程不安全的情况

  • 不保护共享变量的函数
  • 函数状态随着被调用,状态发生变化的函数
  • 返回指向静态变量指针的函数
  • 调用线程不安全函数的函数

常见的线程安全的情况

  • 每个线程对全局变量或者静态变量只有读取的权限,而没有写入的权限,一般来说这些线程是安全的类或者接口对于线程来说都是原子操作
  • 多个线程之间的切换不会导致该接口的执行结果存在二义性

常见不可重入的情况

  • 调用了malloc/free函数,因为malloc函数是用全局链表来管理堆的
  • 调用了标准I/O库函数,标准I/O库的很多实现都以不可重入的方式使用全局数据结构
  • 可重入函数体内使用了静态的数据结构

常见可重入的情况

  • 不使用全局变量或静态变量
  • 不使用用malloc或者new开辟出的空间
  • 不调用不可重入函数
  • 不返回静态或全局数据,所有数据都有函数的调用者提供
  • 使用本地数据,或者通过制作全局数据的本地拷贝来保护全局数据

可重入与线程安全联系

  • 函数是可重入的,那就是线程安全的
  • 函数是不可重入的,那就不能由多个线程使用,有可能引发线程安全问题
  • 如果一个函数中有全局变量,那么这个函数既不是线程安全也不是可重入的。

可重入与线程安全区别

  • 可重入函数是线程安全函数的一种
  • 线程安全不一定是可重入的,而可重入函数则一定是线程安全的。
  • 如果将对临界资源的访问加上锁,则这个函数是线程安全的,但如果这个重入函数若锁还未释放则会产生死锁,因此是不可重入的。

常见锁概念

死锁

  • 死锁是指在一组进程中的各个进程均占有不会释放的资源,但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态。

死锁四个必要条件

  • 互斥条件:一个资源每次只能被一个执行流使用
  • 请求与保持条件:一个执行流因请求资源而阻塞时,对已获得的资源保持不放
  • 不剥夺条件:一个执行流已获得的资源,在末使用完之前,不能强行剥夺
  • 循环等待条件:若干执行流之间形成一种头尾相接的循环等待资源的关系

避免死锁

  • 破坏死锁的四个必要条件
  • 加锁顺序一致
  • 避免锁未释放的场景
  • 资源一次性分配

避免死锁算法

  • 死锁检测算法(了解)
  • 银行家算法(了解)
    在这里插入图片描述

Linux线程同步

条件变量

当一个线程互斥地访问某个变量时,它可能发现在其它线程改变状态之前,它什么也做不了。
例如一个线程访问队列时,发现队列为空,它只能等待,只到其它线程将一个节点添加到队列中。
这种情况就需要用到条件变量。

同步概念与竞态条件

同步:在保证数据安全的前提下,让线程能够按照某种特定的顺序访问临界资源,从而有效避免饥饿问题,叫做同步
竞态条件:因为时序问题,而导致程序异常,我们称之为竞态条件。在线程场景下,这种问题也不难理解

条件变量函数

初始化

int pthread_cond_init(pthread_cond_t *restrict cond,const pthread_condattr_t *restrict attr);

参数:
cond:要初始化的条件变量
attr:NULL

销毁

int pthread_cond_destroy(pthread_cond_t *cond)

等待条件满足

int pthread_cond_wait(pthread_cond_t *restrict cond,pthread_mutex_t *restrict mutex);

参数:
cond:要在这个条件变量上等待
mutex:互斥量,后面详细解释

唤醒等待

int pthread_cond_broadcast(pthread_cond_t *cond);
int pthread_cond_signal(pthread_cond_t *cond);

对条件变量的简单使用(代码如下:)

#include <iostream>
#include <string>
#include <unistd.h>
#include <pthread.h>

int tickets = 1000; // 共享资源

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
// cond 条件变量不能单独使用,必须搭配互斥量
// 因为条件变量无法确定互斥关系
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

void *start_routine(void *args)
{
    std::string name = static_cast<const char *>(args);
    while (true)
    {
        pthread_mutex_lock(&mutex); // 加锁

        pthread_cond_wait(&cond, &mutex); // 直接让线程在条件变量下进行等待
        // 判断先省略 -- 仅仅作为测试
        std::cout << name << " -> " << tickets << std::endl;
        tickets--;

        pthread_mutex_unlock(&mutex); // 解锁
    }
}

int main()
{
    // 要实现的现象:通过条件变量来控制线程执行
    pthread_t t[5];
    for (int i = 0; i < 5; i++)
    {
        char *name = new char[64];
        snprintf(name, 64, "thread %d",i+1);
        // 创建线程
        pthread_create(t + i, nullptr, start_routine, name);
    }

    while (true)
    {
        sleep(1);
        // 唤醒处于cond等待队列中的线程
        // pthread_cond_signal(&cond); // 一次唤醒一个线程
        pthread_cond_broadcast(&cond); // 一次唤醒所有线程
        std::cout << "main thread wakeup one thread ..." << std::endl;
    }

    for (int i = 0; i < 5; i++)
    {
        pthread_join(t[i], nullptr); // 线程退出
    }

    return 0;
}

在这里插入图片描述
为什么 pthread_cond_wait 需要互斥量?

  • 条件等待是线程间同步的一种手段,如果只有一个线程,条件不满足,一直等下去都不会满足,所以必须要有一个线程通过某些操作,改变共享变量,使原先不满足的条件变得满足,并且友好的通知等待在条件变量上的线程。
  • 条件不会无缘无故的突然变得满足了,必然会牵扯到共享数据的变化。所以一定要用互斥锁来保护。没有互斥锁就无法安全的获取和修改共享数据。
    在这里插入图片描述
  • 按照上面的说法,我们设计出如下的代码:先上锁,发现条件不满足,解锁,然后等待在条件变量上不就 行了,如下代码:
// 错误的设计
pthread_mutex_lock(&mutex);
while (condition_is_false) {
	pthread_mutex_unlock(&mutex);
	//解锁之后,等待之前,条件可能已经满足,信号已经发出,但是该信号可能被错过
	pthread_cond_wait(&cond);
	pthread_mutex_lock(&mutex);
}
pthread_mutex_unlock(&mutex);
  • 由于解锁和等待不是原子操作。调用解锁之后, pthread_cond_wait 之前,如果已经有其他线程获取到互斥量,摒弃条件满足,发送了信号,那么 pthread_cond_wait 将错过这个信号,可能会导致线程永远阻塞在这个 pthread_cond_wait 。所以解锁和等待必须是一个原子操作。
  • int pthread_cond_wait(pthread_cond_ t *cond,pthread_mutex_ t *mutex); 进入该函数后,会去看条件量等于0不?等于,就把互斥量变成1,直到cond_ wait返回,把条件量改成1,把互斥量恢复成原样。

条件变量使用规范

等待条件代码

pthread_mutex_lock(&mutex);
while (条件为假)
	pthread_cond_wait(cond, mutex);
修改条件
pthread_mutex_unlock(&mutex);

给条件发送信号代码

pthread_mutex_lock(&mutex);
设置条件为真
pthread_cond_signal(cond);
pthread_mutex_unlock(&mutex);
;