Bootstrap

【新人系列】Python 入门(二十三):锁

✍ 个人博客:https://blog.csdn.net/Newin2020?type=blog
📝 专栏地址:https://blog.csdn.net/newin2020/category_12801353.html
📣 专栏定位:为 0 基础刚入门 Python 的小伙伴提供详细的讲解,也欢迎大佬们一起交流~
📚 专栏简介:在这个专栏,我将带着大家从 0 开始入门 Python 的学习。在这个 Python 的新人系列专栏下,将会总结 Python 入门基础的一些知识点,方便大家快速入门学习~
❤️ 如果有收获的话,欢迎点赞 👍 收藏 📁 关注,您的支持就是我创作的最大动力 💪

1. 共享全局变量

多线程共享变量示例:

在这里插入图片描述

多进程共享变量示例:

多个进程之间时相互独立的,多个进程之间不共享全局变量,即在一个进程中对全局变量修改过后,不会影响另一个进程中的全局变量。

在这里插入图片描述

多进程和多线程最大的区别就在于:

  • 对于多进程,同一个变量各自有一份拷贝存在于每个进程,互不影响。
  • 而多线程不然,所有的线程共用所有的变量。因此,任何一个变量都可以皮任意的一个线程修改。

所以,这就引出了线程资源竞争的问题,这时候锁就派上用场了。
不过在此之前,我们还是先看一个资源竞争的例子帮助我们更好的理解。

import threading
import time

a = 0
def add():
    global a
    a += 1
    print('%s adds a to : %d' % (threading.current_thread().name, a))

if __name__ == '__main__':
    for i in range(1, 11):
        t = threading.Thread(name='thread-%d' % (i,), target=add)
        t.start()

在这里插入图片描述

上面这段代码乍一看似乎没什么问题,但是如果我们稍微变动一下其中的逻辑,模拟一下线程运行过程中一些耗时的情况。此时结果就出现问题了,明显和我们预期的结果不符,线程中的修改操作污染了全局变量的值。

import threading
import time

a = 0
def add():
    global a
    a += 1
    time.sleep(0.5)
    print('%s adds a to : %d' % (threading.current_thread().name, a))

if __name__ == '__main__':
    for i in range(1, 11):
        t = threading.Thread(name='thread-%d' % (i,), target=add)
        t.start()

在这里插入图片描述

2. 互斥锁

2.1 线程锁

Python 中提供了锁机制,又称互斥锁,而互斥锁为资源引入一个状态:锁定 / 非锁定。

某个线程要更改共享数据时,先将其上锁,此时资源的状态为 “锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成 “非锁定”,其他的线程才能再次锁定该资源。

互斥锁保证了每次只有一个线程进行写入操作,即确保在同一时间只有一个线程能够访问共享资源,从而保证了多线程情况下数据的正确性,避免了数据竞争和不一致的问题。

这时候再回到上面的那个例子中,当我们加上锁之后执行,就可以发现结果符合我们的预期。

import threading
import time

lock = threading.Lock()
a = 0
def add():
    global a
    try:
        lock.acquire()      # 获得锁 locked,独占
        a = a + 1
        time.sleep(0.5)     # 延时 0.5 秒,模拟写入所需时间
    finally:
        lock.release()      # 释放锁
    print('%s adds a to : %d' % (threading.current_thread().name, a))

if __name__ == '__main__':
    for i in range(1, 11):
        t = threading.Thread(name='thread-%d' % (i,), target=add)
        t.start()

在这里插入图片描述

2.2 进程锁

当多个进程使用同一份数据资源的时候,就会引发数据安全或顺顾序混乱问题。这个时候,我们可以使用 multiprocessing.Lock() 进程锁机制。

进程锁和线程锁的使用方法其实非常类似,只是调用的方法不同。下面这个例子中,多个进程共享一个计数器 counter,通过进程锁 lock 来保证对计数器的修改是互斥的,避免了多个进程同时修改计数器导致的数据不一致问题。

import multiprocessing
import time

def worker(lock, counter):
    for _ in range(5):
        # 获取锁
        lock.acquire()
        counter.value += 1
        print(f'进程: {multiprocessing.current_process().name}, 计数器: {counter.value}')
        # 释放锁
        lock.release()
        time.sleep(1)

if __name__ == '__main__':
    # 创建共享的计数器
    counter = multiprocessing.Value('i', 0)
    # 创建进程锁
    lock = multiprocessing.Lock()

    # 创建多个进程
    processes = [
        multiprocessing.Process(target=worker, args=(lock, counter)) for _ in range(3)
    ]

    for p in processes:
        p.start()

    for p in processes:
        p.join()

再来看一个抢票的例子,也可以通过进程锁避免抢票冲突。

import multiprocessing
import json
import time

"""
将票数值,存放至 db 文件中,内容为:{"count":1}
"""

def search_ticket():
    dic = json.load(open('db.json'))
    print("查询当前剩余票数为:%s" % dic['count'])

def get_ticket():
    dic = json.load(open('db.json'))
    time.sleep(0.1)  # 模拟读数据延迟
    if dic['count'] > 0:
        dic['count'] -= 1
        time.sleep(0.2)  # 模拟写数据延迟
        json.dump(dic, open('db.json', 'w'))
        print('恭喜你,{}购票成功'.format(multiprocessing.current_process().name))

def task_ticket(lock):
    search_ticket()
    lock.acquire()
    get_ticket()
    lock.release()

if __name__ == '__main__':
    lock = multiprocessing.Lock()
    for i in range(100):  # 模拟并发 100 个客户端抢票
        p = multiprocessing.Process(target=task_ticket, args=(lock,), name='张三-%s' % i)
        p.start()

3. 死锁

死锁产生的原因:在线程间共享多个资源的时候,当两个或多个线程(或进程)互相等待对方持有的资源,而导致它们都无法继续执行时,就发生了死锁。

在这里插入图片描述

3.1 死锁示例

我们来看个比较经典的例子,下面的代码就很可能出现死锁的情况:

  • 线程 1 首先获取了 lock1,然后尝试获取 lock2。
  • 同时,线程 2 首先获取了 lock2,然后尝试获取 lock1。
  • 这就可能会导致线程 1 等待线程 2 释放 lock2,线程 2 等待线程 1 释放 lock1,两个线程都无法继续执行,从而形成死锁。
import threading

# 创建两个互斥锁
lock1 = threading.Lock()
lock2 = threading.Lock()

def thread1_function():
    lock1.acquire()  # 线程 1 获取锁 1
    print("Thread 1 acquired lock 1")

    # 线程 1 尝试获取锁 2 ,但此时锁 2 可能被线程 2 持有
    lock2.acquire()
    print("Thread 1 acquired lock 2")

    lock1.release()  # 释放锁 1
    lock2.release()  # 释放锁 2

def thread2_function():
    lock2.acquire()  # 线程 2 获取锁 2
    print("Thread 2 acquired lock 2")

    # 线程 2 尝试获取锁 1 ,但此时锁 1 可能被线程 1 持有
    lock1.acquire()
    print("Thread 2 acquired lock 1")

    lock2.release()  # 释放锁 2
    lock1.release()  # 释放锁 1

thread1 = threading.Thread(target=thread1_function)
thread2 = threading.Thread(target=thread2_function)

thread1.start()
thread2.start()

thread1.join()
thread2.join()

在这里插入图片描述

3.2 解决死锁

为了避免死锁,可以采用一些策略,比如:

  1. 以固定的顺序获取多个锁。
  2. 尽量减少持有锁的时间,即只在必要的操作期间持有锁。
  3. 使用超时机制来避免无限期地等待锁。

我们这里就通过超时机制来尝试解决一下死锁问题,下述代码中我们为 lock1.acquire() 和 lock2.acquire() 方法都添加了 timeout 参数。这样,如果在指定的时间内无法获取到锁,就会放弃获取并进行相应的处理,从而避免死锁的发生。

import threading
import time

# 创建两个互斥锁
lock1 = threading.Lock()
lock2 = threading.Lock()

def thread1_function():
    lock1.acquire(timeout=5)  # 设置获取锁 1 的超时时间为 5 秒
    print("Thread 1 acquired lock 1")

    try:
        # 尝试在 3 秒内获取锁 2
        if lock2.acquire(timeout=3):
            print("Thread 1 acquired lock 2")
        else:
            # 如果在 3 秒内未获取到锁 2,释放锁 1 并打印错误信息
            lock1.release()
            print("Thread 1 failed to acquire lock 2 within timeout")
    finally:
        lock1.release()  # 确保最终释放锁 1

def thread2_function():
    lock2.acquire(timeout=5)  # 设置获取锁 2 的超时时间为 5 秒
    print("Thread 2 acquired lock 2")

    try:
        # 尝试在 3 秒内获取锁 1
        if lock1.acquire(timeout=3):
            print("Thread 2 acquired lock 1")
        else:
            # 如果在 3 秒内未获取到锁 1,释放锁 2 并打印错误信息
            lock2.release()
            print("Thread 2 failed to acquire lock 1 within timeout")
    finally:
        lock2.release()  # 确保最终释放锁 2

thread1 = threading.Thread(target=thread1_function)
thread2 = threading.Thread(target=thread2_function)

thread1.start()
thread2.start()

thread1.join()
thread2.join()

4. GIL 锁

GIL 即全局解释器锁(global interpreter lock),每个线程在执行时候都需要先获取 GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有一个线程使用 CPU,也就是说多线程并不是真正意义上的同时执行。

4.1 主要特点和影响

  1. 保证线程安全:确保在任意时刻只有一个线程在执行 Python 字节码。这简化了 Python 对共享资源的访问控制,使得内存管理等操作变得更简单,一定程度上保证了线程安全。
  2. 限制多线程并发:由于 GIL 的存在,在多核 CPU 环境下,Python 的多线程不能真正实现并行计算(多个线程同时执行),而只能是并发(交替执行)。对于 CPU 密集型任务(如大量计算),多线程并不能有效提高性能,反而可能因为线程切换的开销而降低性能。
  3. 对 I/O 密集型任务影响较小:对于涉及到网络 I/O 或文件 I/O 的操作,线程在 I/O 等待期间会释放 GIL,允许其他线程运行。所以在 I/O 密集型任务中,多线程仍然可以提高程序的效率。

在这里插入图片描述

4.2 存在原因

  1. 历史原因:Python 早期的设计决策,为了简化内存管理和线程同步的复杂性。
  2. CPython 实现:CPython(Python 的最常见实现)的内存管理不是线程安全的,GIL 是一种相对简单的解决方案。

在这里插入图片描述

4.3 应对策略

  1. 对于 CPU 密集型任务,如果想要充分利用多核 CPU,可以使用多进程(multiprocessing 模块),因为每个进程都有自己独立的 GIL。
  2. 对于 I/O 密集型任务,多线程仍然是一个不错的选择。
  3. 也可以考虑使用其他 Python 实现,如 Jython 、IronPython ,它们没有 GIL 的限制,但可能在某些库的支持上不如 CPython 完善。
;