✍ 个人博客:https://blog.csdn.net/Newin2020?type=blog
📝 专栏地址:https://blog.csdn.net/newin2020/category_12801353.html
📣 专栏定位:为 0 基础刚入门 Python 的小伙伴提供详细的讲解,也欢迎大佬们一起交流~
📚 专栏简介:在这个专栏,我将带着大家从 0 开始入门 Python 的学习。在这个 Python 的新人系列专栏下,将会总结 Python 入门基础的一些知识点,方便大家快速入门学习~
❤️ 如果有收获的话,欢迎点赞 👍 收藏 📁 关注,您的支持就是我创作的最大动力 💪
1. 共享全局变量
多线程共享变量示例:
多进程共享变量示例:
多个进程之间时相互独立的,多个进程之间不共享全局变量,即在一个进程中对全局变量修改过后,不会影响另一个进程中的全局变量。
多进程和多线程最大的区别就在于:
- 对于多进程,同一个变量各自有一份拷贝存在于每个进程,互不影响。
- 而多线程不然,所有的线程共用所有的变量。因此,任何一个变量都可以皮任意的一个线程修改。
所以,这就引出了线程资源竞争的问题,这时候锁就派上用场了。
不过在此之前,我们还是先看一个资源竞争的例子帮助我们更好的理解。
import threading
import time
a = 0
def add():
global a
a += 1
print('%s adds a to : %d' % (threading.current_thread().name, a))
if __name__ == '__main__':
for i in range(1, 11):
t = threading.Thread(name='thread-%d' % (i,), target=add)
t.start()
上面这段代码乍一看似乎没什么问题,但是如果我们稍微变动一下其中的逻辑,模拟一下线程运行过程中一些耗时的情况。此时结果就出现问题了,明显和我们预期的结果不符,线程中的修改操作污染了全局变量的值。
import threading
import time
a = 0
def add():
global a
a += 1
time.sleep(0.5)
print('%s adds a to : %d' % (threading.current_thread().name, a))
if __name__ == '__main__':
for i in range(1, 11):
t = threading.Thread(name='thread-%d' % (i,), target=add)
t.start()
2. 互斥锁
2.1 线程锁
Python 中提供了锁机制,又称互斥锁,而互斥锁为资源引入一个状态:锁定 / 非锁定。
某个线程要更改共享数据时,先将其上锁,此时资源的状态为 “锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成 “非锁定”,其他的线程才能再次锁定该资源。
互斥锁保证了每次只有一个线程进行写入操作,即确保在同一时间只有一个线程能够访问共享资源,从而保证了多线程情况下数据的正确性,避免了数据竞争和不一致的问题。
这时候再回到上面的那个例子中,当我们加上锁之后执行,就可以发现结果符合我们的预期。
import threading
import time
lock = threading.Lock()
a = 0
def add():
global a
try:
lock.acquire() # 获得锁 locked,独占
a = a + 1
time.sleep(0.5) # 延时 0.5 秒,模拟写入所需时间
finally:
lock.release() # 释放锁
print('%s adds a to : %d' % (threading.current_thread().name, a))
if __name__ == '__main__':
for i in range(1, 11):
t = threading.Thread(name='thread-%d' % (i,), target=add)
t.start()
2.2 进程锁
当多个进程使用同一份数据资源的时候,就会引发数据安全或顺顾序混乱问题。这个时候,我们可以使用 multiprocessing.Lock() 进程锁机制。
进程锁和线程锁的使用方法其实非常类似,只是调用的方法不同。下面这个例子中,多个进程共享一个计数器 counter,通过进程锁 lock 来保证对计数器的修改是互斥的,避免了多个进程同时修改计数器导致的数据不一致问题。
import multiprocessing
import time
def worker(lock, counter):
for _ in range(5):
# 获取锁
lock.acquire()
counter.value += 1
print(f'进程: {multiprocessing.current_process().name}, 计数器: {counter.value}')
# 释放锁
lock.release()
time.sleep(1)
if __name__ == '__main__':
# 创建共享的计数器
counter = multiprocessing.Value('i', 0)
# 创建进程锁
lock = multiprocessing.Lock()
# 创建多个进程
processes = [
multiprocessing.Process(target=worker, args=(lock, counter)) for _ in range(3)
]
for p in processes:
p.start()
for p in processes:
p.join()
再来看一个抢票的例子,也可以通过进程锁避免抢票冲突。
import multiprocessing
import json
import time
"""
将票数值,存放至 db 文件中,内容为:{"count":1}
"""
def search_ticket():
dic = json.load(open('db.json'))
print("查询当前剩余票数为:%s" % dic['count'])
def get_ticket():
dic = json.load(open('db.json'))
time.sleep(0.1) # 模拟读数据延迟
if dic['count'] > 0:
dic['count'] -= 1
time.sleep(0.2) # 模拟写数据延迟
json.dump(dic, open('db.json', 'w'))
print('恭喜你,{}购票成功'.format(multiprocessing.current_process().name))
def task_ticket(lock):
search_ticket()
lock.acquire()
get_ticket()
lock.release()
if __name__ == '__main__':
lock = multiprocessing.Lock()
for i in range(100): # 模拟并发 100 个客户端抢票
p = multiprocessing.Process(target=task_ticket, args=(lock,), name='张三-%s' % i)
p.start()
3. 死锁
死锁产生的原因:在线程间共享多个资源的时候,当两个或多个线程(或进程)互相等待对方持有的资源,而导致它们都无法继续执行时,就发生了死锁。
3.1 死锁示例
我们来看个比较经典的例子,下面的代码就很可能出现死锁的情况:
- 线程 1 首先获取了 lock1,然后尝试获取 lock2。
- 同时,线程 2 首先获取了 lock2,然后尝试获取 lock1。
- 这就可能会导致线程 1 等待线程 2 释放 lock2,线程 2 等待线程 1 释放 lock1,两个线程都无法继续执行,从而形成死锁。
import threading
# 创建两个互斥锁
lock1 = threading.Lock()
lock2 = threading.Lock()
def thread1_function():
lock1.acquire() # 线程 1 获取锁 1
print("Thread 1 acquired lock 1")
# 线程 1 尝试获取锁 2 ,但此时锁 2 可能被线程 2 持有
lock2.acquire()
print("Thread 1 acquired lock 2")
lock1.release() # 释放锁 1
lock2.release() # 释放锁 2
def thread2_function():
lock2.acquire() # 线程 2 获取锁 2
print("Thread 2 acquired lock 2")
# 线程 2 尝试获取锁 1 ,但此时锁 1 可能被线程 1 持有
lock1.acquire()
print("Thread 2 acquired lock 1")
lock2.release() # 释放锁 2
lock1.release() # 释放锁 1
thread1 = threading.Thread(target=thread1_function)
thread2 = threading.Thread(target=thread2_function)
thread1.start()
thread2.start()
thread1.join()
thread2.join()
3.2 解决死锁
为了避免死锁,可以采用一些策略,比如:
- 以固定的顺序获取多个锁。
- 尽量减少持有锁的时间,即只在必要的操作期间持有锁。
- 使用超时机制来避免无限期地等待锁。
我们这里就通过超时机制来尝试解决一下死锁问题,下述代码中我们为 lock1.acquire() 和 lock2.acquire() 方法都添加了 timeout 参数。这样,如果在指定的时间内无法获取到锁,就会放弃获取并进行相应的处理,从而避免死锁的发生。
import threading
import time
# 创建两个互斥锁
lock1 = threading.Lock()
lock2 = threading.Lock()
def thread1_function():
lock1.acquire(timeout=5) # 设置获取锁 1 的超时时间为 5 秒
print("Thread 1 acquired lock 1")
try:
# 尝试在 3 秒内获取锁 2
if lock2.acquire(timeout=3):
print("Thread 1 acquired lock 2")
else:
# 如果在 3 秒内未获取到锁 2,释放锁 1 并打印错误信息
lock1.release()
print("Thread 1 failed to acquire lock 2 within timeout")
finally:
lock1.release() # 确保最终释放锁 1
def thread2_function():
lock2.acquire(timeout=5) # 设置获取锁 2 的超时时间为 5 秒
print("Thread 2 acquired lock 2")
try:
# 尝试在 3 秒内获取锁 1
if lock1.acquire(timeout=3):
print("Thread 2 acquired lock 1")
else:
# 如果在 3 秒内未获取到锁 1,释放锁 2 并打印错误信息
lock2.release()
print("Thread 2 failed to acquire lock 1 within timeout")
finally:
lock2.release() # 确保最终释放锁 2
thread1 = threading.Thread(target=thread1_function)
thread2 = threading.Thread(target=thread2_function)
thread1.start()
thread2.start()
thread1.join()
thread2.join()
4. GIL 锁
GIL 即全局解释器锁(global interpreter lock),每个线程在执行时候都需要先获取 GIL,保证同一时刻只有一个线程可以执行代码,即同一时刻只有一个线程使用 CPU,也就是说多线程并不是真正意义上的同时执行。
4.1 主要特点和影响
- 保证线程安全:确保在任意时刻只有一个线程在执行 Python 字节码。这简化了 Python 对共享资源的访问控制,使得内存管理等操作变得更简单,一定程度上保证了线程安全。
- 限制多线程并发:由于 GIL 的存在,在多核 CPU 环境下,Python 的多线程不能真正实现并行计算(多个线程同时执行),而只能是并发(交替执行)。对于 CPU 密集型任务(如大量计算),多线程并不能有效提高性能,反而可能因为线程切换的开销而降低性能。
- 对 I/O 密集型任务影响较小:对于涉及到网络 I/O 或文件 I/O 的操作,线程在 I/O 等待期间会释放 GIL,允许其他线程运行。所以在 I/O 密集型任务中,多线程仍然可以提高程序的效率。
4.2 存在原因
- 历史原因:Python 早期的设计决策,为了简化内存管理和线程同步的复杂性。
- CPython 实现:CPython(Python 的最常见实现)的内存管理不是线程安全的,GIL 是一种相对简单的解决方案。
4.3 应对策略
- 对于 CPU 密集型任务,如果想要充分利用多核 CPU,可以使用多进程(multiprocessing 模块),因为每个进程都有自己独立的 GIL。
- 对于 I/O 密集型任务,多线程仍然是一个不错的选择。
- 也可以考虑使用其他 Python 实现,如 Jython 、IronPython ,它们没有 GIL 的限制,但可能在某些库的支持上不如 CPython 完善。