十四)Redis实现分布式锁
14.1)问题描述
随着业务发展的需要,原单体单机部署的系统被演化成分布式集群系统后,由于分布式系统多线程、多进程并且分布在不同机器上,这将使原单机部署情况下的并发控制锁策略失效,单纯的Java API并不能提供分布式锁的能力。
为了解决这个问题就需要一种跨JVM的互斥机制来控制共享资源的访问,这就是分布式锁要解决的问题,分布式锁主流的实现方案:
-
基于数据库实现分布式锁
-
基于缓存(Redis等)
-
基于Zookeeper
每一种分布式锁解决方案都有各自的优缺点:
-
性能:redis最高
-
可靠性:zookeeper最高
下面基于redis实现分布式锁。
14.2)使用redis实现分布式锁
redis:命令
set sku:1:info “OK” NX PX 10000
EX second :设置键的过期时间为 second 秒, SET key value EX second 效果等同于 SETEX key second value ; PX millisecond :设置键的过期时间为 millisecond 毫秒。 SET key value PX millisecond 效果等同于 PSETEX key millisecond value;
NX :只在键不存在时,才对键进行设置操作,SET key value NX 效果等同于 SETNX key value
XX :只在键已经存在时,才对键进行设置操作。
[root@VM-20-6-centos bin]# redis-cli -p 11079
127.0.0.1:11079> setnx user 10
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 0
通过 setnx 添加锁,不能再次进行修改,想要再次进行赋值,则删除锁后再次赋值
127.0.0.1:11079> del user
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 1
127.0.0.1:11079> setnx user 30
(integer) 0
执行锁的过程如下图:
-
多个客户端同时获取锁(setnx);
-
获取成功,执行业务逻辑{从db获取数据,放入缓存},执行完成释放锁(del);
-
其他客户端等待重试
14.3)优化之设置锁的过期时间
设置过期时间有两种方式:
-
首先想到通过expire设置过期时间(缺乏原子性:如果在setnx和expire之间出现异常,锁也无法释放)
-
在set时指定过期时间(推荐)
为避免锁一直不释放,影响重新赋值,添加锁的过期时间,过期后自动释放:expire user 20-- 设置20秒过期
127.0.0.1:11079> del user
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 1
127.0.0.1:11079> expire user 20
(integer) 1
127.0.0.1:11079> ttl user
(integer) 17
127.0.0.1:11079> setnx user 30
(integer) 0
127.0.0.1:11079> ttl user
(integer) -2
127.0.0.1:11079> setnx user 30
(integer) 1
为避免在加锁后出现异常,无法添加过期时间的情况,在设置加锁时就设置好过期时间,nx :加锁;ex 20 -- 设置20秒过期
127.0.0.1:11079> set user 10 nx ex 20
OK
127.0.0.1:11079> ttl user
(integer) 13
127.0.0.1:11079> setnx user 30
(integer) 0
127.0.0.1:11079> ttl user
(integer) -2
127.0.0.1:11079> setnx user 30
(integer) 1
流程图如下:
存在问题:可能会释放其他服务器的锁。
场景:如果业务逻辑的执行时间是7s,执行流程如下:
-
index1业务逻辑没执行完,3秒后锁被自动释放;
-
index2获取到锁,执行业务逻辑,3秒后锁被自动释放;
-
index3获取到锁,执行业务逻辑;
-
index1业务逻辑执行完成,开始调用del释放锁,这时释放的是index3的锁,导致index3的业务只执行1s就被别人释放,最终等于没锁的情况。
讲解如下图:【就是a手动释放了b的锁】
解决方案:setnx获取锁时,设置一个指定的唯一值(例如:uuid);释放前获取这个值,判断是否自己的锁
14.4)优化之UUID防误删
流程如下图:
添加锁时使用UUID表示不同的操作;
释放锁时,判断当前UUID和要释放锁的UUID是否一致,一致才可以释放锁
14.5)使用代码实现分布式锁
在上述 RedisTestController.java 中添加测试方法:
// Redis 设置分布式锁测试
@GetMapping("testLock")
public void testLock(){
String uuid = UUID.randomUUID().toString();
//1获取锁,setne,设置锁过期时间为3秒,添加UUID作为当前锁的标识
Boolean lock = redisTemplate.opsForValue().setIfAbsent("lock", uuid,3, TimeUnit.SECONDS);
//2获取锁成功、查询num的值
if(lock){
Object value = redisTemplate.opsForValue().get("num");
//2.1判断num为空return
if(StringUtils.isEmpty(value)){
return;
}
//2.2有值就转成成int
int num = Integer.parseInt(value+"");
//2.3把redis的num加1
redisTemplate.opsForValue().set("num", ++num);
//2.4释放锁,del
//释放锁时判断比较uuid值是否一样,一样才释放锁
String lockUuid = (String)redisTemplate.opsForValue().get("lock");
if(lockUuid.equals(uuid)) {
redisTemplate.delete("lock");
}
}else{
//3获取锁失败、每隔0.1秒再获取
try {
Thread.sleep(100);
testLock();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
// 浏览器访问:http://127.0.0.1:8080/redisTest/testLock
使用 ab 并发测试,有多少个并发量就输出多少值,设置并发为1000:
重启,服务集群,通过网关压力测试:ab -n 1000 -c 100 http://127.0.0.1:8080/test/testLock
127.0.0.1:11079> keys *
1) "num"
127.0.0.1:11079> get num
"0"
127.0.0.1:11079> get num
"1000"
存在问题:删除操作缺乏原子性
场景:
-
index1执行删除时,查询到的lock值确实和uuid相等
uuid=v1 set(lock,uuid) if(uuid.equals((String)redisTemplate.opsForValue().get("lock")));
-
index1执行删除前,lock刚好过期时间已到,被redis自动释放,在redis中没有了lock,没有了锁;
-
index2获取了lock,index2线程获取到了cpu的资源,开始执行方法
uuid=v2 set(lock,uuid);
-
index1执行删除,此时会把index2的lock删除,index1 因为已经在方法中了,所以不需要重新上锁。index1有执行的权限。index1已经比较完成了,这个时候,开始执行
this.redisTemplate.delete("lock")
删除的index2的锁!
过程如下:
问题总结:【没有保证删除锁操作的原子性】
正确流程:
1)a:上锁 —> 操作 —> 释放锁 —> 删除操作
2)a执行完成后,b再执行上述流程
当前流程:
1)a:上锁 —> 操作 —> 释放锁 (刚开始执行,未完成)
2)进入到 b:上锁—> 操作
3)a:释放锁 (执行完成,但此时释放的不是a锁,而是b锁)
14.6)优化之LUA脚本保证删除的原子性
在上述 RedisTestController.java 中添加测试方法:
// Redis 设置分布式锁添加LUA脚本保证删除的原子性
@GetMapping("testLockLua")
public void testLockLua() {
//1 声明一个uuid ,将做为一个value 放入我们的key所对应的值中
String uuid = UUID.randomUUID().toString();
//2 定义一个锁:lua 脚本可以使用同一把锁,来实现删除!
String skuId = "25"; // 访问skuId 为25号的商品 100008348542
String locKey = "lock:" + skuId; // 锁住的是每个商品的数据
// 3 获取锁
Boolean lock = redisTemplate.opsForValue().setIfAbsent(locKey, uuid, 3, TimeUnit.SECONDS);
// 第一种: lock 与过期时间中间不写任何的代码。
// redisTemplate.expire("lock",10, TimeUnit.SECONDS);//设置过期时间
// 如果true
if (lock) {
// 执行的业务逻辑开始
// 获取缓存中的num 数据
Object value = redisTemplate.opsForValue().get("num");
// 如果是空直接返回
if (StringUtils.isEmpty(value)) {
return;
}
// 不是空 如果说在这出现了异常! 那么delete 就删除失败! 也就是说锁永远存在!
int num = Integer.parseInt(value + "");
// 使num 每次+1 放入缓存
redisTemplate.opsForValue().set("num", String.valueOf(++num));
/*使用lua脚本来锁*/
// 定义lua 脚本 ,判断KEY和UUID是否一样,一样则调用删除方法,不一样则返回0
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
// 使用redis执行lua执行
DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>();
redisScript.setScriptText(script);
// 设置一下返回值类型 为Long
// 因为删除判断的时候,返回的0,给其封装为数据类型。如果不封装那么默认返回String 类型,
// 那么返回字符串与0 会有发生错误。
redisScript.setResultType(Long.class);
// 第一个要是script 脚本 ,第二个需要判断的key,第三个就是key所对应的值。
redisTemplate.execute(redisScript, Arrays.asList(locKey), uuid);
} else {
// 其他线程等待
try {
// 睡眠
Thread.sleep(1000);
// 睡醒了之后,调用方法。
testLockLua();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
说明:
14.7)总结
14.7.1)加锁
// 1. 从redis中获取锁,set k1 v1 px 20000 nx
String uuid = UUID.randomUUID().toString();
Boolean lock = this.redisTemplate.opsForValue().setIfAbsent("lock", uuid, 2, TimeUnit.SECONDS);
14.7.2)使用lua释放锁
// 2. 释放锁 del
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
// 设置lua脚本返回的数据类型
DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>();
// 设置lua脚本返回类型为Long
redisScript.setResultType(Long.class);
redisScript.setScriptText(script);
redisTemplate.execute(redisScript, Arrays.asList("lock"),uuid);
14.7.3)重试
Thread.sleep(500);
testLock();
为了确保分布式锁可用,我们至少要确保锁的实现同时满足以下四个条件:
-
互斥性。在任意时刻,只有一个客户端能持有锁;
-
不会发生死锁。即使有一个客户端在持有锁的期间崩溃而没有主动解锁,也能保证后续其他客户端能加锁;
-
解铃还须系铃人。加锁和解锁必须是同一个客户端,客户端自己不能把别人加的锁给解了;
-
加锁和解锁必须具有原子性。