Bootstrap

Redis(18) -- Redis实现分布式锁

十四)Redis实现分布式锁

14.1)问题描述

随着业务发展的需要,原单体单机部署的系统被演化成分布式集群系统后,由于分布式系统多线程、多进程并且分布在不同机器上,这将使原单机部署情况下的并发控制锁策略失效,单纯的Java API并不能提供分布式锁的能力。

为了解决这个问题就需要一种跨JVM的互斥机制来控制共享资源的访问,这就是分布式锁要解决的问题,分布式锁主流的实现方案:

  1. 基于数据库实现分布式锁

  2. 基于缓存(Redis等)

  3. 基于Zookeeper

每一种分布式锁解决方案都有各自的优缺点:

  1. 性能:redis最高

  2. 可靠性:zookeeper最高

下面基于redis实现分布式锁。

14.2)使用redis实现分布式锁

redis:命令

set sku:1:info “OK” NX PX 10000

EX second :设置键的过期时间为 second 秒, SET key value EX second 效果等同于 SETEX key second value ; PX millisecond :设置键的过期时间为 millisecond 毫秒。 SET key value PX millisecond 效果等同于 PSETEX key millisecond value;

NX :只在键不存在时,才对键进行设置操作,SET key value NX 效果等同于 SETNX key value 

XX :只在键已经存在时,才对键进行设置操作。

[root@VM-20-6-centos bin]# redis-cli -p 11079
127.0.0.1:11079> setnx user 10
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 0

通过 setnx 添加锁,不能再次进行修改,想要再次进行赋值,则删除锁后再次赋值

127.0.0.1:11079> del user
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 1
127.0.0.1:11079> setnx user 30
(integer) 0

执行锁的过程如下图:

  1. 多个客户端同时获取锁(setnx);

  2. 获取成功,执行业务逻辑{从db获取数据,放入缓存},执行完成释放锁(del);

  3. 其他客户端等待重试

14.3)优化之设置锁的过期时间

设置过期时间有两种方式:

  1. 首先想到通过expire设置过期时间(缺乏原子性:如果在setnx和expire之间出现异常,锁也无法释放)

  2. 在set时指定过期时间(推荐)

为避免锁一直不释放,影响重新赋值,添加锁的过期时间,过期后自动释放:expire user 20-- 设置20秒过期

127.0.0.1:11079> del user
(integer) 1
127.0.0.1:11079> setnx user 20
(integer) 1
127.0.0.1:11079> expire user 20
(integer) 1
127.0.0.1:11079> ttl user
(integer) 17
127.0.0.1:11079> setnx user 30
(integer) 0
127.0.0.1:11079> ttl user
(integer) -2
127.0.0.1:11079> setnx user 30
(integer) 1

为避免在加锁后出现异常,无法添加过期时间的情况,在设置加锁时就设置好过期时间,nx :加锁;ex 20 -- 设置20秒过期

127.0.0.1:11079> set user 10 nx ex 20
OK
127.0.0.1:11079> ttl user
(integer) 13
127.0.0.1:11079> setnx user 30
(integer) 0
127.0.0.1:11079> ttl user
(integer) -2
127.0.0.1:11079> setnx user 30
(integer) 1

流程图如下:

存在问题:可能会释放其他服务器的锁。

场景:如果业务逻辑的执行时间是7s,执行流程如下:

  1. index1业务逻辑没执行完,3秒后锁被自动释放;

  2. index2获取到锁,执行业务逻辑,3秒后锁被自动释放;

  3. index3获取到锁,执行业务逻辑;

  4. index1业务逻辑执行完成,开始调用del释放锁,这时释放的是index3的锁,导致index3的业务只执行1s就被别人释放,最终等于没锁的情况。

讲解如下图:【就是a手动释放了b的锁】

 解决方案:setnx获取锁时,设置一个指定的唯一值(例如:uuid);释放前获取这个值,判断是否自己的锁

14.4)优化之UUID防误删

流程如下图:

 添加锁时使用UUID表示不同的操作;

释放锁时,判断当前UUID和要释放锁的UUID是否一致,一致才可以释放锁

14.5)使用代码实现分布式锁

在上述 RedisTestController.java 中添加测试方法:

// Redis 设置分布式锁测试
    @GetMapping("testLock")
    public void testLock(){
        String uuid = UUID.randomUUID().toString();
        //1获取锁,setne,设置锁过期时间为3秒,添加UUID作为当前锁的标识
        Boolean lock = redisTemplate.opsForValue().setIfAbsent("lock", uuid,3, TimeUnit.SECONDS);
        //2获取锁成功、查询num的值
        if(lock){
            Object value = redisTemplate.opsForValue().get("num");
            //2.1判断num为空return
            if(StringUtils.isEmpty(value)){
                return;
            }
            //2.2有值就转成成int
            int num = Integer.parseInt(value+"");
            //2.3把redis的num加1
            redisTemplate.opsForValue().set("num", ++num);
            //2.4释放锁,del
            //释放锁时判断比较uuid值是否一样,一样才释放锁
            String lockUuid = (String)redisTemplate.opsForValue().get("lock");
            if(lockUuid.equals(uuid)) {
                redisTemplate.delete("lock");
            }
        }else{
            //3获取锁失败、每隔0.1秒再获取
            try {
                Thread.sleep(100);
                testLock();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }
    // 浏览器访问:http://127.0.0.1:8080/redisTest/testLock

使用 ab 并发测试,有多少个并发量就输出多少值,设置并发为1000:

重启,服务集群,通过网关压力测试:ab -n 1000 -c 100 http://127.0.0.1:8080/test/testLock

127.0.0.1:11079> keys *
1) "num"
127.0.0.1:11079> get num
"0"
127.0.0.1:11079> get num
"1000"

存在问题:删除操作缺乏原子性

场景:

  1. index1执行删除时,查询到的lock值确实和uuid相等

    uuid=v1
    set(lock,uuid)
    if(uuid.equals((String)redisTemplate.opsForValue().get("lock")));
  2. index1执行删除前,lock刚好过期时间已到,被redis自动释放,在redis中没有了lock,没有了锁;

  3. index2获取了lock,index2线程获取到了cpu的资源,开始执行方法

    uuid=v2
    set(lock,uuid);
  4. index1执行删除,此时会把index2的lock删除,index1 因为已经在方法中了,所以不需要重新上锁。index1有执行的权限。index1已经比较完成了,这个时候,开始执行

    this.redisTemplate.delete("lock")

删除的index2的锁!

过程如下:

 问题总结:【没有保证删除锁操作的原子性】

正确流程:

1)a:上锁 —> 操作 —> 释放锁 —> 删除操作

2)a执行完成后,b再执行上述流程

当前流程:

1)a:上锁 —> 操作 —> 释放锁 (刚开始执行,未完成)

2)进入到 b:上锁—> 操作

3)a:释放锁 (执行完成,但此时释放的不是a锁,而是b锁)

14.6)优化之LUA脚本保证删除的原子性

在上述 RedisTestController.java 中添加测试方法:

    // Redis 设置分布式锁添加LUA脚本保证删除的原子性
    @GetMapping("testLockLua")
    public void testLockLua() {
        //1 声明一个uuid ,将做为一个value 放入我们的key所对应的值中
        String uuid = UUID.randomUUID().toString();
        //2 定义一个锁:lua 脚本可以使用同一把锁,来实现删除!
        String skuId = "25"; // 访问skuId 为25号的商品 100008348542
        String locKey = "lock:" + skuId; // 锁住的是每个商品的数据
        // 3 获取锁
        Boolean lock = redisTemplate.opsForValue().setIfAbsent(locKey, uuid, 3, TimeUnit.SECONDS);
        // 第一种: lock 与过期时间中间不写任何的代码。
        // redisTemplate.expire("lock",10, TimeUnit.SECONDS);//设置过期时间
        // 如果true
        if (lock) {
            // 执行的业务逻辑开始
            // 获取缓存中的num 数据
            Object value = redisTemplate.opsForValue().get("num");
            // 如果是空直接返回
            if (StringUtils.isEmpty(value)) {
                return;
            }
            // 不是空 如果说在这出现了异常! 那么delete 就删除失败! 也就是说锁永远存在!
            int num = Integer.parseInt(value + "");
            // 使num 每次+1 放入缓存
            redisTemplate.opsForValue().set("num", String.valueOf(++num));
            /*使用lua脚本来锁*/
            // 定义lua 脚本 ,判断KEY和UUID是否一样,一样则调用删除方法,不一样则返回0
            String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
            // 使用redis执行lua执行
            DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>();
            redisScript.setScriptText(script);
            // 设置一下返回值类型 为Long
            // 因为删除判断的时候,返回的0,给其封装为数据类型。如果不封装那么默认返回String 类型,
            // 那么返回字符串与0 会有发生错误。
            redisScript.setResultType(Long.class);
            // 第一个要是script 脚本 ,第二个需要判断的key,第三个就是key所对应的值。
            redisTemplate.execute(redisScript, Arrays.asList(locKey), uuid);
        } else {
            // 其他线程等待
            try {
                // 睡眠
                Thread.sleep(1000);
                // 睡醒了之后,调用方法。
                testLockLua();
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }

说明:

14.7)总结

14.7.1)加锁

// 1. 从redis中获取锁,set k1 v1 px 20000 nx
String uuid = UUID.randomUUID().toString();
Boolean lock = this.redisTemplate.opsForValue().setIfAbsent("lock", uuid, 2, TimeUnit.SECONDS);

14.7.2)使用lua释放锁

// 2. 释放锁 del
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
// 设置lua脚本返回的数据类型
DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>();
// 设置lua脚本返回类型为Long
redisScript.setResultType(Long.class);
redisScript.setScriptText(script);
redisTemplate.execute(redisScript, Arrays.asList("lock"),uuid);

14.7.3)重试

Thread.sleep(500);
testLock();

为了确保分布式锁可用,我们至少要确保锁的实现同时满足以下四个条件:

  • 互斥性。在任意时刻,只有一个客户端能持有锁;

  • 不会发生死锁。即使有一个客户端在持有锁的期间崩溃而没有主动解锁,也能保证后续其他客户端能加锁;

  • 解铃还须系铃人。加锁和解锁必须是同一个客户端,客户端自己不能把别人加的锁给解了;

  • 加锁和解锁必须具有原子性。

;