Bootstrap

[Redis#5] hash | 命令 | 内部编码 | 应用 | cache: string, json, hash对比

目录

1 命令

HSET

HGET

HEXISTS

HDEL

HKEYS

HVALS

HGETALL

HMGET

HLEN

HSET NX

HINCRBY

HINCRBYFLOAT

2 命令小结

3 内部编码

4 使用场景

5 缓存方式对比

1. 原生字符串类型

2. 序列化字符串类型,例如 JSON 格式

3. 哈希类型


几乎所有的主流编程语言都提供了哈希类型,它们的叫法可能是哈希、字典、关联数组、映射。

在 Redis 中,哈希类型是指值本身又是一个键值对结构,形如 key = "key",value = {{field1, value1}, ..., {fieldN, valueN}}

Redis 键值对和哈希类型二者的关系可以通过图示表示,如下

可以将 字符串结构 优化 为 hash 结构,实现高内聚

对比

  • 字符串
    • 存储一个 uid 为 1 的用户对象,姓名 James,年龄 28
    • 示例:
user:1:name James
user:1:age 28
  • 哈希
    • 存储一个 uid 为 1 的用户对象,姓名 James,年龄 28
    • 示例:
user:1
name James
age 28

注意:哈希类型中的映射关系通常称为 field-value,用于区分 Redis 整体的键值对(key-value),这里的 value 是指 field 对应的值,而不是键(key)对应的值,请注意 value 在不同上下文的作用。

理解: Redis中的value的类型就是Hash类型的数据.也就是在Hash中又存储了一层Hash.


1 命令

HSET
  • 描述:设置 hash 中 指定的字段(field)的值(value)。
  • 语法HSET key field value [field value ...]
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:插入一组 field 为 O(1),插入 N 组 field 为 O(N)
  • 返回值:添加的字段的个数。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HGET myhash field1
"Hello"
HGET
  • 描述获取 hash 中指定字段的值。
  • 语法HGET key field
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(1)
  • 返回值:字段对应的值或者 nil。
  • 示例
redis> HSET myhash field1 "foo"
(integer) 1
redis> HGET myhash field1
"foo"
redis> HGET myhash field2
(nil)
HEXISTS
  • 描述:判断 hash 中是否 存在 指定的字段。
  • 语法HEXISTS key field
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(1)
  • 返回值1 表示存在,0 表示不存在。
  • 示例
redis> HSET myhash field1 "foo"
(integer) 1
redis> HEXISTS myhash field1
(integer) 1
redis> HEXISTS myhash field2
(integer) 0

注意:

  • 在hexists命令中,不支持一次性查询多个field,一次只可以查询 一个field.
  • 后面的 hmget 和 hmset 支持批量获取 和 设置
HDEL
  • 描述:删除 hash 中指定的字段。
  • 语法HDEL key field [field ...]
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:删除一个元素为 O(1),删除 N 个元素为 O(N)
  • 返回值:本次操作删除的字段个数。
  • 示例
redis> HSET myhash field1 "foo"
(integer) 1
redis> HDEL myhash field1
(integer) 1
redis> HDEL myhash field2
(integer) 0

HKEYS
  • 描述:获取 hash 中的 所有 field。
  • 语法HKEYS key
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(N),N 为 field 的个数。
  • 返回值:字段列表。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HKEYS myhash
1) "field1"
2) "field2"
HVALS
  • 描述:获取 hash 中的 所有 value。
  • 语法HVALS key
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(N),N 为 field 的个数。
  • 返回值:所有的值。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HVALS myhash
1) "Hello"
2) "World"
HGETALL
  • 描述:获取 hash 中的所有 field 以及对应的 value 。
  • 语法HGETALL key
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(N),N 为 field 的个数。
  • 返回值:字段和对应的值。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HGETALL myhash
1) "field1"
2) "Hello"
3) "field2"
4) "World"

HMGET
  • 描述:一次获取 hash 中多个 field 的值。
  • 语法HMGET key field [field ...]
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:只查询一个元素为 O(1),查询多个元素为 O(N),N 为查询元素个数。
  • 返回值:字段对应的值或者 nil。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HMGET myhash field1 field2 nofield
1) "Hello"
2) "World"
3) (nil)

注意

建议一次查多个减少网络请求

在使用 HGETALL 时,如果哈希元素个数比较多,会存在阻塞 Redis 的可能。

如果开发人员只需要获取部分 field,可以使用 HMGET,如果一定要获取全部 field,可以尝试使用 HSCAN 命令,该命令采用渐进式遍历哈希类型HSCAN 会在后续章节介绍。

HLEN
  • 描述:获取 hash 中的所有 field 的个数。
  • 语法HLEN key
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(1)
  • 返回值:字段个数。
  • 示例
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HLEN myhash
(integer) 2

HSET NX
  • 描述:在字段 不存在的情况下,设置 hash 中的字段和值。
  • 语法HSETNX key field value
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(1)
  • 返回值:1 表示设置成功,0 表示失败。
  • 示例
redis> HSETNX myhash field "Hello"
(integer) 1
redis> HSETNX myhash field "World"
(integer) 0
redis> HGET myhash field
"Hello"
HINCRBY
  • 描述:将 hash 中 field 对应的数值添加指定的值。
  • 语法HINCRBY key field increment
  • 命令有效版本:2.0.0 之后
  • 时间复杂度:O(1)
  • 返回值:该字段变化之后的值。
  • 示例
redis> HSET myhash field 5
(integer) 1
redis> HINCRBY myhash field 1
(integer) 6
redis> HINCRBY myhash field -1
(integer) 5
redis> HINCRBY myhash field -10
(integer) -5

HINCRBYFLOAT
  • 描述HINCRBY浮点数版本。
  • 语法HINCRBYFLOAT key field increment
  • 命令有效版本:2.6.0 之后
  • 时间复杂度:O(1)
  • 返回值:该字段变化之后的值。
  • 示例
redis> HSET mykey field 10.50
(integer) 1
redis> HINCRBYFLOAT mykey field 0.1
"10.6"
redis> HINCRBYFLOAT mykey field -5
"5.6"
redis> HSET mykey field 5.0e3
(integer) 0
redis> HINCRBYFLOAT mykey field 2.0e2
"5200"

2 命令小结

表 2-4 是哈希类型命令的效果、时间复杂度,开发人员可以参考此表,结合自身业务需求和数据大小选择合适的命令。

命令

执行效果

时间复杂度

hset key field value

设置值

O(1)

hget key field

获取值

O(1)

hdel key field [field ...]

删除 field

O(k),k 是 field 个数

hlen key

计算 field 个数

O(1)

hgetall key

获取所有的 field-value

O(k),k 是 field 个数

hmget field [field ...]

批量获取 field-value

O(k),k 是 field 个数

hmset field value [field value ...]

批量设置 field-value

O(k),k 是 field 个数

hexists key field

判断 field 是否存在

O(1)

hkeys key

获取所有的 field

O(k),k 是 field 个数

hvals key

获取所有的 value

O(k),k 是 field 个数

hsetnx key field value

设置值,但必须在 field 不存在时才能设置成功

O(1)

hincrby key field n

对应 field-value + n

O(1)

hincrbyfloat key field n

对应 field-value + n

O(1)

hstrlen key field

计算 value 的字符串长度

O(1)

3 内部编码

哈希的内部编码有两种:

ziplist(压缩列表)

  • 当哈希类型元素个数小于 hash-max-ziplist-entries 配置(默认 512 个),同时所有值都小于 hash-max-ziplist-value 配置(默认 64 字节)时,Redis 会使用 ziplist 作为哈希的内部实现。ziplist 使用更加紧凑的结构实现多个元素的连续存储
  • 所以在节省内存方面比 hashtable 更加优秀。

hashtable(哈希表)

  • 当哈希类型无法满足 ziplist 的条件时,Redis 会自动切换到使用哈希表作为哈希的内部实现。

优点:

  • 高效的读写:数据过多时 ziplist 的读写效率会下降,而 hashtable 的读写时间复杂度为 O(1)。,即使在数据量较大时也能保证高效的访问。
  • 良好的扩展性:适合存储大量数据和需要频繁更新的场景。

缺点:

  • 内存占用:相较于 ziplist,哈希表在内存使用上相对较多,特别是在存储小数据集时,内存开销更为显著。

哈希类型的内部编码,以及响应的变化

  • field个数⽐较少且没有⼤的value时,内部编码为ziplist
  • 当有value⼤于64字节时,内部编码会转换hashtable
  • field个数超过512时,内部编码也会转换hashtable

ps: 临界数值大小,无需记忆,是可以在 redis.conf 文件中配置的,主要是:理解这种优化思想~

对于 压缩算法的简单理解:


4 使用场景

关系型数据表保存用户信息

  • 结构:

映射关系表示用户信息

  • 用户信息表示为哈希类型:

  • 优势相⽐于使⽤JSON格式的字符串缓存⽤⼾信息,哈希类型变得更加直观,并且在更新操作上变得更灵活

可以将每个用户的 id 定义为键后缀,多对 field-value 对应用户的各个属性,类似如下伪代码:

UserInfo getUserInfo(long uid) {
    // 根据 uid 得到 Redis 的键
    String key = "user:" + uid;

    // 尝试从 Redis 中获取对应的值
    userInfoMap = Redis 执行命令:hgetall key;

    // 如果缓存命中(hit)
    if (value != null) {
        // 将映射关系还原为对象形式
        UserInfo userInfo = 利用映射关系构建对象(userInfoMap);
        return userInfo;
    }

    // 如果缓存未命中(miss)
    // 从数据库中,根据 uid 获取用户信息
    UserInfo userInfo = MySQL 执行 SQL:select * from user_info where uid = <uid>;

    // 如果表中没有 uid 对应的用户信息
    if (userInfo == null) {
        响应 404
        return null;
    }

    // 将缓存以哈希类型保存
    Redis 执行命令:hmset key name userInfo.name age userInfo.age city userInfo.city

    // 写入缓存,为了防止数据腐烂(rot),设置过期时间为 1 小时(3600 秒)
    Redis 执行命令:expire key 3600

    // 返回用户信息
    return userInfo;
}

⭕但是需要注意的是 哈希类型 vs 关系型数据库 有两点不同之处:

  • 哈希类型是稀疏的,而关系型数据库是完全结构化的。例如哈希类型 每个键可以有不同的 field,实现的是 对一个类的高内聚
    • 而关系型数据库一旦添加新的列,所有行都要为其设置值,即使为 null。是对信息的标准格式化
  • 关系数据库可以做复杂的关系查询,而 Redis 去模拟关系型复杂查询,例如联表查询、聚合查询等基本不可能,维护成本高。


 

5 缓存方式对比

截至目前为止,我们已经能够用三种方法缓存用户信息,下面是三种方案的实现方法和优缺点分析。

1. 原生字符串类型
  • 实现
set user:1:name James
set user:1:age 23
set user:1:city Beijing
  • 优点
    • 实现简单,针对个别属性变更也很灵活。
  • 缺点
    • 占用过多的键,内存占用量较大,同时用户信息在 Redis 中比较分散,缺少内聚性,所以这种方案基本没有实用性。
2. 序列化字符串类型,例如 JSON 格式
  • 实现
set user:1 经过序列化后的用户对象字符串
  • 优点
    • 针对总是整体作为操作的信息比较合适,编程也简单。同时,如果序列化方案选择合适,内存的使用效率很高。
  • 缺点
    • 本身序列化和反序列需要一定开销,同时如果总是操作个别属性则非常不灵活。
3. 哈希类型
  • 实现
hmset user:1 name James age 23 city Beijing
  • 优点
    • 简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
  • 缺点
    • 需要控制哈希在 ziplist 和 hashtable 两种内部编码的转换,可能会造成内存的较大消耗。
    • 不便于复杂的整体查询,没有规范的格式,较为稀疏,不好整体规划

💡end think : 人际交往也是:高内聚 低耦合...

;