[Redis#5] hash | 命令 | 内部编码 | 应用 | cache: string, json, hash对比

1 命令

HSET

HGET

HEXISTS

2. 序列化字符串类型，例如 JSON 格式

3. 哈希类型

几乎所有的主流编程语言都提供了哈希类型，它们的叫法可能是哈希、字典、关联数组、映射。

在 Redis 中，哈希类型是指值本身又是一个键值对结构，形如 key = "key"，value = {{field1, value1}, ..., {fieldN, valueN}}。

Redis 键值对和哈希类型二者的关系可以通过图示表示，如下

可以将字符串结构优化为 hash 结构，实现高内聚

对比

字符串

- 存储一个 uid 为 1 的用户对象，姓名 James，年龄 28
- 示例：

user:1:name James
user:1:age 28

哈希

- 存储一个 uid 为 1 的用户对象，姓名 James，年龄 28
- 示例：

user:1
name James
age 28

注意：哈希类型中的映射关系通常称为 field-value，用于区分 Redis 整体的键值对（key-value），这里的 value 是指 field 对应的值，而不是键（key）对应的值，请注意 value 在不同上下文的作用。

理解： Redis中的value的类型就是Hash类型的数据.也就是在Hash中又存储了一层Hash.

1 命令

HSET

描述：设置 hash 中指定的字段（field）的值（value）。
语法：HSET key field value [field value ...]
命令有效版本：2.0.0 之后
时间复杂度：插入一组 field 为 O(1)，插入 N 组 field 为 O(N)
返回值：添加的字段的个数。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HGET myhash field1
"Hello"

HGET

描述：获取 hash 中指定字段的值。
语法：HGET key field
命令有效版本：2.0.0 之后
时间复杂度：O(1)
返回值：字段对应的值或者 nil。
示例：

redis> HSET myhash field1 "foo"
(integer) 1
redis> HGET myhash field1
"foo"
redis> HGET myhash field2
(nil)

HEXISTS

描述：判断 hash 中是否存在指定的字段。
语法：HEXISTS key field
命令有效版本：2.0.0 之后
时间复杂度：O(1)
返回值：1 表示存在，0 表示不存在。
示例：

redis> HSET myhash field1 "foo"
(integer) 1
redis> HEXISTS myhash field1
(integer) 1
redis> HEXISTS myhash field2
(integer) 0

注意：

在hexists命令中,不支持一次性查询多个field,一次只可以查询一个field.
后面的 hmget 和 hmset 支持批量获取和设置

HDEL

描述：删除 hash 中指定的字段。
语法：HDEL key field [field ...]
命令有效版本：2.0.0 之后
时间复杂度：删除一个元素为 O(1)，删除 N 个元素为 O(N)
返回值：本次操作删除的字段个数。
示例：

redis> HSET myhash field1 "foo"
(integer) 1
redis> HDEL myhash field1
(integer) 1
redis> HDEL myhash field2
(integer) 0

HKEYS

描述：获取 hash 中的所有 field。
语法：HKEYS key
命令有效版本：2.0.0 之后
时间复杂度：O(N)，N 为 field 的个数。
返回值：字段列表。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HKEYS myhash
1) "field1"
2) "field2"

HVALS

描述：获取 hash 中的所有 value。
语法：HVALS key
命令有效版本：2.0.0 之后
时间复杂度：O(N)，N 为 field 的个数。
返回值：所有的值。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HVALS myhash
1) "Hello"
2) "World"

HGETALL

描述：获取 hash 中的所有 field 以及对应的 value 。
语法：HGETALL key
命令有效版本：2.0.0 之后
时间复杂度：O(N)，N 为 field 的个数。
返回值：字段和对应的值。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HGETALL myhash
1) "field1"
2) "Hello"
3) "field2"
4) "World"

HMGET

描述：一次获取 hash 中多个 field 的值。
语法：HMGET key field [field ...]
命令有效版本：2.0.0 之后
时间复杂度：只查询一个元素为 O(1)，查询多个元素为 O(N)，N 为查询元素个数。
返回值：字段对应的值或者 nil。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HMGET myhash field1 field2 nofield
1) "Hello"
2) "World"
3) (nil)

注意：

建议一次查多个，减少网络请求

在使用 HGETALL 时，如果哈希元素个数比较多，会存在阻塞 Redis 的可能。

如果开发人员只需要获取部分 field，可以使用 HMGET，如果一定要获取全部 field，可以尝试使用 HSCAN 命令，该命令采用渐进式遍历哈希类型，HSCAN 会在后续章节介绍。

HLEN

描述：获取 hash 中的所有 field 的个数。
语法：HLEN key
命令有效版本：2.0.0 之后
时间复杂度：O(1)
返回值：字段个数。
示例：

redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HLEN myhash
(integer) 2

HSET NX

描述：在字段不存在的情况下，设置 hash 中的字段和值。
语法：HSETNX key field value
命令有效版本：2.0.0 之后
时间复杂度：O(1)
返回值：1 表示设置成功，0 表示失败。
示例：

redis> HSETNX myhash field "Hello"
(integer) 1
redis> HSETNX myhash field "World"
(integer) 0
redis> HGET myhash field
"Hello"

HINCRBY

描述：将 hash 中 field 对应的数值添加指定的值。
语法：HINCRBY key field increment
命令有效版本：2.0.0 之后
时间复杂度：O(1)
返回值：该字段变化之后的值。
示例：

redis> HSET myhash field 5
(integer) 1
redis> HINCRBY myhash field 1
(integer) 6
redis> HINCRBY myhash field -1
(integer) 5
redis> HINCRBY myhash field -10
(integer) -5

HINCRBYFLOAT

描述：HINCRBY 的浮点数版本。
语法：HINCRBYFLOAT key field increment
命令有效版本：2.6.0 之后
时间复杂度：O(1)
返回值：该字段变化之后的值。
示例：

redis> HSET mykey field 10.50
(integer) 1
redis> HINCRBYFLOAT mykey field 0.1
"10.6"
redis> HINCRBYFLOAT mykey field -5
"5.6"
redis> HSET mykey field 5.0e3
(integer) 0
redis> HINCRBYFLOAT mykey field 2.0e2
"5200"

2 命令小结

表 2-4 是哈希类型命令的效果、时间复杂度，开发人员可以参考此表，结合自身业务需求和数据大小选择合适的命令。

命令	执行效果	时间复杂度
`hset key field value`	设置值	O(1)
`hget key field`	获取值	O(1)
`hdel key field [field ...]`	删除 field	O(k)，k 是 field 个数
`hlen key`	计算 field 个数	O(1)
`hgetall key`	获取所有的 field-value	O(k)，k 是 field 个数
`hmget field [field ...]`	批量获取 field-value	O(k)，k 是 field 个数
`hmset field value [field value ...]`	批量设置 field-value	O(k)，k 是 field 个数
`hexists key field`	判断 field 是否存在	O(1)
`hkeys key`	获取所有的 field	O(k)，k 是 field 个数
`hvals key`	获取所有的 value	O(k)，k 是 field 个数
`hsetnx key field value`	设置值，但必须在 field 不存在时才能设置成功	O(1)
`hincrby key field n`	对应 field-value + n	O(1)
`hincrbyfloat key field n`	对应 field-value + n	O(1)
`hstrlen key field`	计算 value 的字符串长度	O(1)

3 内部编码

哈希的内部编码有两种：

ziplist（压缩列表）：

当哈希类型元素个数小于 hash-max-ziplist-entries 配置（默认 512 个），同时所有值都小于 hash-max-ziplist-value 配置（默认 64 字节）时，Redis 会使用 ziplist 作为哈希的内部实现。ziplist 使用更加紧凑的结构实现多个元素的连续存储
所以在节省内存方面比 hashtable 更加优秀。

hashtable（哈希表）：

当哈希类型无法满足 ziplist 的条件时，Redis 会自动切换到使用哈希表作为哈希的内部实现。

优点：

高效的读写：数据过多时 ziplist 的读写效率会下降，而 hashtable 的读写时间复杂度为 O(1)。，即使在数据量较大时也能保证高效的访问。
良好的扩展性：适合存储大量数据和需要频繁更新的场景。

缺点：

内存占用：相较于 ziplist，哈希表在内存使用上相对较多，特别是在存储小数据集时，内存开销更为显著。

哈希类型的内部编码，以及响应的变化

当field个数⽐较少且没有⼤的value时，内部编码为ziplist
当有value⼤于64字节时，内部编码会转换为hashtable
当field个数超过512时，内部编码也会转换为hashtable

ps: 临界数值大小，无需记忆，是可以在 redis.conf 文件中配置的，主要是：理解这种优化思想~

对于压缩算法的简单理解：

4 使用场景

关系型数据表保存用户信息

结构：

映射关系表示用户信息

用户信息表示为哈希类型：

优势：相⽐于使⽤JSON格式的字符串缓存⽤⼾信息，哈希类型变得更加直观，并且在更新操作上变得更灵活

可以将每个用户的 id 定义为键后缀，多对 field-value 对应用户的各个属性，类似如下伪代码：

UserInfo getUserInfo(long uid) {
    // 根据 uid 得到 Redis 的键
    String key = "user:" + uid;

    // 尝试从 Redis 中获取对应的值
    userInfoMap = Redis 执行命令：hgetall key;

    // 如果缓存命中（hit）
    if (value != null) {
        // 将映射关系还原为对象形式
        UserInfo userInfo = 利用映射关系构建对象(userInfoMap);
        return userInfo;
    }

    // 如果缓存未命中（miss）
    // 从数据库中，根据 uid 获取用户信息
    UserInfo userInfo = MySQL 执行 SQL：select * from user_info where uid = <uid>;

    // 如果表中没有 uid 对应的用户信息
    if (userInfo == null) {
        响应 404
        return null;
    }

    // 将缓存以哈希类型保存
    Redis 执行命令：hmset key name userInfo.name age userInfo.age city userInfo.city

    // 写入缓存，为了防止数据腐烂（rot），设置过期时间为 1 小时（3600 秒）
    Redis 执行命令：expire key 3600

    // 返回用户信息
    return userInfo;
}

⭕但是需要注意的是哈希类型 vs 关系型数据库有两点不同之处：

哈希类型是稀疏的，而关系型数据库是完全结构化的。例如哈希类型每个键可以有不同的 field，实现的是对一个类的高内聚

- 而关系型数据库一旦添加新的列，所有行都要为其设置值，即使为 null。是对信息的标准格式化

关系数据库可以做复杂的关系查询，而 Redis 去模拟关系型复杂查询，例如联表查询、聚合查询等基本不可能，维护成本高。

5 缓存方式对比

截至目前为止，我们已经能够用三种方法缓存用户信息，下面是三种方案的实现方法和优缺点分析。

1. 原生字符串类型

实现：

set user:1:name James
set user:1:age 23
set user:1:city Beijing

优点：

- 实现简单，针对个别属性变更也很灵活。

缺点：

- 占用过多的键，内存占用量较大，同时用户信息在 Redis 中比较分散，缺少内聚性，所以这种方案基本没有实用性。

2. 序列化字符串类型，例如 JSON 格式

实现：

set user:1 经过序列化后的用户对象字符串

优点：

- 针对总是以整体作为操作的信息比较合适，编程也简单。同时，如果序列化方案选择合适，内存的使用效率很高。

缺点：

- 本身序列化和反序列需要一定开销，同时如果总是操作个别属性则非常不灵活。

3. 哈希类型

实现：

hmset user:1 name James age 23 city Beijing

优点：

- 简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。

缺点：

- 需要控制哈希在 ziplist 和 hashtable 两种内部编码的转换，可能会造成内存的较大消耗。
- 不便于复杂的整体查询，没有规范的格式，较为稀疏，不好整体规划

💡end think : 人际交往也是：高内聚低耦合...