目录
几乎所有的主流编程语言都提供了哈希类型,它们的叫法可能是哈希、字典、关联数组、映射。
在 Redis 中,哈希类型是指值本身又是一个键值对结构,形如 key = "key",value = {{field1, value1}, ..., {fieldN, valueN}}
。
Redis 键值对和哈希类型二者的关系可以通过图示表示,如下
可以将 字符串结构 优化 为 hash 结构,实现高内聚
对比
- 字符串
-
- 存储一个 uid 为 1 的用户对象,姓名 James,年龄 28
- 示例:
user:1:name James
user:1:age 28
- 哈希
-
- 存储一个 uid 为 1 的用户对象,姓名 James,年龄 28
- 示例:
user:1
name James
age 28
注意:哈希类型中的映射关系通常称为 field-value
,用于区分 Redis 整体的键值对(key-value
),这里的 value
是指 field
对应的值,而不是键(key
)对应的值,请注意 value
在不同上下文的作用。
理解: Redis中的value的类型就是Hash类型的数据.也就是在Hash中又存储了一层Hash.
1 命令
HSET
- 描述:设置 hash 中 指定的字段(field)的值(value)。
- 语法:
HSET key field value [field value ...]
- 命令有效版本:2.0.0 之后
- 时间复杂度:插入一组 field 为 O(1),插入 N 组 field 为 O(N)
- 返回值:添加的字段的个数。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HGET myhash field1
"Hello"
HGET
- 描述:获取 hash 中指定字段的值。
- 语法:
HGET key field
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(1)
- 返回值:字段对应的值或者 nil。
- 示例:
redis> HSET myhash field1 "foo"
(integer) 1
redis> HGET myhash field1
"foo"
redis> HGET myhash field2
(nil)
HEXISTS
- 描述:判断 hash 中是否 存在 指定的字段。
- 语法:
HEXISTS key field
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(1)
- 返回值:1 表示存在,0 表示不存在。
- 示例:
redis> HSET myhash field1 "foo"
(integer) 1
redis> HEXISTS myhash field1
(integer) 1
redis> HEXISTS myhash field2
(integer) 0
注意:
- 在hexists命令中,不支持一次性查询多个field,一次只可以查询 一个field.
- 后面的 hmget 和 hmset 支持批量获取 和 设置
HDEL
- 描述:删除 hash 中指定的字段。
- 语法:
HDEL key field [field ...]
- 命令有效版本:2.0.0 之后
- 时间复杂度:删除一个元素为 O(1),删除 N 个元素为 O(N)
- 返回值:本次操作删除的字段个数。
- 示例:
redis> HSET myhash field1 "foo"
(integer) 1
redis> HDEL myhash field1
(integer) 1
redis> HDEL myhash field2
(integer) 0
HKEYS
- 描述:获取 hash 中的 所有 field。
- 语法:
HKEYS key
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(N),N 为 field 的个数。
- 返回值:字段列表。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HKEYS myhash
1) "field1"
2) "field2"
HVALS
- 描述:获取 hash 中的 所有 value。
- 语法:
HVALS key
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(N),N 为 field 的个数。
- 返回值:所有的值。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HVALS myhash
1) "Hello"
2) "World"
HGETALL
- 描述:获取 hash 中的所有 field 以及对应的 value 。
- 语法:
HGETALL key
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(N),N 为 field 的个数。
- 返回值:字段和对应的值。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HGETALL myhash
1) "field1"
2) "Hello"
3) "field2"
4) "World"
HMGET
- 描述:一次获取 hash 中多个 field 的值。
- 语法:
HMGET key field [field ...]
- 命令有效版本:2.0.0 之后
- 时间复杂度:只查询一个元素为 O(1),查询多个元素为 O(N),N 为查询元素个数。
- 返回值:字段对应的值或者 nil。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HMGET myhash field1 field2 nofield
1) "Hello"
2) "World"
3) (nil)
注意:
建议一次查多个,减少网络请求
在使用 HGETALL
时,如果哈希元素个数比较多,会存在阻塞 Redis 的可能。
如果开发人员只需要获取部分 field,可以使用 HMGET
,如果一定要获取全部 field,可以尝试使用 HSCAN
命令,该命令采用渐进式遍历哈希类型,HSCAN
会在后续章节介绍。
HLEN
- 描述:获取 hash 中的所有 field 的个数。
- 语法:
HLEN key
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(1)
- 返回值:字段个数。
- 示例:
redis> HSET myhash field1 "Hello"
(integer) 1
redis> HSET myhash field2 "World"
(integer) 1
redis> HLEN myhash
(integer) 2
HSET NX
- 描述:在字段 不存在的情况下,设置 hash 中的字段和值。
- 语法:
HSETNX key field value
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(1)
- 返回值:1 表示设置成功,0 表示失败。
- 示例:
redis> HSETNX myhash field "Hello"
(integer) 1
redis> HSETNX myhash field "World"
(integer) 0
redis> HGET myhash field
"Hello"
HINCRBY
- 描述:将 hash 中 field 对应的数值添加指定的值。
- 语法:
HINCRBY key field increment
- 命令有效版本:2.0.0 之后
- 时间复杂度:O(1)
- 返回值:该字段变化之后的值。
- 示例:
redis> HSET myhash field 5
(integer) 1
redis> HINCRBY myhash field 1
(integer) 6
redis> HINCRBY myhash field -1
(integer) 5
redis> HINCRBY myhash field -10
(integer) -5
HINCRBYFLOAT
- 描述:
HINCRBY
的浮点数版本。 - 语法:
HINCRBYFLOAT key field increment
- 命令有效版本:2.6.0 之后
- 时间复杂度:O(1)
- 返回值:该字段变化之后的值。
- 示例:
redis> HSET mykey field 10.50
(integer) 1
redis> HINCRBYFLOAT mykey field 0.1
"10.6"
redis> HINCRBYFLOAT mykey field -5
"5.6"
redis> HSET mykey field 5.0e3
(integer) 0
redis> HINCRBYFLOAT mykey field 2.0e2
"5200"
2 命令小结
表 2-4 是哈希类型命令的效果、时间复杂度,开发人员可以参考此表,结合自身业务需求和数据大小选择合适的命令。
命令 | 执行效果 | 时间复杂度 |
| 设置值 | O(1) |
| 获取值 | O(1) |
| 删除 field | O(k),k 是 field 个数 |
| 计算 field 个数 | O(1) |
| 获取所有的 field-value | O(k),k 是 field 个数 |
| 批量获取 field-value | O(k),k 是 field 个数 |
| 批量设置 field-value | O(k),k 是 field 个数 |
| 判断 field 是否存在 | O(1) |
| 获取所有的 field | O(k),k 是 field 个数 |
| 获取所有的 value | O(k),k 是 field 个数 |
| 设置值,但必须在 field 不存在时才能设置成功 | O(1) |
| 对应 field-value + n | O(1) |
| 对应 field-value + n | O(1) |
| 计算 value 的字符串长度 | O(1) |
3 内部编码
哈希的内部编码有两种:
ziplist(压缩列表):
- 当哈希类型元素个数小于
hash-max-ziplist-entries
配置(默认 512 个),同时所有值都小于hash-max-ziplist-value
配置(默认 64 字节)时,Redis 会使用 ziplist 作为哈希的内部实现。ziplist 使用更加紧凑的结构实现多个元素的连续存储 - 所以在节省内存方面比 hashtable 更加优秀。
hashtable(哈希表):
- 当哈希类型无法满足 ziplist 的条件时,Redis 会自动切换到使用哈希表作为哈希的内部实现。
优点:
- 高效的读写:数据过多时 ziplist 的读写效率会下降,而 hashtable 的读写时间复杂度为 O(1)。,即使在数据量较大时也能保证高效的访问。
- 良好的扩展性:适合存储大量数据和需要频繁更新的场景。
缺点:
- 内存占用:相较于 ziplist,哈希表在内存使用上相对较多,特别是在存储小数据集时,内存开销更为显著。
哈希类型的内部编码,以及响应的变化
- 当
field
个数⽐较少且没有⼤的value
时,内部编码为ziplist
- 当有
value
⼤于64字节时,内部编码会转换为hashtable
- 当
field
个数超过512时,内部编码也会转换为hashtable
ps: 临界数值大小,无需记忆,是可以在 redis.conf 文件中配置的,主要是:理解这种优化思想~
对于 压缩算法的简单理解:
4 使用场景
关系型数据表保存用户信息
- 结构:
映射关系表示用户信息
- 用户信息表示为哈希类型:
- 优势:相⽐于使⽤JSON格式的字符串缓存⽤⼾信息,哈希类型变得更加直观,并且在更新操作上变得更灵活
可以将每个用户的 id 定义为键后缀,多对 field-value 对应用户的各个属性,类似如下伪代码:
UserInfo getUserInfo(long uid) {
// 根据 uid 得到 Redis 的键
String key = "user:" + uid;
// 尝试从 Redis 中获取对应的值
userInfoMap = Redis 执行命令:hgetall key;
// 如果缓存命中(hit)
if (value != null) {
// 将映射关系还原为对象形式
UserInfo userInfo = 利用映射关系构建对象(userInfoMap);
return userInfo;
}
// 如果缓存未命中(miss)
// 从数据库中,根据 uid 获取用户信息
UserInfo userInfo = MySQL 执行 SQL:select * from user_info where uid = <uid>;
// 如果表中没有 uid 对应的用户信息
if (userInfo == null) {
响应 404
return null;
}
// 将缓存以哈希类型保存
Redis 执行命令:hmset key name userInfo.name age userInfo.age city userInfo.city
// 写入缓存,为了防止数据腐烂(rot),设置过期时间为 1 小时(3600 秒)
Redis 执行命令:expire key 3600
// 返回用户信息
return userInfo;
}
⭕但是需要注意的是 哈希类型 vs 关系型数据库 有两点不同之处:
- 哈希类型是稀疏的,而关系型数据库是完全结构化的。例如哈希类型 每个键可以有不同的 field,实现的是 对一个类的高内聚
-
- 而关系型数据库一旦添加新的列,所有行都要为其设置值,即使为 null。是对信息的标准格式化
- 关系数据库可以做复杂的关系查询,而 Redis 去模拟关系型复杂查询,例如联表查询、聚合查询等基本不可能,维护成本高。
5 缓存方式对比
截至目前为止,我们已经能够用三种方法缓存用户信息,下面是三种方案的实现方法和优缺点分析。
1. 原生字符串类型
- 实现:
set user:1:name James
set user:1:age 23
set user:1:city Beijing
- 优点:
-
- 实现简单,针对个别属性变更也很灵活。
- 缺点:
-
- 占用过多的键,内存占用量较大,同时用户信息在 Redis 中比较分散,缺少内聚性,所以这种方案基本没有实用性。
2. 序列化字符串类型,例如 JSON 格式
- 实现:
set user:1 经过序列化后的用户对象字符串
- 优点:
-
- 针对总是以整体作为操作的信息比较合适,编程也简单。同时,如果序列化方案选择合适,内存的使用效率很高。
- 缺点:
-
- 本身序列化和反序列需要一定开销,同时如果总是操作个别属性则非常不灵活。
3. 哈希类型
- 实现:
hmset user:1 name James age 23 city Beijing
- 优点:
-
- 简单、直观、灵活。尤其是针对信息的局部变更或者获取操作。
- 缺点:
-
- 需要控制哈希在 ziplist 和 hashtable 两种内部编码的转换,可能会造成内存的较大消耗。
- 不便于复杂的整体查询,没有规范的格式,较为稀疏,不好整体规划
💡end think : 人际交往也是:高内聚 低耦合...