UUID 即通用唯一识别码,是一种用于计算机系统中以确保全局唯一性的标识符。其标准定义于 RFC 4122 文档中。标准形式包含 32 个 16 进制数字,以连字符切割为五组,格式为 8-4-4-4-12,总共 36 个字符。(形如, d169aa7f-4a6e-4ee2-b073-8e46e29c72f3)。UUID 在生成时利用到了空间信息和时间信息的唯一性,几乎可以排除重复的可能性。并且 UUID 的生成不依赖于中央注册机构或协调机制。所以很适合在分布式系统中使用。通常被用于数据库中作为记录的唯一标识、在分布式系统中唯一标识资源或服务等(例如使用 Kraft 模式启动 Kafka 时,需要先给 Kafka 分配 UUID)。
变体
目前 UUID 常见的变体有:、变体1(RFC 4122)、变体2(Microsoft)。它们的主要差别在于二进制存储和传输的方式不同,变体1采用大端序作为二进制存储与传输,而变体2采用部分小端序的方式存储与传输。此外,两种变体代表变体的比特不同,即第 9 字节的高位不同(xxxxxxxx-xxxx-xxxx-Nxxx-xxxxxxxxxxxx 即此处的 N 不同),变体1为8到b,变体2为c16或d16。
其中,最常见的变体为 RFC 4122 定义的变体1。
版本
根据 RFC 4122,UUID 有五种不同的版本:
- 版本1: 基于时间和节点 ID 生成的 UUID
- 版本2: DCE 安全的 UUID
- 版本3: 通过命名空间标识符和名称进行散列得到的 UUID,使用 MD5 散列
- 版本4: 随机生成的 UUID
- 版本5: 通过命名空间标识符和名称进行散列得到的 UUID,使用 SHA-1 散列
不同版本的版本号标志在 UUID 的第 7 字节处(xxxxxxxx-xxxx-Mxxx-xxxx-xxxxxxxxxxxx 即此处的 M 即为版本号)
google/uuid 生成 UUID
版本1
版本1的 UUID 根据 60 比特的时间戳和节点的 48 比特 MAC 地址(尾部 12 个字符)组成。此外还有 14 比特的时钟序列用于扩展时间戳,以便处理处理器时钟不能足够快地前进的情况。剩下的 6 比特即为版本号和变体标志。(UUID 总长 128 比特)
利用 google/uuid 库的 NewUUID 接口即可生成 RFC 版本号为1的 UUID。
示例代码如下:
package main
import (
"fmt"
"github.com/google/uuid"
)
func main() {
// 生成一个新的 UUID
newUUID, _ := uuid.NewUUID()
fmt.Printf("Generated UUID: %s\n", newUUID)
// 获取并打印UUID的变体
variant := newUUID.Variant()
fmt.Printf("UUID Variant: %d\n", variant)
// 获取并打印UUID的版本
version := newUUID.Version().String()
fmt.Println(version)
}
版本4
版本4的 UUID 仍会使用 6 比特的空间标识版本号和变体标识,剩余的 122 比特随机生成,故版本4可以生成 2^122 种不同的 UUID,如此庞大的随机空间很难出现相同的 UUID,因此随机生成的 UUID 仍然能够提供足够的唯一性保证。
利用 google/uuid 库的 New 接口即可生成 RFC 版本号为4的 UUID。
示例代码如下:
package main
import (
"fmt"
"github.com/google/uuid"
)
func main() {
// 生成一个新的 UUID
newUUID := uuid.New()
fmt.Printf("Generated UUID: %s\n", newUUID)
// 获取并打印UUID的变体
variant := newUUID.Variant()
fmt.Printf("UUID Variant: %d\n", variant)
// 获取并打印UUID的版本
version := newUUID.Version().String()
fmt.Println(version)
}