Bootstrap

Redis设计与实现第16章 -- Sentinel 总结1(初始化、主从服务器获取信息、发送信息、接收信息)

Sentinel是Redis的高可用解决方案:由一个或多个Sentinel实例组成的Sentinel系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器,然后由新的主服务器替代已下线的主服务器继续处理命令请求。

16.1 启动并初始化Sentinel

当一个Sentinel启动的时候,需要执行5个步骤

16.1.1 初始化服务器

Sentinel本质上只是一个运行在特殊模式下的Redis服务器,所以启动Sentinel的第一步,就是初始化一个普通的Redis服务器。

区别在于部分功能Sentinel并不会使用,比如不会载入RDB和AOF文件,不会使用数据库和键值对方面的命令、不会使用事务/脚本命令;复制命令在Sentinel内部可以使用,发布和订阅里Publish命令只能在Sentinel内部使用;文件事件处理器和时间事件处理器也同理。

16.1.2 使用Sentinel专用代码

将一部分普通Redis服务器使用的代码替换成Sentinel专用代码,比如,普通Redis服务器使用redis.h/REDIS_SERVERPORT常量的值作为服务器端口,而Sentinel则使用REDIS_SENTINEL_PORT常量作为服务器端口。前者的默认值是6379,后者的默认值是26379

其次,普通Redis服务器使用redis.c/redisCommandTable作为命令表,Sentinel使用sentinel.c/sentinelcmds作为命令表。

16.1.3 初始化Sentinel状态

服务器会初始化一个sentinel.c/sentinelState结构,这个结构保存了服务器里所有和Sentinel功能有关的状态

struct sentinelState {
    uint64_t current_epoch; //当前纪元 用于实现故障转移;
    //保存了所有被这个sentinel监视的主服务器
    //字典的键是主服务器的名字
    //字典的值则是一个指向sentinelRedisInstance结构的指针
    dict *masters;
    //是否进入了TILT模式?
    int tilt;
    //目前正在执行的脚本的数量
    int running_scripts;
    //进入TILT模式的时间
    mstime_t tilt_start_time;
    //最后一次执行时间处理器的时间
    mstime_t previous_time;
    //一个EIEO队列,包含了所有需要执行的用户脚本
    list *scripts_queue;
}sentinel;

16.1.4 初始化Sentinel状态的masters属性

masters字段记录了所有被Sentinel监视的主服务器的相关信息,字典的key是被监视主服务器的名字;value是对应的sentinelRedisInstance结构。

每个sentinelRedisInstance结构(实例结构)代表一个被Sentinel监视的Redis服务器实例,可以是主服务器、从服务器或另一个Sentinel

typedef struct sentinelRedisInstance
//标识值,记录了实例的类型,以及该实例的当前状态
    int flags;
//实例的名字
//主服务器的名字由用户在配置文件中设置
//从服务器以及Sentinel的名字由Sentinel自动设置//格式为ip:port,例如"127.0.0.1:26379"
    char *name;
// 实例的运行 ID
    char *runid;
//配置纪元,用于实现故障转移
    uint64_t config_epoch;
//实例的地址
    sentinelAddr *addr;
//SENTINEL down-after-milliseconds选项设定的值
//实例无响应多少毫秒之后才会被判断为主观下线(subjectively down)
    mstime_t down_after_period;
//SENTINEL monitor<master-name><IP><port><quorum>选项中的quorum参数
//判断这个实例为客观下线(objectively down)所需的支持投票数量
    int quorum;
//SENTINEL parallel-syncs<master-name><number>选项的值
//在执行故障转移操作时,可以同时对新的主服务器进行同步的从服务器数量
    int parallel_syncs;
//SENTINEL failover-timeout <master-name><ms>选项的值
//刷新故障迁移状态的最大时限
    mstime_t failover_timeout;
}sentinelRedisInstance;

addr属性是一个指向sentinelAddr结构的指针,保存着实例的IP地址和端口号。

masters字典的初始化是根据被载入的Sentinel配置文件来进行的

16.1.5 创建连向主服务器的网络连接

Sentinel将称为主服务器的客户端,可以向主服务器发送命令,会创建2个异步网络连接:

  • 命令连接:专门向主服务器发送命令,并接收命令回复

  • 订阅连接:订阅主服务器的_sentinel_:hello频道

为了不丢失频道的任何信息,必须要有订阅连接

16.2 获取主服务器信息

Sentinel默认会以每十秒一次的频率,通过命令连接向被监视的主服务器发送INFO命令,并通过分析INFO命令的回复来获取主服务器的当前信息。

根据run_id域和role域记录的信息,Sentinel将对主服务器的实例结构进行更新;主服务器返回的从服务器信息,将会被用于更新主服务器实例结构的salves字典,这个字典记录了主服务器属下从服务器的名单。字典的key是由Sentinel自动设置的从服务器名字,格式为ip:port;字典的value是从服务器对应的实例结构。

主服务器实例结构的flags属性的值是SRI_MASTER,而从服务器实例结构的flags属性的值是SRI_SLAVE。主服务器实例结构的name的值是用户使用Sentinel配置文件设置的,而从服务器实例结构的name属性的值则是Sentinel根据从服务器的IP地址和端口号自动设置的。

16.3 获取从服务器信息

当Sentinel发现主服务器有新的从服务器出现时,会为这个新的从服务器创建相应的实例结构,还会创建连接到从服务器的命令连接和订阅链接。

创建命令连接后,默认10秒一次通过命令连接向从服务器发送INFO命令,得到下面信息:

  • 从服务器的运行 ID run_id

  • 从服务器的角色 role

  • 主服务器的IP地址 master_host,以及主服务器的端口号master_port

  • 主从服务器的连接状态master_link_status

  • 从服务器的优先级slave_priority

  • 从服务器的复制偏移量slave_repl_offset

16.4 向主服务器和从服务器发送信息

会以默认2秒一次的频率,通过命令连接向所有被监视的主服务器和从服务器发送命令

PUBLISH _sentinel_:hello "<s_ip>,<s_port>,<s_runid>,
<s_epoch>,<m_name>,<m_ip>,<m_port>,<m_epoch>"

向服务器的_sentinel_:hello频道发送了一条信息,由多个参数组成,其中s_开头的是Sentinel本身的信息,以m_开头的是主服务器的信息,如果正在监视的是主服务器,这些参数就是该主服务器的信息;如果监视的是从服务器,这些参数就是从服务器正在复制的主服务器的信息。

s_epoch表示Sentinel当前的配置纪元,m_epoch表示主服务器当前的配置纪元。

16.5 接收来自主服务器和从服务器的频道信息

当Sentinel与一个主服务器或从服务器建立起订阅连接之后,Sentinel就会通过订阅连接,向服务器发送以下命令,

SUBSCRIBE _sentinel_:hello

每个与Sentinel连接的服务器,Sentinel既通过命令连接向服务器的_sentinel_:hello 频道发送信息,又通过订阅连接从服务器的_sentinel_:hello 频道接收信息。

对于监视同一个服务器的多个Sentinel来说,一个Sentinel发送的信息会被其他Sentinel接收到,这些信息会被用于更新其他 Sentinel对发送信息 Sentinel 的认知也会被用于更新其他Sentinel对被监视服务器的认知。

当一个Sentinel从该频道收到一条信息时,Sentinel会对这条信息进行分析,提取出信息中的Sentinel IP地址,Sentinel端口号、Sentinel运行ID等8个参数,并进行检查:

  • 如果信息中记录的Sentinel运行ID和接收信息的Sentinel的运行ID相同,这条信息就是本身发送的,丢弃

  • 否则,根据收到的信息,对相应主服务器的实例结构进行更新

16.5.1 更新sentinels字典

Sentinel为主服务器创建的实例结构中的sentinels字典保存的是除了该Sentinel本身,所有同样监视这个主服务器的其他Sentinel的资料:字典的key是其中一个Sentinel的名字,格式是ip:port;字典的value是键对应Sentinel的实例结构。

当目标Sentinel收到源Sentinel发来的信息时,会从信息中分析并提取出源Sentinel的相关参数和源Sentinel正在监视的主服务器的参数,并且在自己的Sentinel状态的masters字典里查找对应的主服务器实例结构,检查主服务器实例结构的sentinels字典里,源Sentinel的实例是否存在

  • 如果源Sentinel的实例结构存在,对源Sentinel的实例结构进行更新

  • 如果不存在,说明源Sentinel是刚刚开始监视主服务器的,目标Sentinel会为源Sentinel创建一个新的实例结构,并且添加到sentinels字典里。

masters字段记录了所有被Sentinel监视的主服务器的相关信息,主服务器的信息包含了其他正在监视该主服务器的Sentinel信息。也就是说监视同一个主服务器的多个Sentinel是可以互相自动发现的。

16.5.2 创建连向其他Sentinel的命令连接

当Sentinel通过频道信息发现一个新的Sentinel时,它不仅会为新Sentinel在sentinels字典中创建相应的实例结构,还会创建一个连向新Sentinel的命令连接,而新Sentinel也同样会创建连向这个Sentinel的命令连接,最终监视同一主服务器的多个Sentinel将形成相互连接的网络:Sentinel A有连向Sentinel B的命令连接,而Sentinel B也有连向Sentinel A的命令连接。

使用命令连接相连的各个Sentinel可以通过向其他Sentinel发送命令请求来进行信息交换。

Sentinel之间不会创建订阅连接:因为Sentinel需要通过接收主服务器或从服务器发送的频道信息来发现未知的新Sentinel,所以才需要建立订阅连接;相互已知的Sentinel只需要通过命令连接来通信就足够了

;