Bootstrap

Kafka进阶之Replication

Replication这个词相信大家都不会陌生,在很多分布式系统中,我们都需要Replication来保证Availability和Durability,Kafka也不例外,它也是利用Replication来保证某个节点发生问题的时候仍然能够保证数据不丢失并正常工作。本文就来详细聊一聊Kafka中的Replication。

概念

我们在前面提过Kafka的数据是根据topic来组织的,每个topic可以有很多个partition,每个partition可以有多个replica。这些replica都保存在brokers上,每个broker可能保存成百上千个replica。总得来说有两种replica:

  1. Leader Replica :每个partition只能有一个leader replica,所有的producer的请求都会发送到这个leader replica,当然consumer可以从leader上consume数据也可以从follower replica中consume数据。
  2. Follower Replica :partition中除了leader之外的replica就称之为follower replica,follower的数目可以自由配置,不像leader只能有一个。它的主要任务就是保持和leader同步,当旧的leader出现问题的时候它能够快速被promote到leader,从而保证availability。我们可以从follower中读,也可以只从leader读,这个是可以配置的。

从follower读

早期的Kafka只支持从leader读,并不支持从follower读。当时实现这个feature的原因主要是因为有时Kafka cluster会在多个数据中心,这样一来clien

;