Bootstrap

数据一致性实战方案

数据一致性实战方案

数据一致性是指在分布式系统中,各个副本之间保持数据内容、状态和属性的一致性。这在面对分布式系统中可能出现的网络延迟、节点故障、并发更新等问题时尤为重要

比如mysql数据更新后,如何同步ES?如何同步Redis?保证数据一致性?

方案一:同步双写

同步双写 是指将数据同时写入两个或多个存储系统确保数据同步更新。

同步双写流程:写入主存储数据库成功后,立即更新缓存(需要同步的存储),确保所有写入操作都成功后才返回成功响应

  • 优点:同步双写保证强一致性,使用数据对一致性要求高的场景,如订单系统,金融支付系统
  • 缺点:同步双写都在性能开销,可能导致响应延迟。并且需要考虑同步双写中如果失败如何处理(比如双写放在同一个事务中,规范建议事务范围不要包含非mysql写操作,否则容易产生大事务)

方案二:MQ异步写

MQ异步写 通过将数据同步消息发送给MQ消息队列,异步监听消息队列完成数据同步

MQ异步写流程:主业务流程将要同步数据封装成消息发送到消息队列,并直接响应前端。监听器监听消息队列,完成数据同步。实现数据最终一致性

  • 优点:异步解耦数据同步,提高系统可扩展性和响应时间
  • 缺点:需要保证消息的可靠性投递与消费以达到数据最终一致性。业务允许短期的数据不一致

方案三:binlog+canal

binlog日志记录所有针对数据库的增删改操作,Canal 模拟 MySQL 的从库协议,通过订阅数据库的binlog日志,Canal可以实现数据的实时监听,并将数据变更以消息的形式分发给消费者。外部应用接收 Canal 的消息(往往会引入MQ存储),执行业务逻辑(更新缓存,数据同步)

消费者
Canal服务
MySQL数据库
消息队列 Kafka/RabbitMQ
缓存 Redis/Memcached
搜索引擎 Elasticsearch
数据仓库或分析平台
Canal 解析服务
增量数据
Binlog
MySQL Master
  • 优点:零入侵性,高效,高扩展性,支持多种消费场景,推荐。
  • 缺点:系统复杂性提高,存在性能开销,异步数据同步短时间数据不一致
;