redis主从复制原理

为什么要有主从复制，使redis具有高可用性！

# 多机情况下主从复制

# 同步和命令传播

# 同步二进制文件和同步命令区别

# 同步文件

首先需要指定从服务器，发送命令 replicaof 主服务器ip 主服务器端口 （5.0之前使用slaveof）
- 例如，现在有实例 1（ip：172.16.19.3）和实例 2（ip：172.16.19.5），我们在实例 2 上执行以下这个命令后，实例 2 就变成了实例 1 的从库，并从实例 1 上复制数据：
```
replicaof  172.16.19.3  6379
```
1
从服务器发送 sync 命令给主服务器，主服务器收到以后，会执行bgsave命令生成rdb文件，同时会使用缓冲区保存从现在开始执行的所有命令
主服务器发送rdb文件给从服务器，从服务器同步状态，主服务器还会同步缓存区内的执行命令给从服务器

# 命令传播

当主从首次同步完全量数据后，此时主从数据是一致的，但是主服务器是可以一直接受命令的，所以主服务器执行完自己的命令，也需要发送相同的命令给从服务器的，来保证主从服务器的数据一致。

# 旧版，新版复制功能对比

# 旧版复制流程（redis2.8版本之前）

首先复制分两种：初次复制和断线复制

初次复制没什么好说的，就是利用从服务器发送sync命令拿到rdb文件来同步自身的数据库数据，因为初次复制，从服务器是没有任何数据的，这也是最快最有效的方法。

断线复制：可以想象下，当在执行命令传播时，因为网络的原因，传播失败，从服务器重连主服务器的过程中，如果主服务器有新的命令需要执行时，那从服务器必然会丢失掉一些命令，也就是导致主从数据不一致的情况，而这时当从服务器重连成功后，就会向主服务器发送sync命令去重新同步主服务器的数据，这样就能达到主从服务器数据一致了。

# 弊端

每次主从断连，主服务器都要执行bgsave命令保存快照数据，非常耗内存，而从服务器也要恢复数据cpu也会上升。

# 新版复制流程

主服务器内会有一个数据的偏移量，当发送传播命令时，偏移量会随着发送的数据字节增加，而从服务器接收到命令后，之成功后，也会将自身的偏移量增加，正常情况下主从服务器的偏移量是一致的。

最大的变化：断线重连后，会根据offset偏移量是不是处于复制积压缓冲区 ,runId判断是否是部分复制还是全量复制，减少复制的数据量。客户端发送的命令不是sync，而是psync.

部分同步功能的实现三个部分组成：

主从服务器的复制偏移量
主服务器的复制积压缓冲区(固定长度的先进先出队列)
服务器的运行id(runId)（服务器的唯一标识）

新版复制流程

# 主从建立连接的过程

# 心跳检测

从服务器会默认以每秒的频率，向主服务器发送命令 replconf ack <reolication_offset>

reolication_offset是从服务器的复制偏移量

作用：

检测主从服务器的网络连接状态
辅助实现min-slaves
检查命令丢失

# 检测主从服务器的网络连接状态

命令 info replication 查看最近一次从服务器向主服务器发送 replconf ack命令距离现在过了多少秒

# 辅助实现min-slaves

# 检查命令丢失

# 主从复制可能会出现的问题

# 脑裂

当主库和客户端连接良好，客户端和主库仍然可以通信，此时可能存在数据交换操作，但是从库和哨兵都感知不到主库的存在，于是会重新选举新的主库，等网络恢复了，将原来的主库修改为从库，需要清除旧主库所有的数据来同步新主库数据，这就会造成一个问题，主从通信断开之后，主库选举成功之前客户端发送过来的数据就被丢失了

解决办法：当主库能通信的从库少于某个数量（min-slaves-to-write x），或者主从同步延迟高于某个时间（min-slaves-max-lag x）就禁止主库接受客户端的数据，提前出错，防止因为脑裂数据丢失

# 小记

为什么要读写分离？

避免资源竞争，增加开销

形成主从关系命令 (5.0之后，replicaof;5.0之前，salveof;）
主从级联模式分担全量复制时主库的压力

总结：学习主从连接过程，以及主服务器通过什么条件来判断进行部分复制还是全量复制。

上次更新: 2023/06/14, 22:08:07

← redis持久化机制 redis主从复制搭建→