Bootstrap

rsync+inotify实现实时同步

rsync


1. rsync简介

rsynclinux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSHrsync主机同步。

2. rsync特性

rsync支持很多特性:

  • 可以镜像保存整个目录树和文件系统
  • 可以很容易做到保持原来文件的权限、时间、软硬链接等等
  • 无须特殊权限即可安装
  • 快速:第一次同步时rsync会复制全部内容,但在下一次只传输修改过的文件。rsync在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的带宽
  • 安全:可以使用scpssh等方式来传输文件,当然也可以通过直接的socket连接
  • 支持匿名传输,以方便进行网站镜像

3. rsync的ssh认证协议

rsync命令来同步系统文件之前要先登录remote主机认证,认证过程中用到的协议有2种:

  • ssh协议
  • rsync协议
rsync server端不用启动rsync的daemon进程,只要获取remote host的用户名和密码就可以直接rsync同步文件
rsync server端因为不用启动daemon进程,所以也不用配置文件/etc/rsyncd.conf

ssh认证协议跟scp的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa打通通道

这种方式默认是省略了 -e ssh 的,与下面等价:
rsync -avz /SRC -e ssh [email protected]:/DEST 
    -a  文件宿主变化,时间戳不变
    -z  压缩数据传输
 
当遇到要修改端口的时候,我们可以:
rsync -avz /SRC -e "ssh -p2222" [email protected]:/DEST  
修改了ssh 协议的端口,默认是22

4. rsync命令

Rsync的命令格式常用的有以下三种:
    rsync [OPTION]... SRC DEST
    rsync [OPTION]... SRC [USER@]HOST:DEST
    rsync [OPTION]... [USER@]HOST:SRC DEST
  
对应于以上三种命令格式,rsync有三种不同的工作模式:
(1)拷贝本地文件。当SRC和DES路径信息都不包含有单个冒号":"分隔符时就启动这种工作模式。如:
[root@src ~]# ls
anaconda-ks.cfg  initial-setup-ks.cfg
[root@src ~]# rsync -a anaconda-ks.cfg usd.cfg
[root@src ~]# ls
anaconda-ks.cfg  initial-setup-ks.cfg  usd.cfg
[root@src ~]# ll
总用量 12
-rw------- 1 root root 1237 12月 14 12:40 anaconda-ks.cfg
-rw------- 1 root root 1578 12月 14 13:04 initial-setup-ks.cfg
-rw------- 1 root root 1237 12月 14 12:40 usd.cfg


2)使用一个远程shell程序(如rsh、ssh)来实现将本地机器的内容拷贝到远程机器。当DST路径地址包 
含单个冒号":"分隔符时启动该模式。如:
[root@src ~]# ls
anaconda-ks.cfg  initial-setup-ks.cfg
[root@src ~]# rsync -avz anaconda-ks.cfg 192.168.159.149:/tmp/
UOS Server 20 1060a 
[email protected]'s password: 
sending incremental file list
anaconda-ks.cfg

sent 772 bytes  received 35 bytes  124.15 bytes/sec
total size is 1,237  speedup is 1.53

[root@dest ~]# ls /tmp/
anaconda-ks.cfg
qtsingleapp-uosdev-2dc4-0-lockfile
qtsingleapp-uoslic-e6e4-0
qtsingleapp-uoslic-e6e4-0-lockfile
systemd-private-ae8550e75128453a8aca4ae1fad16d93-chronyd.service-0iCOb6
systemd-private-ae8550e75128453a8aca4ae1fad16d93-systemd-logind.service-4PAS1I

(3)使用一个远程shell程序(如rsh、ssh)来实现将远程机器的内容拷贝到本地机器。当SRC地址路径 \
包含单个冒号":"分隔符时启动该模式。如:
[root@dest tmp]# touch 123
[root@dest tmp]# ls
123
qtsingleapp-uosdev-2dc4-0-lockfile
qtsingleapp-uoslic-e6e4-0
qtsingleapp-uoslic-e6e4-0-lockfile
systemd-private-ae8550e75128453a8aca4ae1fad16d93-chronyd.service-0iCOb6
systemd-private-ae8550e75128453a8aca4ae1fad16d93-systemd-logind.service-4PAS1I

[root@src ~]# ls
anaconda-ks.cfg  initial-setup-ks.cfg
[root@src ~]# rsync -avz 192.168.159.149:/tmp/123 /root/
UOS Server 20 1060a 
[email protected]'s password: 
receiving incremental file list
123

sent 43 bytes  received 82 bytes  9.26 bytes/sec
total size is 0  speedup is 0.00
[root@src ~]# ls
123  anaconda-ks.cfg  initial-setup-ks.cfg



rsync常用选项:
    -a, --archive       //归档
    -v, --verbose       //啰嗦模式
    -q, --quiet         //静默模式
    -r, --recursive     //递归
    -p, --perms         //保持原有的权限属性
    -z, --compress      //在传输时压缩,节省带宽,加快传输速度
    --delete            //在源服务器上做的删除操作也会在目标服务器上同步

5. rsync+inotify

rsync与传统的cptar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!

Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。

环境说明:

服务器类型IP地址应用操作系统
源服务器192.168.159.148rsync inotify-tools 脚本统信服务器操作系统V20(1060a-AMD64)
目标服务器192.168.159.149rsync统信服务器操作系统V20(1060a-AMD64)

需求:

  • 把源服务器上/etc目录实时同步到目标服务器的/tmp/下

在目标服务器上做以下操作:

关闭防火墙与SELINUX
[root@dest ~]# systemctl disable --now firewalld
Removed /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
selinux和setenforce是默认关闭的
[root@dest ~]# vim /etc/selinux/config 
[root@dest ~]# setenforce 0
setenforce: SELinux is disabled


安装rsync服务端软件
[root@dest ~]# yum list all|grep rsync
rsync.x86_64                                                      3.1.3-19.uelc20                                           @UnionTechOS-20-BaseOS   
apache-ranger-usersync.x86_64                                     2.1.0-3.uelc20.01                                         UnionTechOS-20-Plus      
libguestfs-rsync.x86_64                                           1:1.44.0-9.0.1.module+uelc20+1093+2b4389a2.01             UnionTechOS-20-AppStream 
librsync.x86_64                                                   2.3.1-1.uelc20.1                                          UnionTechOS-20-Plus      
librsync-devel.x86_64                                             2.3.1-1.uelc20.1                                          UnionTechOS-20-Plus      
librsync-doc.noarch                                               2.3.1-1.uelc20.1                                          UnionTechOS-20-Plus      
rsync-bpc.x86_64                                                  3.1.2.0-5.uelc20.1                                        UnionTechOS-20-Plus      
rsync-daemon.noarch                                               3.1.3-19.uelc20                                           UnionTechOS-20-BaseOS    

[root@dest ~]# yum -y install rsync
[root@dest ~]# yum -y install rsync-daemon


设置rsyncd.conf配置文件
root@dest ~]# vim /etc/rsyncd.conf 
[root@dest ~]# cat /etc/rsyncd.conf 
log file = /var/log/rsyncd.log    # 日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid     # pid文件的存放位置
lock file = /var/run/rsync.lock   # 支持max connections参数的锁文件
secrets file = /etc/rsync.pass    # 用户认证配置文件,里面保存用户名称和密码,必须手动创建这个文件

[etc_from_client]     # 自定义同步名称
path = /tmp/          # rsync服务端数据存放路径,客户端的数据将同步至此目录
comment = sync etc from client
uid = root        # 设置rsync运行权限为root
gid = root        # 设置rsync运行权限为root
port = 873        # 默认端口
ignore errors     # 表示出现错误忽略错误
use chroot = no       # 默认为true,修改为no,增加对目录文件软连接的备份
read only = no    # 设置rsync服务端为读写权限
list = no     # 不显示rsync服务端资源列表
max connections = 200     # 最大连接数
timeout = 600     # 设置超时时间
auth users = admin        # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开

另外还可以在里面设置白名单和黑名单
hosts allow = 主机的ip   # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 主机的ip      # 禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
EOF

创建用户认证文件
[root@dest ~]# echo 'admin:123456' > /etc/rsync.pass
[root@dest ~]# cat /etc/rsync.pass 
admin:123456

设置文件权限
[root@dest ~]# chmod 600 /etc/rsync.pass 
[root@dest ~]# ll /etc/rsync.pass 
-rw------- 1 root root 13 12月 14 15:28 /etc/rsync.pass

启动rsync服务并设置开机自启动
[root@dest ~]# systemctl status rsyncd
● rsyncd.service - fast remote file copy program daemon
   Loaded: loaded (/usr/lib/systemd/system/rsyncd.service; disabled; vendor preset: disabl>
   Active: inactive (dead)
[root@dest ~]# systemctl enable --now rsyncd
Created symlink /etc/systemd/system/multi-user.target.wants/rsyncd.service → /usr/lib/systemd/system/rsyncd.service.
[root@dest ~]# systemctl status rsyncd
● rsyncd.service - fast remote file copy program daemon
   Loaded: loaded (/usr/lib/systemd/system/rsyncd.service; enabled; vendor preset: disable>
   Active: active (running) since Thu 2023-12-14 15:30:36 CST; 4s ago
 Main PID: 17135 (rsync)
    Tasks: 1
   Memory: 196.0K
   CGroup: /system.slice/rsyncd.service
           └─17135 /usr/bin/rsync --daemon --no-detach

12月 14 15:30:36 dest systemd[1]: Started fast remote file copy program daemon.

查看是否有873端口号
[root@dest ~]# ss -antl
State     Recv-Q    Send-Q       Local Address:Port        Peer Address:Port    Process    
LISTEN    0         5                  0.0.0.0:873              0.0.0.0:*                  
LISTEN    0         128                0.0.0.0:22               0.0.0.0:*                  
LISTEN    0         5                127.0.0.1:631              0.0.0.0:*                  
LISTEN    0         5                     [::]:873                 [::]:*                  
LISTEN    0         128                   [::]:22                  [::]:*                  
LISTEN    0         5                    [::1]:631                 [::]:*                  

在源服务器上做以下操作:

关闭防火墙与SELINUX
[root@src ~]# systemctl disable --now firewalld
Removed /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
selinux和setenforce是默认关闭的
[root@src ~]# vim /etc/selinux/config 
[root@src ~]# setenforce 0
setenforce: SELinux is disabled

安装epel-release
[root@src ~]# yum -y install epel-release

安装rsync服务端软件,只需要安装,不要启动,不需要配置
[root@src ~]# yum -y install rsync

创建认证密码文件
[root@src ~]# echo '123456' > /etc/rsync.pass
[root@src ~]# cat /etc/rsync.pass
123456

设置文件权限,只设置文件所有者具有读取、写入权限即可
[root@src ~]# chmod 600 /etc/rsync.pass
[root@src ~]# ll /etc/rsync.pass
-rw------- 1 root root 7 12月 14 15:48 /etc/rsync.pass

在源服务器上创建测试目录,然后在源服务器运行以下命令
[root@src ~]# ls
anaconda-ks.cfg  initial-setup-ks.cfg
[root@src ~]# mkdir -pv /root/etc/test
mkdir: 已创建目录 '/root/etc'
mkdir: 已创建目录 '/root/etc/test'
[root@src ~]# ls etc/
test
[root@src ~]# rsync -avH --port 873 --progress --delete /root/etc/ [email protected]::etc_from_client --password-file=/etc/rsync.pass
sending incremental file list
deleting systemd-private-ae8550e75128453a8aca4ae1fad16d93-systemd-logind.service-4PAS1I/tmp/
deleting systemd-private-ae8550e75128453a8aca4ae1fad16d93-systemd-logind.service-4PAS1I/
deleting systemd-private-ae8550e75128453a8aca4ae1fad16d93-chronyd.service-0iCOb6/tmp/
deleting systemd-private-ae8550e75128453a8aca4ae1fad16d93-chronyd.service-0iCOb6/
deleting .font-unix/
deleting .XIM-unix/
deleting .X11-unix/
deleting .Test-unix/
deleting .ICE-unix/
deleting qtsingleapp-uoslic-e6e4-0-lockfile
deleting qtsingleapp-uoslic-e6e4-0
deleting qtsingleapp-uosdev-2dc4-0-lockfile
./
test/

sent 77 bytes  received 530 bytes  1,214.00 bytes/sec
total size is 0  speedup is 0.00

运行完成后,在目标服务器上查看,在/tmp目录下有test目录,说明数据同步成功
[root@dest ~]# ls /tmp/
test

安装inotify-tools工具,实时触发rsync进行同步
查看服务器内核是否支持inotify
[root@src ~]# ll /proc/sys/fs/inotify/
总用量 0
-rw-r--r-- 1 root root 0 12月 14 15:59 max_queued_events
-rw-r--r-- 1 root root 0 12月 14 15:59 max_user_instances
-rw-r--r-- 1 root root 0 12月 14 15:59 max_user_watches
如果有这三个max开头的文件则表示服务器内核支持inotify

安装inotify-tools
去pkg官网下载https://dl.fedoraproject.org/pub/epel/8/Everything/x86_64/Packages/i/inotify-tools-3.14-19.el8.x86_64.rpm
[root@src ~]# ls
anaconda-ks.cfg  etc  initial-setup-ks.cfg  inotify-tools-3.14-19.el8.x86_64.rpm
[root@src ~]# yum -y install inotify-tools-3.14-19.el8.x86_64.rpm
安装过程略....


写同步脚本,此步乃最最重要的一步,请慎之又慎。让脚本自动去检测我们制定的目录下
文件发生的变化,然后再执行rsync的命令把它同步到我们的服务器端去
[root@src ~]# mkdir /scripts
[root@src ~]# touch /scripts/inotify.sh
[root@src ~]# chmod 755 /scripts/inotify.sh 
[root@src ~]# ll /scripts/inotify.sh 
-rwxr-xr-x 1 root root 0 12月 14 17:26 /scripts/inotify.sh
[root@src ~]# vi /scripts/inotify.sh 
[root@src ~]# cat /scripts/inotify.sh 
#!/bin/bash

host=192.168.159.149      # 目标服务器的ip(备份服务器)
src=/etc        # 在源服务器上所要监控的备份目录(此处可以自定义,但是要保证存在)
des=etc_from_client     # 自定义的模块名,需要与目标服务器上定义的同步名称一致
password=/etc/rsync.pass    # 执行数据同步的密码文件
user=admin          # 执行数据同步的用户名
inotifywait=/usr/bin/inotifywait

$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $src \
	| while read files;do
    rsync -avzP --delete  --timeout=100 --password-file=${password} $src $user@$host::$des
        echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done

启动脚本
[root@src ~]# nohup bash /scripts/inotify.sh &
[1] 3226
[root@src ~]# nohup: 忽略输入并把输出追加到'nohup.out'

[root@src ~]# ps -ef|grep inotify
root        3226    1710  0 17:32 pts/0    00:00:00 bash /scripts/inotify.sh
root        3227    3226  0 17:32 pts/0    00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /etc
root        3228    3226  0 17:32 pts/0    00:00:00 bash /scripts/inotify.sh
root        3230    1710  0 17:33 pts/0    00:00:00 grep --color=auto inotify

在源服务器上生成一个新文件
[root@src ~]# touch helloword /etc/abc
[root@src ~]# du -sh /etc
25M	/etc

[root@dest tmp]# ls
etc

查看inotify生成的日志
[root@src ~]# tail /tmp/rsync.log
20231214 17:35 /etc/abcCREATE was rsynced
20231214 17:35 /etc/abcMODIFY was rsynced
20231214 17:39 /etc/abcMODIFY was rsynced
20231214 17:39 /etc/abcMODIFY was rsynced
20231214 17:42 /etc/abcATTRIB was rsynced
20231214 17:43 /etc/dnf/vars/StateModeMODIFY was rsynced
20231214 17:43 /etc/.uos/.license.xkeyMODIFY was rsynced
20231214 17:43 /etc/dnf/vars/StateModeMODIFY was rsynced
20231214 17:43 /etc/.uos/.license.xkeyMODIFY was rsynced
20231214 17:44 /etc/abcATTRIB was rsynced

从日志上可以看到,我们生成了文件,并且添加了内容到其里面

设置脚本开机自动启动:

[root@dest ~]# chmod +x /etc/rc.d/rc.local
[root@dest ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x 1 root root 506 12月 14 14:53 /etc/rc.d/rc.local
[root@dest ~]# vim /etc/rc.local
[root@dest ~]# cat /etc/rc.local 
#!/bin/bash
nohup bash /scripts/inotify.sh &
# THIS FILE IS ADDED FOR COMPATIBILITY PURPOSES
#
# It is highly advisable to create own systemd services or udev rules
# to run scripts during boot instead of using this file.
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.

touch /var/lock/subsys/local
/sbin/sysctl -p /etc/sysctl.conf

到目标服务器上去查看是否把新生成的文件自动传上去了:

[root@dest tmp]# ls
etc
[root@dest tmp]# cat /etc/abc
helloword

由此可见,已将源服务器的/etc目录整个同步到了目标服务器,且新增的文件也自动同步了
;