真正的inotify+rsync实时同步 彻底告别同步慢
背景
我们公司在用inotify+rsync做实时同步,来解决分布式集群文件一致性的问题。但当web文件越来越多(百万级数量html,jpg等小 文件),同步就越来越慢,根本做不到实时,按照网上的调优方法都尝试过,问题根本没有解决。经过我一翻细致研究,终于把慢的核心问题研究明白,先总结一句 inotifywait响应不会有延迟,rsync也很快。大家同样有慢的烦恼,那是因为网上的inotify+rsync的教程都是坑。下面我们来分 析。
inotifywait 单独分析
| 1 | /usr/local/bin/inotifywait-mrq--format'%Xe %w%f'-emodify,create,delete,attrib/data/ | 
执行上面命令,是让inotifywait监听/data/目录,当监听到有发生modify,create,delete,attrib等事件发生时,按%Xe %w%f的格式输出。
在/data/目录touch几个文件
| 1 | touch/data/{1..5} | 
观看inotify输出
| 1 2 3 4 5 | ATTRIB/data/1      --表示发生了ATTRIB事件路径为/data/1 ATTRIB/data/2 ATTRIB/data/3 ATTRIB/data/4 ATTRIB/data/5 | 
知道上面的输出效果之后 我们应该想得到,可以用rsync获取inotifywait监控到的文件列表来做指定的文件同步,而不是每次都由rsync做全目录扫描来判断文件是否存在差异。
网上的inotify+rsync分析
我们来看网上的教程,我加了注释。(网上所有的教程基本都一模一样,尽管写法不一样,致命点都是一样的)
| 1 2 3 4 5 6 | #!/bin/bash  /usr/bin/inotifywait-mrq--format'%w%f'-ecreate,close_write,delete/backup|whileread file #把发生更改的文件列表都接收到file 然后循环,但有什么鬼用呢?下面的命令都没有引用这个$file 下面做的是全量rsync do     cd/backup&&rsync-az--delete/backup/rsync_backup@192.168.24.101::backup/--password-file=/etc/rsync.password  done | 
#注意看 这里的rsync 每次都是全量的同步(这就坑爹了),而且 file列表是循环形式触发rsync ,等于有10个文件发生更改,就触发10次rsync全量同步(简直就是噩梦),那还不如直接写个死循环的rsync全量同步得了。
#有很多人会说 日志输出那里明明只有差异文件的同步记录。其实这是rsync的功能,他本来就只会输出有差异需要同步的文件信息。不信你直接拿这句rsync来跑试试。
#这种在需要同步的源目录文件量很大的情况下,简直是不堪重负。不仅耗CPU还耗时,根本不可以做到实时同步。
备注:backup为rsync server配置module,除了编写脚本以外,还需要配置一个rsync server,rsync server配置参考《http://www.ttlsa.com/linux/rsync-install-on-linux/》
改良方法
要做到实时,就必须要减少rsync对目录的递归扫描判断,尽可能的做到只同步inotify监控到已发生更改的文件。结合rsync的特性,所以这里要分开判断来实现一个目录的增删改查对应的操作。
脚本如下
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 | #!/bin/bash src=/data/                           # 需要同步的源路径 des=data                             # 目标服务器上 rsync --daemon 发布的名称,rsync --daemon这里就不做介绍了,网上搜一下,比较简单。 rsync_passwd_file=/etc/rsyncd.passwd            # rsync验证的密码文件 ip1=192.168.0.18                 # 目标服务器1 ip2=192.168.0.19                 # 目标服务器2 user=root                            # rsync --daemon定义的验证用户名 cd${src}                              # 此方法中,由于rsync同步的特性,这里必须要先cd到源目录,inotify再监听 ./ 才能rsync同步后目录结构一致,有兴趣的同学可以进行各种尝试观看其效果 /usr/local/bin/inotifywait-mrq--format  '%Xe %w%f'-emodify,create,delete,attrib,close_write,move./|whileread file         # 把监控到有发生更改的"文件路径列表"循环 do         INO_EVENT=$(echo$file|awk'{print $1}')      # 把inotify输出切割 把事件类型部分赋值给INO_EVENT         INO_FILE=$(echo$file|awk'{print $2}')       # 把inotify输出切割 把文件路径部分赋值给INO_FILE         echo"-------------------------------$(date)------------------------------------"         echo$file         #增加、修改、写入完成、移动进事件         #增、改放在同一个判断,因为他们都肯定是针对文件的操作,即使是新建目录,要同步的也只是一个空目录,不会影响速度。         if[[$INO_EVENT=~'CREATE']]||[[$INO_EVENT=~'MODIFY']]||[[$INO_EVENT=~'CLOSE_WRITE']]||[[$INO_EVENT=~'MOVED_TO']]         # 判断事件类型         then                 echo'CREATE or MODIFY or CLOSE_WRITE or MOVED_TO'                 rsync-avzcR--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip1}::${des}&&         # INO_FILE变量代表路径哦  -c校验文件内容                 rsync-avzcR--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip2}::${des}                  #仔细看 上面的rsync同步命令 源是用了$(dirname ${INO_FILE})变量 即每次只针对性的同步发生改变的文件的目录(只同步目标文件的方法在生产环境的某些极端环境下会漏文件 现在可以在不漏文件下也有不错的速度 做到平衡) 然后用-R参数把源的目录结构递归到目标后面 保证目录结构一致性         fi         #删除、移动出事件         if[[$INO_EVENT=~'DELETE']]||[[$INO_EVENT=~'MOVED_FROM']]         then                 echo'DELETE or MOVED_FROM'                 rsync-avzR--delete--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip1}::${des}&&                 rsync-avzR--delete--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip2}::${des}                 #看rsync命令 如果直接同步已删除的路径${INO_FILE}会报no such or directory错误 所以这里同步的源是被删文件或目录的上一级路径,并加上--delete来删除目标上有而源中没有的文件,这里不能做到指定文件删除,如果删除的路径越靠近根,则同步的目录月多,同步删除的操作就越花时间。这里有更好方法的同学,欢迎交流。         fi         #修改属性事件 指 touch chgrp chmod chown等操作         if[[$INO_EVENT=~'ATTRIB']]         then                 echo'ATTRIB'                 if[!-d"$INO_FILE"]                 # 如果修改属性的是目录 则不同步,因为同步目录会发生递归扫描,等此目录下的文件发生同步时,rsync会顺带更新此目录。                 then                         rsync-avzcR--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip1}::${des}&&                                     rsync-avzcR--password-file=${rsync_passwd_file}$(dirname${INO_FILE})${user}@${ip2}::${des}                 fi         fi done | 
每两小时做1次全量同步
因为inotify只在启动时会监控目录,他没有启动期间的文件发生更改,他是不知道的,所以这里每2个小时做1次全量同步,防止各种意外遗漏,保证目录一致。
| 1 2 | crontab-e **/2***rsync-avz--password-file=/etc/rsync-client.pass/data/root@192.168.0.18::data&&rsync-avz--password-file=/etc/rsync-client.pass/data/root@192.168.0.19::data | 
改良后我们公司这种百万级小文件也能做到实施同步了。
下面附上inotify的参数说明
inotify介绍-- 是一种强大的、细颗粒的、异步的文件系统监控机制,*&####&*_0_*&####&*内核从2.6.13起,加入Inotify可以监控文件系统中添加、删除、修改移动等各种事件,利用这个内核接口,就可以监控文件系统下文件的各种变化情况。
inotifywait 参数说明
| 参数名称 | 参数说明 | 
|---|---|
| -m,–monitor | 始终保持事件监听状态 | 
| -r,–recursive | 递归查询目录 | 
| -q,–quiet | 只打印监控事件的信息 | 
| –excludei | 排除文件或目录时,不区分大小写 | 
| -t,–timeout | 超时时间 | 
| –timefmt | 指定时间输出格式 | 
| –format | 指定时间输出格式 | 
| -e,–event | 后面指定删、增、改等事件 | 
inotifywait events事件说明
| 事件名称 | 事件说明 | 
|---|---|
| access | 读取文件或目录内容 | 
| modify | 修改文件或目录内容 | 
| attrib | 文件或目录的属性改变 | 
| close_write | 修改真实文件内容 | 
| close_nowrite | |
| close | |
| open | 文件或目录被打开 | 
| moved_to | 文件或目录移动到 | 
| moved_from | 文件或目录从移动 | 
| move | 移动文件或目录移动到监视目录 | 
| create | 在监视目录下创建文件或目录 | 
| delete | 删除监视目录下的文件或目录 | 
| delete_self | |
| unmount | 卸载文件系统 | 
优化 Inotify
# 在/proc/sys/fs/inotify目录下有三个文件,对inotify机制有一定的限制
| 1 2 3 4 5 | [root@web~]# ll /proc/sys/fs/inotify/ 总用量0 -rw-r--r--1root root09月923:36max_queued_events -rw-r--r--1root root09月923:36max_user_instances -rw-r--r--1root root09月923:36max_user_watches | 
| 1 2 | [root@web~]# echo 50000000>/proc/sys/fs/inotify/max_user_watches -- 把他加入/etc/rc.local就可以实现每次重启都生效 [root@web~]# echo 50000000>/proc/sys/fs/inotify/max_queued_events | 
作者信息
广州 - 小朱
真正的inotify+rsync实时同步 彻底告别同步慢的更多相关文章
- [转载]真正的inotify+rsync实时同步 彻底告别同步慢
		原文链接http://www.ttlsa.com/web/let-infotify-rsync-fast/ 背景我们公司在用inotify+rsync做实时同步,来解决分布式集群文件一致性的问题.但当 ... 
- 【转载】inotify+rsync实时同步 解决同步慢问题 (转载备记)
		原文地址:http://www.ttlsa.com/web/let-infotify-rsync-fast/ 背景 我们公司在用inotify+rsync做实时同步,来解决分布式集群文件一致性的问题. ... 
- 使用inotify+rsync实现服务器间文件同步
		1. rsync 1.1 什么是rsync rsync是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件.它使用所谓的“Rsync演算法”来使本地和远程两个主机之间的文件达到 ... 
- inotify+rsync实时同步
		主服务器上安装inotify和rsync,备用服务器上安装rsync 主服务器上修改/etc/rsyncd.conf配置文件 三. 创建密码文件,防火墙设置,客户端和服务器端都要做如下操作 echo ... 
- inotify+rsync实时同步备份nfs
		学习教程总结: 1.主机1:172.16.1.41,安装rsync并运行rsync --daemon 配置好/etc/rsyncd.conf 和密码文件rscync.password并设置chomd ... 
- Inotify+Rsync实现Linux服务器文件同步
		做这个功能的时候遇到了好多坑,在此感谢一下这篇博客 http://kerry.blog.51cto.com/172631/734087/ ,大家参照这篇博客就能实现该功能. 另外如果想详细了解一下的 ... 
- rsync+inotify实现实时同步案例【转】
		1.1 inotify介绍 inotify是一种强大的.细粒度的.异步的文件系统事件控制机制.linux内核从2.6.13起,加入了inotify支持,通过inotify可以监控文件系统中添加.删除. ... 
- inotify+rsync实现实时同步
		第1章 数据实时同步介绍 1.1 什么是实时同步:如何实现实时同步 A. 要利用监控服务(inotify),监控同步数据服务器目录中信息的变化 B. 发现目录中数据产生变化,就利用rsync服务推送到 ... 
- 【转】inotify+rsync实现实时同步
		[转]inotify+rsync实现实时同步 1.1 什么是实时同步:如何实现实时同步 要利用监控服务(inotify),监控同步数据服务器目录中信息的变化 发现目录中数据产生变化,就利用rsync服 ... 
随机推荐
- Python标准库:迭代器Itertools
			Infinite Iterators: Iterator Arguments Results Example count() start, [step] start, start+step, star ... 
- ios开发——实用技术篇OC篇&获取内存使用情况
			获取内存使用情况 iOS 获取 当前设备 可用内存 及当前 应用 所占内存 (-- ::) 转载 ▼ 标签: ios 设备 可用内存 所占内存 内存 it 分类: iOS // 获取当前设备可用内存及 ... 
- IOS使用APNS推送Payload字节数限制导致推送不成功
			这2天须要在推送上加上脚本,找到了badge方法能够加脚本.加上后可是怎么推送也不成功.郁闷了好久.在网上查找相关资料. 最终被我找到原因: "Payload--最多256bytes. &q ... 
- yii泛域名
			return CMap::mergeArray( require (dirname(__FILE__) . '/main.php'), array( 'components' => array( ... 
- LINUX C++ 技术博客
			http://blog.csdn.net/pcliuguangtao/article/category/676422 
- 使用代码修改camera.cullingMask
			通过查找http://docs.unity3d.com/Documentation/ScriptReference/Camera-cullingMask.html只是能够指定某个层,但要指定多个层却不 ... 
- debian7编译内核
			第一个步骤“配置内核”. 在这里,我比较建议在发行版默认的config的基础上再进行配置,这样 配置出的内核和发行版本身才会有更好的相容性.比如可以在运行“make menuconfig”之前执行命令 ... 
- MySQL的数据库引擎的类型及区别
			MySQL的数据库引擎的类型 你能用的数据库引擎取决于mysql在安装的时候是如何被编译的.要添加一个新的引擎,就必须重新编译MYSQL.在缺省情况下,MYSQL支持三个引擎:ISAM.MYISAM和 ... 
- aptana中删除空行
			问题:有一个css文件,写一行样式后,会换行,空一行,再写另一个样式.现在需要把空的一行给去掉. 尝试直接复制空行,但是aptana会把所有的换行都去了,变成了一个文件只有一行.尝试用正则,\r\t\ ... 
- C# 之 无法嵌入互操作类型(Word 或 Excel 操作)
			Microsoft.Office.Interop.Excel.Application eApp = new Microsoft.Office.Interop.Excel.ApplicationClas ... 
