Linux定时增量更新文件--转
http://my.oschina.net/immk/blog/193926
动机与需求:现在有两台服务器A和B,由于A的存储随时会挂(某些原因),所以需要B机器上有A的备份,并且能够与A同步更新
一、crontab定时任务
发现了crontab这个东西
简单实践了一下,把使用的过程写到下面:
首先是编辑一个文件,这个文件在一个很不好找的位置,但crontab提供了一个命令可以直接用vi打开这个文件
crontab -e
文件打开以后要在文件末尾加上一行:
* * * * * mkdir /usr/local/test >/home/log.txt 2>&1
总共分为三个部分,首先是5个星星,格式是 分钟 小时 日期 月份 星期几
举个例子应该就明白了:
59 23 * * 5
这个意思是每周五的23点59分执行一下后面的这个命令
mkdir /usr/local/test
就是要执行的命令
>/home/log.txt 2>&1
则是指定命令执行时输出的信息放到/home/log.txt这个文件里,2>&1是指将标准输出转换到文件流
如果只有命令而不指定输出日志文件的话,在crontab的日志里可能会报错:
(CRON) info (No MTA installed, discarding output)
这是因为你的机器没有安装任何的邮件发送的软件,也就是MTA,而crontab是默认要将输出的信息以邮件的形式发送的,所以就会有这样的错误
说到crontab的日志,系统是ubuntu12.04
默认位置是/var/log/cron.log这个文件
如果没有,那么可能要修改一下rsyslog里的配置文件,文件位置是
/etc/rsyslog.d/50-default.conf
将这一行注释前面的“#”去掉即可(原来是注释掉的,所以没有日志文件)
#cron.* /var/log/cron.log
然后重启rsyslog服务
service rsyslog restart
对于CentOS,rsyslog的配置文件是/etc/rsyslog.conf,里面关于cron的日志输出这一项没有被注释掉
所以不用改,默认的执行日志文件为:/var/log/cron
二、rsync增量更新
然后是文件的增量更新,主要解决的问题是现在有两台服务器A和B,要将A服务器上的test目录增量复制到B服务器上的test目录(所谓增量更新就是指B服务器原来已经有的文件不再传了,只传送那些A有的而B没有的),这样使得B服务器上的test文件夹保持与A同步
这就需要用到rsync这个命令,这个命令的用法跟scp是一样的
比如在A服务器下执行命令:rsync -r /home/test/ user@B:/home/test 即可实现增量更新
注意:这里有一个问题需要详细说明一下:
假如test目录下有1.txt,2.txt这两个文件
如果命令中源目录那里写成这样:/home/test/
那么rsync准备更新的文件列表就是
1.txt
2.txt
然后就会在B机器的/home/test目录下找这两个文件并做增量更新,这样能够满足需求
但如果源目录写成这样:/home/test
那么rsync准备增量更新的文件列表就会是这样:
test/1.txt
test/2.txt
然后在B机器的/home/test目录下寻找test/1.txt,发现没有test文件夹,于是又创建了test文件夹,所以这样执行的结果就是B机器的目录结构就会有这两个文件,而这不是希望看到的
/home/test/test/1.txt
/home/test/test/2.txt
所以要注意这个问题。下面两种写法是正确的:
rsync -r /home/test/ user@B:/home/test
或者
rsync -r /home/test user@B:/home
具体的关于rsync的详细参数的设置这里就不说了,这里只把一种推荐的命令运行方式记录下来:
rsync -rtv /home/test/ user@B:/home/test
-t是指判断文件是否已有的时候只判断文件的时间戳和文件的大小,如果都一样就把这个文件跳过(这是一种不够严谨但足够快的方法)
-v是指输出一下执行的日志,其实可以加很多v,v越多,输出的日志越多
三、免验证访问
现在就可以将crontab和rsync结合一下了,当然首先需要解决两个机器之间rsync免验证的问题,也就是命令可以直接这样写(不需要B机器的用户名和密码):
rsync -rtv /home/test user@B:/home/test
关于这个网上看了一些rsync的配置,但是觉得太麻烦了,想到这个跟scp差不多,是不是也可以直接ssh免验证的那种方式解决,试了一下,可行
关于ssh免验证登录,是这样做的(这里的用户全部用root,当然可以用其他的):
在A机器下:
首先生成秘钥文件
ssh-keygen -t rsa -P ''
注意‘’是两个单引号,表示密码为空
然后将生成的id_rsa.pub文件复制到B服务器上(注意文件的位置为/root/.ssh,如果是其他用户应该是/home/user/.ssh,即为当前用户的主目录)
scp /root/.ssh/id_rsa.pub root@B:/root/
(因为操作还没有完成,这里还要输入密码)
然后在B机器上操作:
如果/root/.ssh/里没有authorized_keys这个文件,那么将从A机器scp过来的id_rsa.pub文件移动并重命名成authorized_keys即可
mv /root/id_rsa.pub /root/.ssh/authorized_keys
如果这个authorized_keys文件已经存在,那么将id_rsa.pub这个文件的内容追加到authorized_keys即可
cat /root/id_rsa.pub >> /root/.ssh/authorized_keys
此时就可以在A机器上免密码访问B机器了,注意别搞反了
在A机器上测试一下:
ssh root@B
如果不需要输入密码就可以登录,说明配置成功
四、综合
OK,准备工作都完成了,下面就可以实现需求了,在A机器下:
1、crontab -e打开crontab的配置文件
2、在最后一行加入下面的代码
0 0,6,12,18 * * * rsync -rvt /app/elearndata/ root@inc204:/home/elearndata >>/home/updateLog.txt 2>&1
注意inc204是我的B机器名,需要在A机器的hosts下面配置其IP映射,当然也可以直接用ip代替
这句代码的意思是每6个小时(在0点,6点,12点,18点)对elearndata这个文件夹进行从A到B的增量更新,并将rsync的日志输出到/home/updateLog.txt这个文件里,‘>>’是追加输出的意思
3、保存即可,大功告成
经测试,可满足需求
Linux定时增量更新文件--转的更多相关文章
- linux定时删除过期文件
需求说明 每日凌晨0点定时删除/temp目录下的所有一个月未被访问的文件. 脚本实现 linux 终端输入crontab -e,添加定时任务脚本命令 [root@localhost ~]# cront ...
- django使用pyecharts(6)----django加入echarts_增量更新_定长_坐标轴定长
六.Django 前后端分离_定时增量更新图表(坐标轴定长) 1.安装 djangorestframework linux pip3 install djangorestframework windo ...
- django使用pyecharts(5)----django加入echarts_增量更新_定长
五.Django 前后端分离_定时增量更新图表定长数据 1.安装 djangorestframework linux pip3 install djangorestframework windows ...
- django使用pyecharts(4)----django加入echarts_增量更新
四.Django 前后端分离_定时增量更新图表 1.安装 djangorestframework linux pip3 install djangorestframework windows pip ...
- oracle或mysql定时增量更新索引数据到Elasticsearch
利用kettle Spoon从oracle或mysql定时增量更新数据到Elasticsearch https://blog.csdn.net/jin110502116/article/details ...
- 使用python备份数据库并删除备份超过一定时长的文件
#!/usr/bin/env python #-*- coding: utf-8 -*- """ @Project:Py @author:sandu @Email: sa ...
- Linux系统下定时上传文件至FTP服务器脚本
环境:Red Hat Enterprise Linux Server release 6.4 需求:需要将Oracle数据库的定时备份上传至FTP服务器 1.干货,用户名:oracle,数据库名称:X ...
- SSIS 实例 从Ftp获取多个文件并对数据库进行增量更新。
整个流程 Step 1 放置一个FTP Task 将远程文件复制到本地 建立FTP链接管理器后 Is LocalPatchVariable 设置为Ture 并创建一个变量设置本地路径 Operatio ...
- git实战-linux定时监控github更新状态(二)
系列文章 git介绍-常用操作(一)✓ git实战-linux定时监控github更新状态(二)✓ 本文主要内容 如何查看github的本地仓库和远程仓库的同步情况 linux服务器定时监控githu ...
随机推荐
- IOS 6 自动布局 入门
http://blog.csdn.net/itianyi/article/details/8535392
- 使用纯真IP库获取用户端地理位置信息
引言 在一些电商类或者引流类的网站中经常会有获取用户地理位置信息的需求,下面我分享一个用纯真IP库获取用户地理位置信息的方案. 正文 第一步:本文的方案是基于纯真IP库的,所以首先要去下载最新的纯真I ...
- centos7 修改主机名(hostnamectl)
hostnamectl 是在 centos7 中新增加的命令,它是用来修改主机名称的,centos7 修改主机名称会比以往容易许多. 用法 # hostnamectl -h -h --help 显示帮 ...
- CF666E Forensic Examination(后缀自动机+动态线段树)
题意 给你一个串 $S$ 以及一个字符串数组 $T[1..m]$ , $q$ 次询问,每次问 $S$ 的子串 $S[p_l..p_r]$ 在 $T[l..r]$ 中的哪个串里的出现次数最多,并输出出现 ...
- POJ 3522 最小差值生成树(LCT)
题目大意:给出一个n个节点的图,求最大边权值减去最小边权值最小的生成树. 题解 Flash Hu大佬一如既往地强 先把边从小到大排序 然后依次加入每一条边 如果已经连通就把路径上权值最小的边删去 然后 ...
- jqury属性操作,特殊效果
一. 常用属性操作 1.html() 取出或设置html内容 // 取出html内容 var $htm = $('#div1').html(); // 设置html内容 $('#div1').html ...
- 2016级算法第五次上机-D.AlvinZH的学霸养成记III
850 AlvinZH的学霸养成记III 思路 难题.概率DP. 第一种思考方式:直接DP dp[i]:从已经有i个学霸到所有人变成学霸的期望. 那么答案为dp[1],需要从后往前逆推.对于某一天,有 ...
- BZOJ1688 Disease Manangement 疾病管理
Disease Manangement 疾病管理 Description Alas! A set of D (1 <= D <= 15) diseases (numbered 1..D ...
- 04day->python列表和元祖
一.列表 1.索引.切片 索引:根据索引值获取,里表里的值 切片:和字符串相似 2.增 1)append(object),在列表的末端添加 2)insert(index ...
- 《UltraFast设计法实践》系列目录
最近准备开始潜心学习快速和高效的时序收敛设计了,突然想就把整个学习过程做成一个博客系列吧,虽然想想就很激动(技术狗就这么点出息--),但希望坚持下来. 这篇做个目录或者索引,不断向其中添加学习内容. ...