1.星期五全量备份星期四23:59:59的数据,星期一全量备份到星期日23:59:59的数据,其他的增量备份,备份前一天00:00:00  -  23:59:59的数据 * * /opt/prodfull.sh >> /tmp/full.log >& & * * /opt/prodfull.sh >> /tmp/full.log >& & # * /opt/demoday.sh > /tmp/day.log >& &a…
索引创建完毕,就要考虑怎么定时的去重建, 除了写solrj,可以定时调用下面两条url进行增量或者全量创建索引   全量:http://ip:port/webapp_name/core_name/dataimport?command=full-import   增量:http://ip:port/webapp_name/core_name/dataimport?command=delta-import   全量索引直接调用就可以,因为是完全删除重建   如果是增量索引,就稍微麻烦一些,首先你必须…
mysql的全量备份与增量备份 全量备份:可以使用mysqldump直接备份整个库或者是备份其中某一个库或者一个库中的某个表. 备份所有数据库:[root@my ~]# mysqldump -uroot -p123456 --all-databases >/opt/all.sqlmysqldump: [Warning] Using a password on the command line interface can be insecure. 备份单个数据库的所有表:[root@my ~]#…
增量导入 一.说明 当在生产环境中,我们可能会定期从与业务相关的关系型数据库向Hadoop导入数据,导入数仓后进行后续离线分析.这种情况下我们不可能将所有数据重新再导入一遍,所以此时需要数据增量导入. 增量导入数据分为两种方式: 一是基于递增列的增量数据导入(Append方式). 二是基于时间列的数据增量导入(LastModified方式). 二.增量导入 方式一:Append方式 比如:有一个订单表,里面每个订单有一个唯一标识自增列ID,在关系型数据库中以主键形式存在,之前已经将id在1-3的…
一.使用Logstash将mysql数据导入elasticsearch 1.在mysql中准备数据: mysql> show tables; +----------------+ | Tables_in_yang | +----------------+ | im | +----------------+ 1 row in set (0.00 sec) mysql> select * from im; +----+------+ | id | name | +----+------+ | 2…
一 在HIVE中创建ETL数据库 ->create database etl; 二 在工程目录下新建MysqlToHive.py 和conf文件夹 在conf文件夹下新建如下文件,最后的工程目录如下图 三 源码 Import.xml <?xml version="1.0" encoding="UTF-8"?> <root> <importtype> <value>add</value> <!--…
全量导入: sqoop import --connect jdbc:mysql://192.168.0.144:3306/db_blog --username root --password 123456 --table t_link --target-dir /user/hadoop/t_link --hive-import --create-hive-table --hive-overwrite --num-mappers 1 增量导入:(根据时间促来导入,如果表中没有时间促属性,可以增加一…
转载请出自出处:http://www.cnblogs.com/hd3013779515/ 1.创建MySQL数据 create database solr; use solr; DROP TABLE IF EXISTS student; CREATE TABLE student ( id ) NOT NULL, stu_name ) DEFAULT NULL, stu_sex ) DEFAULT NULL, stu_address ) DEFAULT NULL, updateTime times…
粗略介绍冷备,热备,温暖,及Mysqldump,mysqlpump,xtrabackup,innobackupex 全量,增量备份 --备份的目的 灾难恢复:意外情况下(如服务器宕机.磁盘损坏等)对损坏的数据进行恢复和还原保证数据不丢失,最小程度地丢失需求改变:因需求改变而需要把数据还原到改变以前测试:测试新功能是否可用 --备份与恢复概述 根据备份的方法可以分为: 1.Hot Backup(热备) 2.Cold Backup(冷备) 3.Warm Backup(温备) Hot Backup是指…
sqoop定时增量导入 2013-11-06 14:23 4553人阅读 评论(0) 收藏 举报 sqoop使用hsql来存储job信息,开启metastor service将job信息共享,所有node上的sqoop都可以运行同一个job 一.sqoop的配置文件在sqoop.site.xml中: 1.sqoop.metastore.server.location 本地存储路径,默认在tmp下,改为其他路径 2.sqoop.metastore.server.port metastore ser…