[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

[admin@test01 apache-flume-1.9.0-bin]$ pwd

/opt/apache-flume-1.9.0-bin

2.将所需jar包复制到flume的lib目录下

flume-ng-sql-source-json-1.0.jar

mysql-connector-java-5.1.38.jar

二.压缩与解压

压缩

 tar zcvf flume.tar.tgz apache-flume-1.9.0-bin/

三.Kafka 创建Topic 消费Topic

#创建topic

/bin/kafka-topics --create --zookeeper 10.160.26.85:2181 --replication-factor 2 --partitions 15 --topic flume_mysql_test

#消费topic

/bin/kafka-console-consumer --bootstrap-server 10.160.26.81:9092 --topic flume_mysql_test

四.启动flume服务

[admin@test01 apache-flume-1.9.0-bin]$ bin/flume-ng agent --conf conf --conf-file conf/ecarx_dealer.conf --name mfkagent -Dflume.root.logger=INFO,console

五.flume配置文件

mfkagent.sources=mysqlSource

mfkagent.channels=memoryChannel

mfkagent.sinks=activeTopCitySink

#define source

# For each one of the sources, the type is defined

mfkagent.sources.mysqlSource.type = org.keedio.flume.source.SQLSource

mfkagent.sources.mysqlSource.hibernate.connection.url = jdbc:mysql:/id:3306/db_name

# Hibernate Database connection properties

mfkagent.sources.mysqlSource.hibernate.connection.user = db_test

mfkagent.sources.mysqlSource.hibernate.connection.password = password

mfkagent.sources.mysqlSource.hibernate.connection.autocommit = true

mfkagent.sources.mysqlSource.hibernate.dialect = org.hibernate.dialect.MySQL5Dialect

mfkagent.sources.mysqlSource.hibernate.connection.driver_class = com.mysql.jdbc.Driver

#mfkagent.sources.mysqlSource.table = navigation_active_city_top

# Columns to import to kafka (default * import entire row)

#mfkagent.sources.mysqlSource.columns.to.select = *

# Query delay, each configured milisecond the query will be sent

mfkagent.sources.mysqlSource.run.query.delay=100000

# Status file is used to save last readed row

mfkagent.sources.mysqlSource.status.file.path = /var/log/flume-ng

mfkagent.sources.mysqlSource.status.file.name = mysqlSource.status

# Custom query

mfkagent.sources.mysqlSource.start.from = 0

ORDER BY ranking ASC

#mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

# 加上$@$的原因是为了去除重复同步

mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

#mfkagent.sources.mysqlSource.order.by = id

mfkagent.sources.mysqlSource.batch.size = 1000

mfkagent.sources.mysqlSource.max.rows = 10000

mfkagent.sources.mysqlSource.delimiter.entry = |

mfkagent.sources.mysqlSource.hibernate.connection.provider_class = org.hibernate.connection.C3P0ConnectionProvider

mfkagent.sources.mysqlSource.hibernate.c3p0.min_size=1

mfkagent.sources.mysqlSource.hibernate.c3p0.max_size=10

#define channel

mfkagent.channels.memoryChannel.type=memory

mfkagent.channels.memoryChannel.capacity=100000

mfkagent.channels.memoryChannel.transactionCapacity=100000

mfkagent.channels.memoryChannel.keep-alive=3

#defeine sinks

mfkagent.sinks.activeTopCitySink.type = org.apache.flume.sink.kafka.KafkaSink

mfkagent.sinks.activeTopCitySink.kafka.topic = flume_mysql_test

mfkagent.sinks.activeTopCitySink.kafka.bootstrap.servers = test02.local:9092,test03.local:9092,test04.local:9092

mfkagent.sinks.activeTopCitySink.kafka.producer.acks = 1

mfkagent.sinks.activeTopCitySink.kafka.producer.linger.ms = 1

mfkagent.sinks.activeTopCitySink.kafka.flumeBatchSize = 100

# The channel can be defined as follows.

mfkagent.sources.mysqlSource.channels = memoryChannel

mfkagent.sinks.activeTopCitySink.channel = memoryChannel

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

Kettle 实现mysql数据库不同表之间数据同步——实验过程
下面是试验的主要步骤: 在上一篇文章中LZ已经介绍了,实验的环境和实验目的. 在本篇文章中主要介绍侧重于对Kettle ETL的相应使用方法, 在这里LZ需要说明一下,LZ成为了避免涉及索引和表连接等 ...
转载：MySQL和Redis 数据同步解决方案整理
from: http://blog.csdn.net/langzi7758521/article/details/52611910 最近在做一个Redis箱格信息数据同步到数据库Mysql的功能. 自 ...
Mysql主从复制，实现数据同步
大型网站为了软解大量的并发访问,除了在网站实现分布式负载均衡,远远不够.到了数据业务层.数据访问层,如果还是传统的数据结构,或者只是单单靠一台服务器扛,如此多的数据库连接操作,数据库必然会崩溃,数据丢 ...
利用Flume将MySQL表数据准实时抽取到HDFS
转自:http://blog.csdn.net/wzy0623/article/details/73650053 一.为什么要用到Flume 在以前搭建HAWQ数据仓库实验环境时,我使用Sqoop抽取 ...
Goldengate完成Mysql到Mysql的数据同步
文档参考地址:http://blog.csdn.net/u010587433/article/details/49305019 需求: 使用Goldengate完成Mysql到Mysql的数据同步,源 ...
几篇关于MySQL数据同步到Elasticsearch的文章---第三篇：logstash_output_kafka:Mysql同步Kafka深入详解
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484411&idx=1&sn=1f5a371 ...
怎么通过 Mysql 实现数据同步呢？
怎么使 mysql 数据同步先假设有主机 A 和 B ( linux 系统),主机 A 的 IP 分别是 1.2.3.4 (当然,也可以是动态的),主机 B 的 IP 是 5.6.7.8 .两个主机都 ...
通过Gearman实现MySQL到Redis的数据同步
对于变化频率非常快的数据来说,如果还选择传统的静态缓存方式(Memocached.File System等)展示数据,可能在缓存的存取上会有很大的开销,并不能很好的满足需要,而Redis这样基于内存的 ...
【转】mysql 触发器实现两个表的数据同步
mysql通过触发器实现两个表的同步目前,在本地测试成功. 假设本地的两个数据库a和b,a下有表table1(id, val) b下有表table2(id, val) 假设希望当table1中数据更 ...

随机推荐

Spark 学习笔记之 union/intersection/subtract
union/intersection/subtract: import org.apache.spark.SparkContext import org.apache.spark.rdd.RDD im ...
Java 学习笔记之 Synchronized锁对象
Synchronized锁对象: Synchronized取得的锁都是对象锁,而不是把一段代码或方法当作锁,哪个线程执行带synchronized关键字的方法,哪个线程就持有该方法所属对象的锁,那么其 ...
WordPress 使用本地化的 emoji 表情包
WordPress 结合使用 Native Emoji 和 WP Local Emoji 两个插件,可以达到使用本地化的 emoji 表情包的目的. 安装好上述两个插件并且启用: 为了使 Native ...
Android中Project、Module的区别
Project 可以包含多含 Module. Project相当于eclipse里面的工作区间,module相当于其project.module可以作为狭义上的模块,可以多个app共用的module. ...
整理一些大厂的开源平台及github，向他们看齐...
有人苦恼,该如何突破技术的局限性... 有人羡慕,技术上你怎么懂得这么多... 有人哀叹,唉,我已经学不动了... 我的总结(纯属个人想法):身处IT,就得不断学习和积累,才不会被狠狠地甩在身后.什么 ...
TF-IDF算法——原理及实现
TF-IDF算法是一种用于信息检索与数据挖掘的常用加权技术.TF的意思是词频(Term - frequency),IDF的意思是逆向文件频率(inverse Document frequency). ...
ES6——箭头函数与普通函数的区别
ES6标准新增了一种新的函数:Arrow Function(箭头函数). 为什么叫Arrow Function?因为它的定义用的就是一个箭头: 语法: //1.没有形参的时候 let fun = () ...
e课表项目第二次冲刺周期第一天
昨天干了什么? 昨天与我们小组的成员商量了一个重大的决定,由于我们第一次冲刺周期的成果,就是我们决定我们要转型发展. 今天干了什么? 查阅相关的资料,我们正式决定要做一款学习的课程表APP,把简易作为 ...
JNI静态注册与动态注册详解
JNI注册,是指将java层方法(native关键字修饰的)和C层方法对应起来,以实现java层代码调用c层代码的目的.JNI注册分为静态注册和动态注册两种,静态注册是通过固定格式方法名进行关联,动态 ...
VBS定时关闭软件
用TXT写以下代码另存为VBS格式,代码如下:doset bag=getobject("winmgmts:\\.\root\cimv2")set pipe=bag.execquer ...

[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

2.将所需jar包复制到flume的lib目录下

二.压缩与解压

三.Kafka 创建Topic 消费Topic

四.启动flume服务

五.flume配置文件

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

随机推荐

热门专题