[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

[admin@test01 apache-flume-1.9.0-bin]$ pwd

/opt/apache-flume-1.9.0-bin

2.将所需jar包复制到flume的lib目录下

flume-ng-sql-source-json-1.0.jar

mysql-connector-java-5.1.38.jar

二.压缩与解压

压缩

 tar zcvf flume.tar.tgz apache-flume-1.9.0-bin/

三.Kafka 创建Topic 消费Topic

#创建topic

/bin/kafka-topics --create --zookeeper 10.160.26.85:2181 --replication-factor 2 --partitions 15 --topic flume_mysql_test

#消费topic

/bin/kafka-console-consumer --bootstrap-server 10.160.26.81:9092 --topic flume_mysql_test

四.启动flume服务

[admin@test01 apache-flume-1.9.0-bin]$ bin/flume-ng agent --conf conf --conf-file conf/ecarx_dealer.conf --name mfkagent -Dflume.root.logger=INFO,console

五.flume配置文件

mfkagent.sources=mysqlSource

mfkagent.channels=memoryChannel

mfkagent.sinks=activeTopCitySink

#define source

# For each one of the sources, the type is defined

mfkagent.sources.mysqlSource.type = org.keedio.flume.source.SQLSource

mfkagent.sources.mysqlSource.hibernate.connection.url = jdbc:mysql:/id:3306/db_name

# Hibernate Database connection properties

mfkagent.sources.mysqlSource.hibernate.connection.user = db_test

mfkagent.sources.mysqlSource.hibernate.connection.password = password

mfkagent.sources.mysqlSource.hibernate.connection.autocommit = true

mfkagent.sources.mysqlSource.hibernate.dialect = org.hibernate.dialect.MySQL5Dialect

mfkagent.sources.mysqlSource.hibernate.connection.driver_class = com.mysql.jdbc.Driver

#mfkagent.sources.mysqlSource.table = navigation_active_city_top

# Columns to import to kafka (default * import entire row)

#mfkagent.sources.mysqlSource.columns.to.select = *

# Query delay, each configured milisecond the query will be sent

mfkagent.sources.mysqlSource.run.query.delay=100000

# Status file is used to save last readed row

mfkagent.sources.mysqlSource.status.file.path = /var/log/flume-ng

mfkagent.sources.mysqlSource.status.file.name = mysqlSource.status

# Custom query

mfkagent.sources.mysqlSource.start.from = 0

ORDER BY ranking ASC

#mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

# 加上$@$的原因是为了去除重复同步

mfkagent.sources.mysqlSource.custom.query = select * from table where id>$@$

#mfkagent.sources.mysqlSource.order.by = id

mfkagent.sources.mysqlSource.batch.size = 1000

mfkagent.sources.mysqlSource.max.rows = 10000

mfkagent.sources.mysqlSource.delimiter.entry = |

mfkagent.sources.mysqlSource.hibernate.connection.provider_class = org.hibernate.connection.C3P0ConnectionProvider

mfkagent.sources.mysqlSource.hibernate.c3p0.min_size=1

mfkagent.sources.mysqlSource.hibernate.c3p0.max_size=10

#define channel

mfkagent.channels.memoryChannel.type=memory

mfkagent.channels.memoryChannel.capacity=100000

mfkagent.channels.memoryChannel.transactionCapacity=100000

mfkagent.channels.memoryChannel.keep-alive=3

#defeine sinks

mfkagent.sinks.activeTopCitySink.type = org.apache.flume.sink.kafka.KafkaSink

mfkagent.sinks.activeTopCitySink.kafka.topic = flume_mysql_test

mfkagent.sinks.activeTopCitySink.kafka.bootstrap.servers = test02.local:9092,test03.local:9092,test04.local:9092

mfkagent.sinks.activeTopCitySink.kafka.producer.acks = 1

mfkagent.sinks.activeTopCitySink.kafka.producer.linger.ms = 1

mfkagent.sinks.activeTopCitySink.kafka.flumeBatchSize = 100

# The channel can be defined as follows.

mfkagent.sources.mysqlSource.channels = memoryChannel

mfkagent.sinks.activeTopCitySink.channel = memoryChannel

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

Kettle 实现mysql数据库不同表之间数据同步——实验过程
下面是试验的主要步骤: 在上一篇文章中LZ已经介绍了,实验的环境和实验目的. 在本篇文章中主要介绍侧重于对Kettle ETL的相应使用方法, 在这里LZ需要说明一下,LZ成为了避免涉及索引和表连接等 ...
转载：MySQL和Redis 数据同步解决方案整理
from: http://blog.csdn.net/langzi7758521/article/details/52611910 最近在做一个Redis箱格信息数据同步到数据库Mysql的功能. 自 ...
Mysql主从复制，实现数据同步
大型网站为了软解大量的并发访问,除了在网站实现分布式负载均衡,远远不够.到了数据业务层.数据访问层,如果还是传统的数据结构,或者只是单单靠一台服务器扛,如此多的数据库连接操作,数据库必然会崩溃,数据丢 ...
利用Flume将MySQL表数据准实时抽取到HDFS
转自:http://blog.csdn.net/wzy0623/article/details/73650053 一.为什么要用到Flume 在以前搭建HAWQ数据仓库实验环境时,我使用Sqoop抽取 ...
Goldengate完成Mysql到Mysql的数据同步
文档参考地址:http://blog.csdn.net/u010587433/article/details/49305019 需求: 使用Goldengate完成Mysql到Mysql的数据同步,源 ...
几篇关于MySQL数据同步到Elasticsearch的文章---第三篇：logstash_output_kafka:Mysql同步Kafka深入详解
文章转载自: https://mp.weixin.qq.com/s?__biz=MzI2NDY1MTA3OQ==&mid=2247484411&idx=1&sn=1f5a371 ...
怎么通过 Mysql 实现数据同步呢？
怎么使 mysql 数据同步先假设有主机 A 和 B ( linux 系统),主机 A 的 IP 分别是 1.2.3.4 (当然,也可以是动态的),主机 B 的 IP 是 5.6.7.8 .两个主机都 ...
通过Gearman实现MySQL到Redis的数据同步
对于变化频率非常快的数据来说,如果还选择传统的静态缓存方式(Memocached.File System等)展示数据,可能在缓存的存取上会有很大的开销,并不能很好的满足需要,而Redis这样基于内存的 ...
【转】mysql 触发器实现两个表的数据同步
mysql通过触发器实现两个表的同步目前,在本地测试成功. 假设本地的两个数据库a和b,a下有表table1(id, val) b下有表table2(id, val) 假设希望当table1中数据更 ...

随机推荐

MongoDB 学习笔记之查询表达式
查询表达式: db.stu.find().count() db.stu.find({name: 'Sky'}) db.stu.find({age: {$ne: 20}},{name: 1, age: ...
kali切换到西电源
准备研究kali的openvas,打开发现居然没有.apt-get更新一下结果各种报错,换成中科大源.阿里源还是始终报错,气到吐血.最后上西电开源社区换成了西电的kali源,更新速度2m多,一气呵成~ ...
Apache Kylin 概述
1 Kylin是什么今天,随着移动互联网.物联网.AI等技术的快速兴起,数据成为了所有这些技术背后最重要,也是最有价值的"资产".如何从数据中获得有价值的信息?这个问题驱动了相关 ...
网络游戏开发-客户端1（开始Hello world）
打开Egret Launcher ,新建一个EUI项目,起名为 EQiPai 这里需要勾选的是socket网络库,game游戏库.如果要面向海外用户的话,建议勾上Facebook的小游戏sdk. 然后 ...
Visual Studio 生成事件这件小事
在上一篇<Visual Studio 调试技巧>中,介绍了一些VS常用的调试操作,今天,聊一聊VS当中一个不太常见,但有时又有妙用的操作——VS生成事件. 一.什么是VS生成事件简单来说 ...
攻防世界(XCTF)逆向部分write up(一)
晚上做几个简单的ctf逆向睡的更好 logmein elf文件 ida看看main函数伪代码 void __fastcall __noreturn main(__int64 a1, char **a2 ...
Windows 批处理入门
Windows 批处理入门目录本教程概述用到的工具标签简介 1.命令简介 2.符号简介 3.语句结构 4.实例讲解本教程概述本课我们学习windows批处理用到的工具 cmd.ex ...
luogu P3936 Coloring
[返回模拟退火略解] 题目描述在一个 n×mn\times mn×m 的矩阵中,每个点都染了一种颜色(只能是 [1,c][1,c][1,c] 中的一种),求一种方案,使得相邻异色点对数最小. Sol ...
luogu P3878 [TJOI2010]分金币
[返回模拟退火略解] 题目描述今有 nnn 个数 {ai}\{a_i\}{ai},把它们分成两堆{X},{Y}\{X\},\{Y\}{X},{Y},求一种分配使得∣∑i∈Xai−∑i∈Yai∣|\ ...
[Luogu3112] [USACO14DEC]后卫马克Guard Mark
题意翻译 FJ将飞盘抛向身高为H(1 <= H <= 1,000,000,000)的Mark,但是Mark被N(2 <= N <= 20)头牛包围.牛们可以叠成一个牛塔,如果叠 ...

[数据同步]Flume 抽取Mysql历史数据

一.Flume安装目录

1.安装部署目录

2.将所需jar包复制到flume的lib目录下

二.压缩与解压

三.Kafka 创建Topic 消费Topic

四.启动flume服务

五.flume配置文件

[数据同步]Flume 抽取Mysql历史数据的更多相关文章

随机推荐

热门专题